筑波大学附属図書館に設置されたTOFシステム
L-Crowdとは
L-Crowdの目的は,人間の力が必要な図書館領域の問題に対してマイクロボランティアとクラウドソーシングによる解決を試みることです.例えば,様々なカタログの書誌レコードを機械同定した際の誤同定を見つける問題は,人の力抜きでは解決出来ません. マイクロボランティアとは,極めて短時間でできるボランティアの事であり,クラウドソーシングとは,インターネット等を通じて多くの人々に仕事を委託する事です.
L-Crowdでは,ボランティアの方々に,図書館領域におけるそのような問題を解決するために設計されたマイクロタスク(短時間でできる作業)をお願いしています. マイクロタスクを行うにはほんの短時間しか必要とされません.あなたの名前は貢献者一覧に掲載されます. 世界中のいかなる国からの貢献を歓迎します.いくつかのマイクロタスクは日本語の能力が必要ですが,英語や他の言語で可能なマイクロタスクもあります.
L-CrowdはCrowd4Uオープンクラウドソーシングプラットフォームを利用しており,積極的に最新のクラウドソーシング技術を採用しています.たとえば,一部のタスクは床にマイクロタスクを投影する"Task-on-the-Floor" (TOF)システムを通じて配布され,人々は床に投影されたタスクの上を歩くだけでそのタスクを実行することができます.TOFシステムは複数の大学キャンパスに設置されています.
プロジェクトと作業内容
プロジェクト3.
都道府県総合目録の将来像に関する研究プロジェクト
Twitterハッシュタグ: #kunicat
「京都府域図書館総合目録ネットワークシステム」の充実を図るための産官学連携プロジェクトです.複数の図書館の所蔵情報をまとめた総合目録では,検索結果に同一の書籍が複数表示されないよう,データの同定を行う必要があります.しかし,書籍を特定するための番号であるISBNは運用の問題により重複して利用されていることがあり,機械的な判定では結果として誤同定されてしまうことがあります.また,ISBNがない書籍については機械的な同定を行うことが困難です.
本プロジェクトでは,京都府域の図書館のデータに対し,同定判定をマイクロタスクにより行うことで同一書籍を1つのデータとして表示し,システムを使いやすくすることを目指しています.
なおこのタスクでは,ある書誌の組合せに対し,複数人が判定をするという仕組みになっています.最終的な同定はその結果の多数決により行われます.
書籍の同定 (日本語のみ対応)
Perform a task
貢献者(募集中)
貢献者としてこのプロジェクトに参加するには
フォーラム「書誌の未来:クラウドソーシングで繋ぐ・溶かす」
2017年11月8日に,第19回図書館総合展内フォーラム
「書誌の未来:クラウドソーシングで繋ぐ・溶かす」を開催しました.
メディア掲載
-
L-Crowdによる日本の書誌誤同定/書誌割れ問題の解決に向けて. カレントアウェアネス-E. No.324, 2017年4月28日
-
「都道府県総合目録の将来像に関する研究プロジェクト」ボランティア参加のお願い. 図書館協力ニュース. No.241, 2017年3月7日
-
「都道府県総合目録の将来像に関する研究プロジェクト」ボランティア参加のお願い
. 図書館へのお知らせ, 2017年3月3日
-
羅針盤「書誌情報をつなぐために -『都道府県総合目録の将来像に関する研究プロジェクト』の始動」
. ACADEMIC RESOURCE GUIDE 630号, 2017年2月27日
-
蔵書検索、システム充実へ ネット上のボランティア募集 /京都
. 毎日新聞京都版, 2017年2月21日
-
クラウドソーシングで蔵書検索の精度向上へ 京都府立図書館
. 京都新聞, 2017年2月17日
-
蔵書検索 精度アップ クラウドソーシング導入. 京都新聞 (夕刊), 2017年2月16日
-
京都府立図書館、「京都府図書館総合目録ネットワークシステムの充実を図る産官学連携プロジェクト」のクラウドソーシングを開始
. カレントアウェアネス-R, 2017年2月16日
-
蔵書検索の精度アップへ 京都府立図書館、大学や企業と連携
. 産経新聞京都版, 2017年1月11日
-
ISBNコードの重複、書誌割れ……クラウドソーシングで同定して横断検索システムを改善、京都府立図書館やカーリルらが連携プロジェクト
. INTERNET Watch, 2016年12月1日
ニュースレター
本プロジェクトに関するイベントが開催されるときや,タスクのアップデートが行われたときなどに配信を行います.是非ご登録ください.
本プロジェクトへの問合せ先
都道府県総合目録の将来像に関する研究プロジェクトへのお問合せは,下記までお願いいたします.
future-unicat-prj-ml [] klis.tsukuba.ac.jp (please replace [] with @)
プロジェクト2.
国立国会図書館デジタルコレクションを便利にする
(翻デジ@日本デジタル・ヒューマニティーズ学会 x マイクロタスク)
国立国会図書館デジタルコレクション(以下,国デコ)を色々便利に使えるようにするためプロジェクトです.マイクロタスクが利用可能な問題を切り出し,順次実現していきます.現在は次の2点を当面の目的としています.
- 図書全体への関心を喚起するために絵や写真,図表を抜き出す
- 画像でしか提供されていない日本語資料の文字起こし(翻刻)を行うことで,多少なりともグーグルやBaidu,Bing等の全文検索エンジンから検索できるようにし,検索性を高める
タスク1
テキストでない部分の発見(多言語対応)
Perform a task
タスク2
正しい文字を選ぶ (日本語のみ対応)(入れ替え準備中)
ボランティアの成果
国デコ Image Wall
貢献者(募集中)
貢献者としてこのプロジェクトに参加するには
プロジェクト1.
NDL書誌レコードの誤同定を発見する (終了)
国立国会図書館の書誌情報を利用して同じISBNを持った全く異なる本を検出し,ISBN重複の実態を調査することにより、書誌情報のクリーニングを支援します.機械的にある程度怪しい組は見つかりますが,重版などの必ずしも異なる本ではない場合や,タイトルの書式が異なっている場合など,最終的な判断にはどうしても人間の判断が必要となります.
このプロジェクトの結果をリストとして公開し,図書館などのシステムでこのリストを使うことで書誌の誤同定問題を回避することができるようになります.また,今までは不明だったISBNの重複の規模等について知見が得られるという学術的な価値もあります.
貢献者(募集終了)
L-Crowdの歴史
L-Crowdは,2012年8月に図書館情報学とコンピュータサイエンスの研究者によって開始された,日本で最初の大規模図書館クラウドソーシングの試みです.同年10月に,NDLによる機械書誌誤同定の結果に置ける誤同定判定のタスクの提供を開始しました.2013年3月には10以上の日本の大学等からのボランティアが参加をしています.2015年には,NDL近代デジタルライブラリーの非テキストコンテンツを識別するためのマイクロタスクと,OCRの校正により著作権保護期間が終了した国立国会図書館デジタルコレクションの一部を翻刻するマイクロタスクの提供を開始しました.2016年には,都道府県総合目録の将来像に関する研究プロジェクトを開始しました.