L-Crowd: インターネットでできる図書館ボランティア
(図書館×クラウドソーシング)

安藤広重 「伊勢参宮 宮川の渡し」に描かれた"Crowd(沢山の人々)" (Wikimedia Commonsより)

安藤広重 「伊勢参宮 宮川の渡し」に描かれた"Crowd(沢山の人々)" (Wikimedia Commonsより)

In Support of:
国立国会図書館

更新履歴

L-Crowdとは

L-Crowdの目的は,人間の力が必要な図書館領域の問題に対してマイクロボランティアとクラウドソーシングによる解決を試みることです.例えば,様々なカタログの書誌レコードを機械同定した際の誤同定を見つける問題は,人の力抜きでは解決出来ません. マイクロボランティアとは,極めて短時間でできるボランティアの事であり,クラウドソーシングとは,インターネット等を通じて多くの人々に仕事を委託する事です.

L-Crowdでは,ボランティアの方々に,図書館領域におけるそのような問題を解決するために設計されたマイクロタスク(短時間でできる作業)をお願いしています. マイクロタスクを行うにはほんの短時間しか必要とされません.あなたの名前は貢献者一覧に掲載されます. 世界中のいかなる国からの貢献を歓迎します.いくつかのマイクロタスクは日本語の能力が必要ですが,英語や他の言語で可能なマイクロタスクもあります.

L-CrowdはCrowd4Uオープンクラウドソーシングプラットフォームを利用しており,積極的に最新のクラウドソーシング技術を採用しています.たとえば,一部のタスクは床にマイクロタスクを投影する"Task-on-the-Floor" (TOF)システムを通じて配布され,人々は床に投影されたタスクの上を歩くだけでそのタスクを実行することができます.TOFシステムは複数の大学キャンパスに設置されています.

プロジェクトと作業内容

プロジェクト3.
都道府県総合目録の将来像に関する研究プロジェクト

Twitterハッシュタグ: #kunicat

「京都府域図書館総合目録ネットワークシステム」の充実を図るための産官学連携プロジェクトです.複数の図書館の所蔵情報をまとめた総合目録では,検索結果に同一の書籍が複数表示されないよう,データの同定を行う必要があります.しかし,書籍を特定するための番号であるISBNは運用の問題により重複して利用されていることがあり,機械的な判定では結果として誤同定されてしまうことがあります.また,ISBNがない書籍については機械的な同定を行うことが困難です.

本プロジェクトでは,京都府域の図書館のデータに対し,同定判定をマイクロタスクにより行うことで同一書籍を1つのデータとして表示し,システムを使いやすくすることを目指しています.

なおこのタスクでは,ある書誌の組合せに対し,複数人が判定をするという仕組みになっています.最終的な同定はその結果の多数決により行われます.

より詳しい説明:

タスク

書籍の同定 (日本語のみ対応)

Perform a task

貢献者(募集中)

貢献者としてこのプロジェクトに参加するには

メディア掲載

本プロジェクトへの問合せ先

都道府県総合目録の将来像に関する研究プロジェクトへのお問合せは,下記までお願いいたします.
future-unicat-prj-ml [] klis.tsukuba.ac.jp (please replace [] with @)

プロジェクト2.
国立国会図書館デジタルコレクションを便利にする
(翻デジ@日本デジタル・ヒューマニティーズ学会 x マイクロタスク)

国立国会図書館デジタルコレクション(以下,国デコ)を色々便利に使えるようにするためプロジェクトです.マイクロタスクが利用可能な問題を切り出し,順次実現していきます.現在は次の2点を当面の目的としています.

  1. 図書全体への関心を喚起するために絵や写真,図表を抜き出す
  2. 画像でしか提供されていない日本語資料の文字起こし(翻刻)を行うことで,多少なりともグーグルやBaidu,Bing等の全文検索エンジンから検索できるようにし,検索性を高める

タスク1

テキストでない部分の発見(多言語対応)

Perform a task

タスク2

正しい文字を選ぶ (日本語のみ対応)(入れ替え準備中)

ボランティアの成果

国デコ Image Wall

貢献者(募集中)

貢献者としてこのプロジェクトに参加するには

プロジェクト1.
NDL書誌レコードの誤同定を発見する (終了)

国立国会図書館の書誌情報を利用して同じISBNを持った全く異なる本を検出し,ISBN重複の実態を調査することにより、書誌情報のクリーニングを支援します.機械的にある程度怪しい組は見つかりますが,重版などの必ずしも異なる本ではない場合や,タイトルの書式が異なっている場合など,最終的な判断にはどうしても人間の判断が必要となります.

このプロジェクトの結果をリストとして公開し,図書館などのシステムでこのリストを使うことで書誌の誤同定問題を回避することができるようになります.また,今までは不明だったISBNの重複の規模等について知見が得られるという学術的な価値もあります.

貢献者(募集終了)

L-Crowdの歴史

L-Crowdは,2012年8月に図書館情報学とコンピュータサイエンスの研究者によって開始された,日本で最初の大規模図書館クラウドソーシングの試みです.同年10月に,NDLによる機械書誌誤同定の結果に置ける誤同定判定のタスクの提供を開始しました.2013年3月には10以上の日本の大学等からのボランティアが参加をしています.2015年には,NDL近代デジタルライブラリーの非テキストコンテンツを識別するためのマイクロタスクと,OCRの校正により著作権保護期間が終了した国立国会図書館デジタルコレクションの一部を翻刻するマイクロタスクのの提供を開始しました.2016年には,都道府県総合目録の将来像に関する研究プロジェクトを開始しました.

チーム

Crowd4Uのアカウントを作り,ログインした状態でタスクを行うことで貢献者としてアカウント名が掲載されます.
アカウント名は実名,ハンドル名のどちらでも構いません.

協力組織・個人を募集しております

L-Crowdへの参加にご興味のある組織・個人を募集しております.下記までご連絡下さい.

lcrowd [] crowd4u.org (please replace [] with @)