使う・つなげる:国立国会図書館のLODでつながる
国立国会図書館は、保有するメタデータを様々なシステムやアプリケーションで活用することができるように、メタデータをリンクト・オープン・データ(Linked Open Data: LOD)として提供しています。このページでは、国立国会図書館が提供するLODの活用事例や活用可能性について紹介します。各データの内容については「使う・つなげる:国立国会図書館のLinked Open Data (LOD)とは」を、各データの利用方法については「使う・つなげる:国立国会図書館のLODを使う」をご覧ください。
1. 国立国会図書館のLODの活用事例
国立国会図書館のLODは、様々なシステムやアプリケーションで活用されていますが、その代表的なものをご紹介します。なお、NDLサーチのAPIの活用事例については、「国立国会図書館サーチリンク集」をご覧ください。
サービス名 | 作成者 | 概要 |
---|---|---|
covo.js | Li:d tech (長屋俊、林豊、大谷周平) |
ウェブサービスの情報を類語や件名を用いて整理できるようにするサービス(JavaScript用ライブラリ)です。ウェブサービスへの埋め込みや拡張が可能です。「Web NDL Authorities」の典拠データを利用しています。 (参考:Controlled Terms or Free Terms? A JavaScript Library to Utilize Subject Headings and Thesauri on the Web) |
カーリル | 株式会社カーリル | 全国6,000以上の図書館からリアルタイムの貸出状況を検索できるサービスです。 「NDLサーチ」の書誌データを利用しています。 |
GeoNames.jpと国立国会図書館典拠データのリンクセット | インディゴ(株)ラボチーム | GeoNames.jpとWeb NDL Authoritiesに含まれる同一地名のURIをつないだリンクセットです。 (参考:https://github.com/indigo-lab/geonamesjp_vs_ndlna) |
京都が出てくる本のデータ | ししょまろはん | 京都が出てくる小説やマンガ、ライトノベル等の情報のLODです。作品の書誌データに加え、作品に出てくる京都のスポットの名称や緯度・経度情報、京都度(京都が出てくる割合)などが含まれています。「Web NDL Authorities」の典拠データを利用しています。 (参考:ししょまろはんのLOD(Linked Open Data)に関する取組み―Web NDL Authoritiesの利活用事例紹介) |
2. 国立国会図書館のLODの活用可能性
国立国会図書館のLODを他のデータと組み合わせて使うことで、例えば以下のようなサービスが考えられます。
おすすめ情報をリアルタイムに提供するアプリの例
図1は、アプリのイメージです。このアプリは、使う人の好みを推測し、その対象や範囲を選択肢として提供するものです。何か面白いことや興味を惹かれるものがないか探したいときに、インターネット上の膨大な情報から探すための足掛かりを提供します。このアプリを実現するためのデータの一つとして、国立国会図書館のLODを活用することができます。その一例を見てみましょう。
図1 おすすめ情報をリアルタイムに提供するアプリのイメージ
まず、使う人に関連する情報を抽出します。図2の例では、現在地(位置情報)、現在時刻(時間情報)、利用者の日頃の関心情報を対象としています。関心情報には、読書アプリでメモやマーカーを付けた言葉、ブログ記事やソーシャルネットワーキングサービス(SNS)に投稿した言葉やコメントなどの単語が含まれています。
図2 使う人に関連する情報を抽出した例
図3は、使う人の好みにあった情報を選んだ例です。図2で抽出した関心情報を、感情ごとにカテゴリ分けした辞書と照合して、「好き」「お気に入り」などの快感情と組み合わせて使われている単語を選びます。
図3 使う人の好みにあった情報を選んだ例
図4は、使う人の好みの対象や範囲を広げた例です。使う人に多様な情報を提供するため、図3で選んだ単語をDBpedia Japaneseの同じ単語とリンクさせ、関連する人名、作品名、地名、分野名などを抽出します。
図4 使う人の好みの対象や範囲を広げた例
図5と図6は、広げた情報を整理した例です。図5では、図4で抽出した単語をWeb NDL Authoritiesの典拠データとリンクさせることで個人名(著者)と地名のデータに分けています。地名のデータは、総務省の全国地方公共団体コードを用いれば、都道府県や市町村のレベルに分けて整理できます(「京都府」と「精華町」、「山口県」と「山口市」など)。図6は、図5で整理した個人名(著者)のデータをNDLサーチの書誌データとリンクさせることで、著者と作品名のデータを組み合わせています。
図5 広げた情報を整理した例1
図6 広げた情報を整理した例2
図7は、図5と図6で整理したデータを用いて、アプリ上で選択肢とするデータを選んだ例です。図5で整理した地名のデータをレストランの所在地データや食品の産地データとリンクさせ、地名が一致するデータを選んでいます。
図7 選択肢とするデータを選んだ例
図8は、これまで抽出・整理したデータをアプリの選択肢とするために分類した例です。図6で整理した著者と作品名のデータセットは、「読む」に分類しています。また、図7で選んだ食品やレストランのデータは、「食べる」に分類しています。
図8 アプリの選択肢として分類した例
このようにして、図9のアプリ完成例のように、使う人の好みにあったおすすめ情報をリアルタイムに提供するサービスを実現できる可能性があります。
図9 おすすめ情報をリアルタイムに提供するアプリの完成例
ある著者・テーマへの世界各国の注目度を調べられるアプリの例
図10は、アプリのイメージです。本や文献などの資料は、時間をかけて生み出される人類の文化的資産です。また、各国の図書館はそれぞれの関心や目的、必要などに応じて資料を集めています。このアプリは、ある著者の本や、歴史や文学、地域などのさまざまなテーマに対して、世界各国でどのくらい注目されているかを分かりやすく見せるものです。人々の興味や関心のある本を対象として、これらの出版情報をもとに、ある著者・テーマへの世界各国の注目度(出版件数・所蔵件数)を日本語で調べます。このアプリを実現するために国立国会図書館のLODを活用することができます。その一例を見てみましょう。
図10 ある著者・テーマへの世界各国の注目度を調べられるアプリのイメージ
まず、検索に適したキーワードに導くようにします。図11は、有用な情報につながりやすい言葉をおすすめするサジェスト機能の例です。1. 国立国会図書館のLODの活用事例で紹介したcovo.jsによって実現することもできます。また、統制語彙である典拠データを使うことで、表記のゆれによる検索もれを回避できるため、検索の精度を高めることができます。
図11 有用な情報につながりやすい言葉をおすすめする例
図12は、ある著者の本が世界各国のどのような言語で出版されているかを日本語で調べる例です。Web NDL Authoritiesのデータは、世界規模での典拠コントロールを目指すバーチャル国際典拠ファイル(VIAF)とリンクしています。つまり、国立国会図書館が作成した日本語の典拠データ(著者名、タイトル)は、VIAFを通じて、世界各国の書誌データ作成機関が作成した典拠データと相互にリンクしています(1)。このため、例えば「夏目漱石」とVIAFに入力して検索するだけで、「Natsume, Sōseki」(英語)、「סוסק, נטסומה」(ヘブライ語)、「Нацумэ, Сосэки」(ロシア語)のように異なる言語の表記での名称が分かります。さらに、判明した名称から、当該国の図書館の蔵書(書誌データ)を検索すれば、日本語以外の言語で出版された夏目漱石の本もまとめて見つけることができます。
また、著者が筆名で出版した作品の場合でも、Web NDL Authoritiesの典拠データに含まれる別名データを使えば、筆名、本名の別による検索もれをなくすことができます。例えば、本に印刷されている著者名が、「夏目漱石」の本名である「夏目金之助」や「Kin'nosuke Natsume」、「Kinnosuke Natsume」となっている本も検索することができます。
図12 ある著者の本が世界各国のどのような言語で出版されているか調べる例
図13は、ある事柄(件名)をテーマとした本が世界各国にどの言語でどのくらい所蔵されているか調べる例です。Web NDL Authoritiesの件名データは、全てではありませんが、米国議会図書館の件名データとリンクしています。また、米国議会図書館の件名データも、全てではありませんが、ドイツやフランス、イタリアで作成された件名データとリンクしています。このリンクを用いると、例えば「地震」と入力して検索するだけで、「Earthquakes」(英語)、「Erdbeben」(ドイツ語)、「Séismes」(フランス語)、「Seismizität」(ドイツ語)、「Terremoti」(イタリア語)など、各国の「地震」に当たる語を同定する仕組みを作ることができます。同定した語を用いて各国の図書館の書誌データを検索すれば、地震に関する本や論文の所蔵件数を調べることができます。このように、異なる言語間でデータ同士のリンクが進むと、翻訳しなくても検索語が各言語間で同定されるため、網羅的な検索が実現します。
図13 ある事柄をテーマとした本が世界各国でどのくらい所蔵されているか調べる例
図14は、図13の結果を分かりやすく見せる例です。図13で調べた世界各国にある「地震」の本の出版国データを地図データにリンクさせ、所蔵件数が多い国を濃い色で、少ない国を薄い色で段階的に示すことで、「地震」への各国の注目度を表現しています。「Earthquakes」、「Erdbeben」、「Séismes」、「Seismizität」、「Terremoti」など、異なる言語や同義語も含めた結果を表示することができます。
図12についても同様に、出版国データを地図データにリンクさせることで、ある著者の本が、各国でどのくらい出版されているかを、出版件数から注目度として表現することができます。
図14 「地震」に関する本が世界各国でどのくらい所蔵されているかの表示例
図15は、各国の図書館の書誌データに含まれる出版年の情報を用いた見せ方の例です。「夏目漱石」の書いた本について、世界各国での合計出版件数を年代ごとに地図にリンクさせています。地図の下にある年代コントロールバーで表示したい年代を指定すると、年代の指定にしたがって、各国の出版件数を国旗の隣に棒グラフで表示し、出版件数の多寡を地図上の色で表示します。
図15 「夏目漱石」の書いた本が世界各国でどのくらい出版されているかを年代ごとに表示する例
このようにして、図16のアプリ完成例のように、日本語を入力するだけで、ある著者の本やあるテーマの本について、世界各国でどのくらい注目されているかを示すサービスを実現できる可能性があります。
図16 ある著者・テーマへの世界各国の注目度を調べられるアプリの完成例
日本人や日本の文化や歴史、地域に関する本が、世界にどのくらいあるのかが分かりやすくなれば、日本からもっと発信したほうがよい事柄やテーマ、分野があることに気づくでしょう。一人で全てのテーマについて発信することは難しくても、自分にとって大切なテーマや得意な分野について、一人一人が発信していけば、やがて大きな情報発信となります。生み出すために時間のかかる文化的資産(本、文献)を扱うアプリこそ、書誌データや典拠データのような構造化された情報を使用して作成するのが効果的です。LODを活用したこのようなアプリが実現されれば、日本からの情報発信に大きく貢献できるのではないでしょうか。
3. 参考文献
- (1)NDL書誌情報ニュースレター「典拠の国際流通―バーチャル国際典拠ファイル(VIAF)への参加」連載(1)2012年4号(通号23号)、連載(2)2013年1号(通号24号)、連載(3)2013年2号(通号25号)、「コラム:書誌データ利活用(3) ―Web NDL Authorities(国立国会図書館典拠データ検索・提供サービス)」2014年1号(通号28号)
国立国会図書館のLinked Open Dataに関する問い合わせ先
国立国会図書館 電子情報部
電子情報流通課 標準化推進係
メールアドレス:standardization