• 利用案内
  • サービス概要
  • 東京本館
  • 関西館
  • 国際子ども図書館
  • アクセス
  • 複写サービス
  • 登録利用者制度
  • オンラインサービス
  • オンラインサービス一覧
  • 国会関連情報
  • 蔵書検索
  • 電子図書館
  • 調べ方案内
  • 電子展示会

Linked Open Data―欧米国立図書館の動向と国立国会図書館の取組み

NDL書誌情報ニュースレター

NDL書誌情報ニュースレター2015年2号(通号33号)

【はじめに】

最近、図書館関連のニュースで “Linked Open Data(LOD)”という言葉をよく目にします。そうしたニュースでは、欧米の図書館は自館の書誌データや各種コード類をLOD化するなど、LODに積極的に取り組んでいる様子がうかがえます。国立国会図書館(NDL)でも、LODの提供と利活用の促進を行っています。ここでは、LODについて、先駆的な欧米国立図書館の動向とNDLの取組みをご紹介します。

【LODとは】

LODとは、“Open Data”で提供されている“Linked Data”のことです。

Open Dataとは、単に公開された情報というのではなく、「コンピュータ処理に適したデータ形式」で「二次利用(再利用・再配布)が可能なルールで公開」されたデータを指します。近年進められている「オープンガバメント」(行政活動の透明性を高め、行政への市民参加を促進する動き)の一環として、公共機関が保有する情報をOpen Dataとして公開する動きが、欧米を中心に広がっています。日本でも、2012年7月に策定された「電子行政オープンデータ戦略」に基づき、政府が保有するデータのOpen Data化が進められています[1]。Open Dataは、行政の透明性を高めるだけでなく、再利用による新たな価値の創出を期待して公開されるものです。その利活用を進めるさまざまな取組みとして、ディスカッションを通じてアイデアを練る「アイデアソン」、短期間でアプリケーションソフトを開発する「ハッカソン」などのワークショップや、Open Dataを使ったアプリケーションソフトの開発コンテストが、国内各地で開催されています。

一方、Linked Dataとは、URI(Uniform Resource Identifier)が付与され、他のデータとリンク付けられた形でウェブ公開されたデータおよびそうしたデータを実現させる仕組みを指します。RDF(Resource Description Framework)をはじめとするセマンティックウェブの標準技術(データの意味を記述したタグとセットにして伝達する技術)に基づいて作成され、HTML形式等のデータと比べて他のデータとつなげやすく、幅広い分野のシステムで活用しやすいという利点があります[2]。特定分野の規格やデータ形式に依存しないLinked Dataは、分野を超えた再利用性が高いため、Open Dataの望ましいデータ形式とされています[3]。Linked Dataを活用した事例に、オランダ王立図書館が開発したスマートフォン用アプリ「Hier was het nieuws (Here was the news)」があります。これは、Linked Data化した自館の歴史的な新聞記事データを既存の地図データと結び付けることで、アプリの利用者が今いる場所で過去にどんな事件があったのか、関連する記事を検索できるようにしています[4]

【欧米国立図書館の動向】

近年、自館が持つ各種データをLODで提供する図書館が増えています。特に、欧米国立図書館では、LODという言葉を冠した事業やサービスを行うところが目立ちます[5]。以下でご紹介するような事例を見ると、欧州(EU各国)と米国では、LODに取り組む背景(理由)において、相違があることに気づきます[6]

欧州(EU各国)の例としては、まず、英国図書館の“Linked Open BNB”があります。これは英国全国書誌約280万レコードをLODで提供するサービスです[7]。また、フランス国立図書館は、専用のOpen Dataポータルサイト“data.bnf.fr”を設置し、蔵書目録の書誌データと典拠データ、電子図書館GallicaのメタデータをLODで公開しています[8]。ほかにもドイツやスペインの国立図書館では、既存の目録データをLODに変換し提供しています。こうした国立図書館の取組みの背景には、EUの欧州委員会が進める公的機関情報の公開・再利用を促進する施策があると考えられます。EUのOpen Data施策は、「公的機関情報の再利用に関するEU指令(2003年)」から検討が始まり、EU各国においては2009年頃から急速に、図書館を含む公共機関が保有するデータのOpen Data化が進展しました。たとえば、前述の “data.bnf.fr”は、開発プロジェクトが2009年から開始されており(提供開始は2011年)、またサイト上には、このポータルサイトが上記の施策の一環である旨の説明が見られます。

一方、米国では、米国議会図書館(LC)が先駆的に活動していますが、その中心は、欧州のような既存の目録データのLOD変換よりも、各種コード類と典拠データのLODでの提供です。LCでは、米国議会図書館件名標目表、LC名称典拠ファイル、米国議会図書館分類表等の約40種類を“LC Linked Data Service”で提供しています[9]。この取組みの背景の一つには、LC主導で開発が進められている“BIBFRAME”があると考えられます。BIBFRAMEは、現在の国際標準であるMARC21に代わるデータフォーマットの一種ですが、そのデータモデルの基盤にLinked Dataを採用しています[10]。各種コード類や典拠データのLODは、目録データをLinked Open データの形式で作成する場面で、語彙(ボキャブラリー)として使用できます。つまり、LCの取組みは、目録データの中で使われている各種コード類や典拠データをBIBFRAMEで適切に扱うための語彙の開発(URI化)を意図しているともいえます。実際、「2012年に公開されたBIBFRAMEの仕様草案がLCのLODの使用を想定したものになっている」と指摘した文献[11]もあります。

【NDLの取組み】

現在、NDLでは、オンライン・サービスで次のデータをLODで提供しています。

  1. 書誌データ(国立国会図書館サーチ
  2. 典拠データ(国立国会図書館典拠データ検索・提供サービス:Web NDL Authorities
  3. 震災関連データ(国立国会図書館東日本大震災アーカイブ

どのデータも、外部提供インタフェース(API)を提供し、機械アクセスによるダウンロードが可能です。2. 典拠データについては、APIだけでなく、「国立国会図書館件名標目表(NDLSH)」の収録範囲の一括ダウンロード用ファイルも提供しています。利用条件はデータにより異なりますので、詳しくはホームページ「使う・つなげる:国立国会図書館のLODを使う」をご覧ください。

NDLが提供するLODやその他の形式のデータの利活用促進を目指して、2015年1月、「オープンデータセット」のページを公開しました。このページでは、諸手続なしで自由に利用できるデータを提供しており、国立国会図書館デジタルコレクションの書誌情報(図書・雑誌・古典籍の原資料のタイトル、著者名、出版者等の基本的な書誌項目)のデータセットがxlsxまたはtsvの形式でダウンロードできます(Linked Data形式ではありません)。また、同年4月から、図書館をはじめ博物館、美術館、文書館などの類縁機関に付与されるIDである「図書館及び関連組織のための国際標準識別子(ISIL)[12]LOD化し、試行提供しています。さらに、2015年4月から2016年3月まで、日本十進分類法のLinked Data化に関する研究を日本図書館協会と共同で実施するなど、語彙の開発にも取り組んでいます。

また、NDLが提供するデータの認知度を高め、幅広い分野での利活用促進のため、オープンなデータ作りとデータ活用に関する取組みを表彰するコンテスト「Linked Open Dataチャレンジ」に、2013年からデータ提供パートナーとして参加しています。さらに、Open Dataのイベントも実施しており、2015年2月には、「国立国会図書館のウェブページを使い尽くそうアイデアソン~NDLオープンデータ・ワークショップ~」と題して、NDLが提供するデータの利活用に関するアイデアを探るアイデアソンを開催しました。

【おわりに】

LODは、セマンティックウェブという未来のウェブにつながる潮流です。図書館によるLODの取組みは、未来のウェブ世界において、図書館が保有するデータを分野を超えて利活用できるようにすることであり、図書館や図書館サービスの有用性をウェブ世界で広く認識してもらうきっかけになると考えられます。NDLでは、今後も、欧米国立図書館の動向も参考にしながら、LODの提供と利活用の促進に取り組んでいきたいと考えています。

橋詰 秋子
(はしづめ あきこ 電子情報部 電子情報流通課)

[1] 総務省. “オープンデータ戦略の推進”. http://www.soumu.go.jp/menu_seisaku/ictseisaku/ictriyou/opendata/, (参照2015-04-28).

[2] URI、RDFの詳細は、本誌2015年1号のコラムをご覧ください。
・柴田洋子. コラム:書誌データ利活用(6)―Web NDL Authorities解読講座 その1―ウェブでつながる典拠データ.
http://www.ndl.go.jp/jp/data/bib_newsletter/2015_1/article_04.html, (参照 2015-06-24).
なお、本稿において、「URI」はURIを拡張した国際化識別子「IRI(Internationalized Resource Identifier)」とほぼ同義に使っています。

[3] 5つ星オープンデータ. http://5stardata.info/ja/, (参照2015-04-28).

[4] Koninklijke Bibliotheek. “Hier was het nieuws”. http://www.hierwashetnieuws.nl, (参照 2015-05-26).

[5] LODとして提供されているデータには、1.書誌データ、2.典拠データ、3.各種コード類(分類表等)、4.デジタル化された本文テキストがあります。本稿では、本誌の対象(書誌情報)に関係が深いデータ(1、2、3)の事例を取り上げて紹介します。

[6] 取組みの背景については、以下の文献に詳しい記載があります。
・橋詰秋子. なぜ図書館はLinked Dataに取り組むのか―欧米の事例から. 情報管理. 2015, Vol.58, No.2, p.127-134, http://doi.org/10.1241/johokanri.58.127, (参照 2015-06-04).

[7] British Library. “Linked Open BNB”. http://www.bl.uk/bibliographic/datafree.html#lod, (参照2015-04-28).

[8] Bibliothèque nationale de France. data.bnf.fr. http://data.bnf.fr, (参照2015-04-28).

[9] Library of Congress. “LC Linked Data Service”. http://id.loc.gov, (参照2015-04-28).

[10] RDAとBIBFRAMEの詳細は、以下の文献をご覧ください。
・柴田洋子. ウェブで広がる図書館のメタデータを目指して ―RDAとBIBFRAME. カレントアウェアネス. 2014, (322), p. 17-21, http://current.ndl.go.jp/ca1837, (参照2015-04-28).

[11] Mitchel, E.T. Three Case Studies in Linked Open Data. Library Technology Reports. Vol.49, No.5, 2013, p.26.
なお、BIBFRAMEの仕様書草案は、2014年4月に提示されたものが現時点(2015年5月)の最新版です。

[12] ISILは、ISO 15511で国際標準規格として定められており、日本では、国立国会図書館が国内登録機関となり、2011年から国内のISIL付与および管理を行っています。


このページの先頭へ

NDL書誌情報ニュースレター(年4回刊)

ISSN 1882-0468/ISSN-L 1882-0468
2015年2号(通号33号) 2015年6月26日発行

編集・発行 国立国会図書館収集書誌部

〒100-8924 東京都千代田区永田町1-10-1

メールアドレス:bib-newsアットマークエヌディーエルピリオドジーオーピリオドジェーピー(ニュースレター編集担当)