使う・つなげる:国立国会図書館のLinked Open Data (LOD) とは
国立国会図書館は、保有するメタデータを様々なシステムやアプリケーションで活用することができるように、メタデータをリンクト・オープン・データ(Linked Open Data: LOD)として提供しています。このページでは、国立国会図書館が提供するLODについて紹介します。各データの利用方法については「使う・つなげる:国立国会図書館のLODを使う」を、データの活用事例や活用可能性については「使う・つなげる:国立国会図書館のLODでつながる」をご覧ください。アスタリスク(*)を付記した用語は、「【参考】メタデータ関連用語集」にリンクしています(初出のみ)。
1. LODとは
LODとは、ウェブ上でデータを公開し共有するための方法で、さまざまなデータ同士を結び付けて(Linked Data)、誰でも自由に利用できるよう公開されている(オープンライセンス)ものです。ウェブの創始者であるティム・バーナーズ=リーによると、Linked Dataには次のような4つの原則があります(1)。
- 事物の名前としてURI*を用いること
- これらの名前を参照できるように、HTTP URIを用いること
- URIを参照したときに、RDF*やSPARQL*のような標準技術を用いて、有用な情報を提供できるようにすること
- さらに多くの事物を発見できるように、他のURIへのリンクを含むこと
これらの原則を満たすことで、資料や情報のタイトルや著者、地名や概念など、あらゆる事物について、関連するものを相互にリンクでつなぎ、コンピュータがその関係を理解できるようになります。
近年、国内外でLinked Dataを公開する動きがあり、2013年6月18日のG8首脳会議において、政府のデータをまとめて機械判読できるようにすることやオープンなライセンスで公開することなどを原則とする「オープンデータ憲章」に、各国首脳が合意しました(2)。
こうした動きに先駆けて、諸外国の国立図書館ではLODの提供が積極的に行われています(3) (4) (5)。また、LODチャレンジなど国内外のイベントでも、LODの利活用が活発に推進されています(6)。
2. 国立国会図書館のLOD
1. の4原則を満たし、かつ誰でも利用できるデータとして、国立国会図書館では、以下のLODを提供しています。
書誌データ(国立国会図書館サーチ:NDLサーチ)
データソース
- 「データプロバイダ一覧と外部提供インタフェース対応表」に掲載しているさまざまなデータベース(国立国会図書館オンライン、NDL雑誌記事索引、国立国会図書館デジタルコレクション、全国の公共図書館や大学図書館が提供するデジタルアーカイブ、青空文庫など)
データの内容
- 本、雑誌、記事論文、新聞、デジタルコンテンツ(国立国会図書館がデジタル化した資料、音声、ウェブページなど)などのメタデータ(タイトル、著者、出版者、件名(テーマ、地名)、分類(NDC、NDLC)、ISBN、ISSN、全国書誌番号、国立国会図書館の請求記号、都道府県立図書館などの所蔵館情報など)
- 国立国会図書館が作成・提供する書誌データに付与されている識別子であるNDLBibID(国立国会図書館書誌ID)、デジタル化資料やウェブアーカイブ資料等に付与されている識別であるNDLJP(国立国会図書館が付与する永続的識別子)など
- デジタル化資料が見られるページのURL(http://dl.ndl.go.jp/...)
- 著作権関係の情報
- ※デジタル化資料のdcterms:accessRightsタグの値は、「S02P99U99」(インターネットで閲覧可能)、「S03P99U99」(印刷可能)、「S03P01U99」(印刷不可能)などがあります。
- ※dcterms:rightsタグの値は、「インターネット公開(保護期間満了)」、「インターネット公開(裁定)」、「インターネット公開(許諾)」などがあります。
データの記述に用いる語彙
データの記述には、「国立国会図書館ダブリンコアメタデータ記述(DC-NDL)」の語彙を用いています。詳しくは「メタデータ」の「1. 提供するメタデータの形式」をご覧ください。
- ※データのダウンロードと利用条件については、「使う・つなげる:国立国会図書館のLODを使う:書誌データ(国立国会図書館サーチ)」をご覧ください。
典拠データ(国立国会図書館典拠データ検索・提供サービス:Web NDL Authorities)
データの内容
- 複数の名前(筆名、旧姓など)をもつ著者(例:「夏目漱石」、「夏目金之助」)や、同義語(例:「天気」、「気象現象」、「Weather」)などを同定するための情報
- 同名異人(例:「鈴木, 一郎, 1881-1961」と「鈴木, 一郎, 1900-1985」)を識別するための情報
- あるテーマを表す語(件名)の同義語や、上位語・下位語・関連語などの情報(例:「震災」の同義語「地震災害」、「Earthquakes」、上位語「自然災害」、下位語「地震火災」、関連語「地震」、「地震保険」、「震災予防」)
- 家族名(例:「徳川 (家)」、「山ノ内 (家)」)、団体名(例:「国立天文台」、「日本学術会議」)
- 地名(例:「東京都」、「東京都千代田区」、「東京市」、「東京市赤坂区」)情報など
- LCSH(米国議会図書館件名標目表)、VIAF(バーチャル国際典拠ファイル)のURI(リンクデータ)
データの記述に用いる語彙
典拠データの記述には、SKOS-XL、SKOS、DC-NDL、RDFS、Dublin Core、FOAF、OWLなどの語彙を用いています。詳しくは「RDFモデルについて 2. 記述に使用する語彙」をご覧ください。
- ※データのダウンロードと利用条件については、「使う・つなげる:国立国会図書館のLODを使う:典拠データ(Web NDL Authorities)」をご覧ください。
震災関連データ(国立国会図書館東日本大震災アーカイブ(愛称:ひなぎく))
データソース
- 「外部提供インタフェース(API) メタデータ取得可能なリポジトリ一覧」に掲載している東日本大震災に関する記録を作成または収集するさまざまな提供元リポジトリ(国土地理院、3がつ11にちをわすれないためにセンター(せんだいメディアテーク)、福島県新地町被災写真(新地町図書館)、ICT地域の絆保存プロジェクト「東日本大震災を語り継ぐ」(東松島市図書館)、被災地斜め航空写真(朝日航洋)、国立国会図書館インターネット資料収集保存事業 (WARP)など)
データの内容
- 写真(被災地の航空写真、被害の様子を撮影したものなど)、音声・動画(被災地の支援や福島第一原発事故に関するもの、被災者の証言など)のメタデータ(タイトル、作成者、公開者、作成日(撮影日など)、撮影場所、要約・抄録など)
- ※写真や動画の撮影場所については、緯度情報がma:locationLatitudeタグに、経度情報がma:locationLongitudeタグに、撮影した日付の情報がdcterms:createdタグ(ndlkn:Resourceクラス中)にあります。
- 過去のウェブページ(地方自治体など)のメタデータ(タイトル、公開者、保存日など)
- 図書、雑誌、新聞、一枚もの(チラシなど)のメタデータ(タイトル、作成者、出版者・公開者など)
- デジタルコンテンツ(文書、写真、音声・動画)が見られるページのURLとサムネイルURL、過去のウェブページなどが見られるページのURL
データの記述に用いる語彙
データの記述には、「国立国会図書館東日本大震災アーカイブメタデータスキーマ」の語彙を用いています。詳しくは「メタデータ」をご覧ください。
- ※データのダウンロードと利用条件については、「使う・つなげる:国立国会図書館のLODを使う:震災関連データ(国立国会図書館東日本大震災アーカイブ)」をご覧ください。
3. 国立国会図書館のLOD推進の取組
国立国会図書館では、LODの提供と利活用の更なる推進を目指して、様々な取組を行っています。
日本十進分類法のLinked Data形式化に係る日本図書館協会との共同研究
日本の標準分類法である「日本十進分類法(以下「NDC」といいます。)」をLinked Data化するために、国立国会図書館と日本図書館協会(分類委員会)で共同研究を行いました。共同研究の実施に当たって、国立国会図書館と日本図書館協会との間で、2015年2月19日に、「日本十進分類法のLinked Data形式化に係る共同研究に関する協力の覚書」を取り交わしました。
共同研究の作業は、2016年7月の成果報告会をもって終了しました。
- 期間:2015年4月から2016年3月まで
- 対象:NDC新訂8版及び新訂9版
- 内容:日本図書館協会から研究対象として提供されるNDCのデジタルデータ(MRDF)を基に、国立国会図書館と日本図書館協会は、Linked Data形式化に係る諸課題に関する調査研究を協力して行い、NDCのLinked Data形式のデジタルデータ(NDC-LD)を作成します。なお、Linked Data形式のデジタルデータの維持管理方法及びオープンデータ化の方法については、研究成果が帰属する日本図書館協会の検討に資するため、この研究の中で調査を行います。
共同研究の成果について、詳しくは、「日本十進分類法のLinked Data形式化に係る共同研究」をご覧ください。
なお、この共同研究の成果に基づき、2016年3月から、日本図書館協会分類委員会が委嘱した専門委員が、NDC-LDの技術的な調査・検討、提供に向けた調査・検討、その他NDCの電子的利用に関する調査・検討を行っています。詳しくは、分類委員会からのお知らせ(2016年3月1日)をご覧ください。
図書館及び関連組織のための国際標準識別子(ISIL)の試行版LOD
図書館及び関連組織のための国際標準識別子(ISIL)は、図書館をはじめ博物館、美術館、文書館などの類縁機関に付与されている国際的な識別子です。国立国会図書館ではLinked Open Data(LOD)の利活用を推進しており、その一つとして、ISILの試行版LODを以下のページで公開しています。
オープンデータイベントへの参加・協力
以下のようなオープンデータ関連イベントに参加しています。
イベントの実施
- NDLデジタルライブラリーカフェ
2016年11月24日(木)と25日(金)に、デジタルライブラリーにかかわる研究や最新動向に関する講演会を国立国会図書館東京本館で開催しました。当日の様子や写真等を、イベントのページでご覧いただけます。 - NDLデータ利活用ワークショップ~ウェブ・アーカイブの自治体サイトを可視化しよう~
2016年7月30日(土)、「国立国会図書館インターネット資料収集保存事業(WARP)」のデータを活用してデータ可視化(データ・ビジュアライゼーション)を行うワークショップを国立国会図書館東京本館で開催しました。ワークショップの内容や作業の様子、成果物や写真等をご覧いただけます。 - 国立国会図書館のデータを使い尽くそうハッカソン
2015年11月28日(土)と29日(日)に、国立国会図書館が提供するデータを活用してツールやアプリなどを作るワークショップ(ハッカソン)を国立国会図書館東京本館で開催しました。当日の様子や開発者のインタビュー、成果物や写真等をご覧いただけます。 - 国立国会図書館のウェブページを使い尽くそうアイデアソン~NDLオープンデータ・ワークショップ~
2015年2月21日(土)、インターナショナルオープンデータデイに合せて、国立国会図書館のデータの利活用に関するアイデアを探るワークショップ(アイデアソン)を国立国会図書館東京本館で開催しました。当日の様子、成果物や写真等をご覧いただけます。
4. 参考文献
- (1)Berners-Lee, Tim. "Linked Data". Design Issues. 2009/06/18
- (2)「G8サミットで合意された「オープンデータ憲章」」『カレントアウェアネス-R』 2013年6月26日
- (3)武田英明「Linked Dataの動向」『カレントアウェアネス』 2011 (308) CA1746 pp. 8-11
- (4)大向一輝「オープンデータと図書館」『カレントアウェアネス』 2014 (320) CA1825, pp. 14-16
なお、諸諸外国の国立図書館によるLODの提供例は以下のとおりです。- 英国図書館の書誌データと典拠データ British National Bibliography (BNB) - Linked Open Data
- スウェーデン国立図書館の書誌データと典拠データ LIBRIS
- スペイン国立図書館の書誌データと典拠データ datos.bne.es
- ドイツ国立図書館の書誌データ Deutsche Nationalbibliografie (DNB)
- ハンガリー国立図書館の書誌データと典拠データ Hungarian National Library (NSZL) catalog
- フランス国立図書館の書誌データと典拠データ data.bnf.fr - Bibliothèque nationale de France
- 米国議会図書館の典拠データ Library of Congress Name Authority File (NAF)
橋詰秋子「Linked Open Data―欧米国立図書館の動向と国立国会図書館の取組み」NDL書誌情報ニュースレター2015年2号(通号33号) - (5)ウェブ上のLOD間の相互関係は、「The Linking Open Data cloud diagram」と「Linked Open Data Cloud Diagram 2014」に図示されています。ここには、国立国会図書館のほか、諸外国の国立図書館のLODが含まれています。
- (6)LODチャレンジは、オープンなデータづくりとデータ活用に関する取り組みを表彰する日本国内のコンテストです。
国立国会図書館のLinked Open Dataに関する問い合わせ先
国立国会図書館 電子情報部
電子情報流通課 標準化推進係
メールアドレス:standardization