ウェブ版の国立国会図書館件名標目表(Web NDLSH)を公開しました

NDL書誌情報ニュースレター2010年2号(通号13号)
国立国会図書館では、資料をテーマから検索するための統制されたキーワードである件名標目を、国立国会図書館件名標目表(NDLSH)として維持・管理しています。2010年6月30日、NDLSHをウェブ上のさまざまなアプリケーションやシステムで活用できるように、「ウェブ版の国立国会図書館件名標目表(Web NDLSH)」を公開しました。
1. まずは使ってみよう
Web NDLSHでは、標目語・参照語を完全一致・部分一致で検索できるほか、日本十進分類法(NDC)・国立国会図書館分類表(NDLC)の2種類の分類記号から件名標目を検索することができます。試しに、「インターネット」と入力し、検索してみましょう。


「インターネット」「IP電話」「インターネット--会議録」など色々な言葉が出てきますね。検索結果は、検索語と件名標目が完全一致するものが最初に表示され、続いて同義語一致および部分一致のものが読みの順に表示されます。また、当システムでは、主標目以外にも、細目付き件名を収録対象としており、件名標目と部分的に一致するものとして検索結果に表示されます。
「インターネット」のリンクをクリックしてみましょう。

「インターネット」の上位語・下位語・関連語が表示されています。各語のリンクをクリックすると、それぞれの件名標目のページに遷移します。また、「グラフィカル表示」をクリックすると、下図のとおり、「インターネット」のシソーラス構造が可視的に表示されます。

「インターネット」のページでご注目いただきたいのが、[LCSH]のリンクです。同義語として保持している「Internet」の文字列を用いて、LCSHのシステムに対して動的な問い合わせを行うことによって、リンクの生成・表示を行っています。これと同じ仕組みで、「参考」にあるWikipediaへのリンクも生成・表示しています。
当館では2009年8月より、NDLSH作成の際に対応する米国議会図書館件名標目表(LCSH)の識別子であるコントロールナンバーを入力しています。たとえば、「インターネット」の関連語にある「インターネット依存症」をクリックしてみましょう。

「インターネット依存症」のページには、「関連リンク」のところにLCのコントロールナンバー「sh97009080」が表示されており、対応するLCSHへリンクすることができます。Web NDLSHでは、このコントロールナンバーをSKOSのcloseMatchを用いて表現しており、LCSHデータへの参照を行うことが可能です。LCのコントロールナンバーを使用することで、標目訂正が行われた場合も、対応するLCSHのデータにリンクできるというメリットがあります。
2. Web NDLSHのデータ形式について
「インターネット」のページの一番下に、「RDF/XML形式」、「RDF/Turtle形式」、「JSON形式」の3つのリンクがあります。

ここをクリックすることで、NDLSHのデータを上記の3つの形式でそれぞれダウンロードすることができます。NDLSHの全件データをダウンロードしたい場合は、トップページの「データのダウンロード」から、「RDF/XML形式」「TSV形式」の2つの形式で取得することができます。[1]
このシステムの一番のミソが、NDLSHデータの表現形式です。Web NDLSHでは、NDLSHをSKOS(Simple Knowledge Organization System)のモデルを用い、RDF/XML形式によって表現しています。SKOSとは、シソーラスや分類表等、図書館等でよく使用される知識体系を、セマンティック・ウェブ上で扱える形式で記述できるようにした枠組みで、一方、RDFとは、セマンティック・ウェブ上であらゆるリソースの記述を行う基本的な表現形式のことです。
NDLSHをセマンティック・ウェブに適した形で提供することにより、コンピュータがNDLSHの構造や意味を自動的に解析、処理できるようになり、ウェブ上のさまざまなアプリケーションやシステムで活用されることが期待されます。
3. 外部との連携
セマンティック・ウェブで、コンピュータが情報を自動的に処理できるようにするためには、URI(Uniform Resource Identifier)によってそれぞれの情報が識別可能であることが重要です。今回のWeb NDLSHでは、各件名標目にURIを付与し、外部からURIを用いて参照することが可能になりました。たとえば、件名標目「インターネット」のURIは「http://id.ndl.go.jp/auth/ndlsh/00841024」です。このURIから「インターネット」という件名標目の情報を取得することができます。また、件名標目の文字列をそのまま使用したURIもデータとして保持しています。したがって、URI「http://id.ndl.go.jp/auth/ndlsh/インターネット」を使用した場合でも、「http://id.ndl.go.jp/auth/ndlsh/00841024」と同じ情報を得ることができます。
また、今回のシステムでは、APIの一種であるSPARQLというクエリ言語を利用して、外部から検索をかけることができます。クエリの組み方によって、いろいろな検索結果を得ることができるほか、外部システムから自動的に検索をかけ、結果を取得することが可能です。
これまでNDLSHの検索は、NDL-OPACという閉じたシステムの中でしか利用できませんでした。しかし、今回のシステムでは、URIやSPARQLによって、外部からもNDLSHを参照したり、検索したりすることが可能になりました。こうした機能を用いて、Wikipedia等の辞書リソースやソーシャルタギングとの連携など、さまざまなウェブサービスとのマッシュアップが可能になります。
4. これから
現在、データをセマンティック・ウェブに対応したRDF形式によって広く一般に提供することが世界的な潮流となっています。こうしたデータは、Linked Open Data(LOD)と呼ばれており、下図に示すとおり、LODは爆発的に増加しています。

2007年10月時点

2009年7月時点
(出典:Linked Data - Connect Distributed Data across the Web)
図書館を例にとってみても、2009年3月にSKOSのモデルを活用したRDF/XML形式による件名標目の提供を開始した米国議会図書館に続き、2010年4月にはハンガリー国立図書館、ドイツ国立図書館でも書誌データまたは典拠データのRDF形式による提供が始まっています。[2]
一方、日本国内に目を向けると、LODの運動はあまり進んでいるとは言えません。今回のNDLSHのSKOSの枠組みを用いたRDF/XML形式による提供は、日本国内のLODの進展に向けた意味のある一歩だと自負します。しかし、当館には、NDLSHの他にも、名称典拠データ、NDLCなど、まだまだウェブ上で活用しやすい形で提供できていないデータが眠っています。こうしたデータのLOD化に向けて、今後も検討を進めてまいります。
末筆になりますが、今回のシステム開発・導入作業にあたっては、神崎正英氏に多大なるご尽力を頂きました。この場を借りて厚く御礼申し上げます。
(収集・書誌調整課 書誌調整係)
[1] NDLSHの全件データは、非営利目的に限り、申請なしで自由にダウンロードしていただくことができますが、それに基づき研究成果の発表等を行う場合、ウェブ版の国立国会図書館件名標目表(Web NDLSH)を利用している点を明記してください。
[2] ハンガリー国立図書館、ドイツ国立図書館における事例については、以下をご参照ください。
http://current.ndl.go.jp/node/16103
http://current.ndl.go.jp/node/16127
NDL書誌情報ニュースレター(年4回刊)
ISSN 1882-0468/ISSN-L 1882-0468
2010年2号(通号13号) 2010年6月30日発行
編集・発行 国立国会図書館収集書誌部収集・書誌調整課
〒100-8924 東京都千代田区永田町1-10-1
E-mail: bib-news@ndl.go.jp (ニュースレター編集担当)
