「国立国会図書館典拠データ検索・提供サービス(Web NDL Authorities)開発版」を公開しました

NDL書誌情報ニュースレター2011年2号(通号17号)
国立国会図書館は、2010年6月からウェブ版の国立国会図書館件名標目表(以下、Web NDLSH)を提供してきました。当館はこれを発展させ、新たに個人名や団体名などの典拠データを提供範囲に追加し、機能を拡張した「国立国会図書館典拠データ検索・提供サービス」(以下、Web NDL Authorities)の「開発版」を2011年7月7日に公開しました。
「開発版」では、最新データが提供できない等の制約がありますが、約100万件 [1] の典拠データを検索・ダウンロードし、ウェブ上のさまざまなアプリケーションやシステムで活用できるようになりました。
なお、本格サービス開始については、2011年12月を予定しています。
1. 開発版におけるデータ更新
「開発版」で提供しているデータは、2011年4月1日時点のものです。この開発版は同サービスの検索機能等を検証するためのもので、データ更新の仕組みはありません。
本格サービス開始までデータの更新が行えないことにつきまして、どうぞご了解ください。ただし、「国立国会図書館の書誌データに関する個人情報保護対策基準」[PDF file 156KB]に規定する申請があり、緊急の対応が必要と認められる場合には、データ削除等の修正を行います。
2011年12月からの本格サービスでは、データの自動更新機能を実装し、また、新設件名標目のRSS配信を行う予定です。
2. 収録内容
「Web NDLSH」で提供してきた件名典拠に加え、Web NDL Authoritiesでは新たに名称典拠(個人名・家族名・団体名・地名・統一タイトル)のデータも収録します。個人名および団体名典拠を収録することにより、長らく望まれてきた「著者名典拠」の、ウェブでの提供が実現されました。
各典拠データに含まれる項目については、[表1] をご覧ください。
3. 個々の典拠レコードには「URI」が付与されています
Web NDL Authoritiesでは、個々の典拠に個別のURI(Uniform Resource Identifier)を与えています。このURIにより、特定個人や団体をウェブ上で半永久的に識別することが可能です。
「長尾, 真, 1936-」(典拠ID 00104393)の場合
http://id.ndl.go.jp/auth/ndlna/00104393
「国立国会図書館」(典拠ID 00288347)の場合
http://id.ndl.go.jp/auth/ndlna/00288347
たとえば、人名をウェブで検索したとき、同姓同名の別人が検索結果に混ざってしまい、それを分けることができず、困ったことはないでしょうか。また、一つの名称でも、漢字形やローマ字形など、表記の仕方がさまざまなため、何度も検索語を変えて検索しなくては網羅的な結果を得られず、苦労したことはないでしょうか。
図書館目録における著者標目 [2] や件名標目 [3] には、「見かけは同じだが実体は違うものを区別して」検索できる、また、「見かけは異なるが実質的に同じものをまとめて」検索できるという利点があります。こうした著者標目や件名標目を支える仕組みが典拠 [4] です。Web NDL Authoritiesでは、各々の典拠データが固有のURIを持ちます。
これによって、たとえばウェブで検索対象となる名称等がすべてWeb NDL Authoritiesにおける固有URIとリンクされていれば、目録における標目を活用したような効果的な検索ができ、前述のような困惑や苦労は解消されます。
4. ウェブ時代の「機械可読形式」
コンピュータがデータ構造や意味を自動的に解析して処理する等の「次世代ウェブ」構想を「セマンティック・ウェブ」と言います。Web NDL Authoritiesのデータはすべて、セマンティック・ウェブの技術に対応しています。コンピュータに理解可能な記述モデルであるRDFをデータの記述に使用しており、APIの一種であるSPARQLというクエリ言語を利用して、外部システムから自動的に検索をかけて、結果を取得することが可能です。これまで、国立国会図書館の典拠データは、機械可読目録(MARC)の形式で提供しており、今後もその頒布は続けていくのですが、Web NDL Authoritiesはまさにウェブ時代の「機械可読形式」で提供されていると言えます。
5. 検索とダウンロード
Web NDL Authoritiesでは、典拠の標目形・参照形・読み(カタカナ読み・ローマ字読み)の完全一致・部分一致で検索できるほか、日本十進分類法(NDC)および国立国会図書館分類表(NDLC)の2種類の分類記号から検索することができます。
さらに、URLを用いて検索結果にリンクすることができます。
- http://id.ndl.go.jp/auth/ndla/?qw=文学&g=all
- http://id.ndl.go.jp/auth/ndla/?qw=太陽&g=na
- http://id.ndl.go.jp/auth/ndla/?qw=野球&g=corporateNames
- http://id.ndl.go.jp/auth/ndla/?qc=KS12&pfx=NDLC
引数(パラメータ)の形式については、[表2]をご覧ください。
個々の典拠データをダウンロードする際には、「RDF/XML形式」、「RDF/Turtle形式」、「JSON形式」の3つの形式を選べます。
また、『国立国会図書館件名標目表』収録対象の件名典拠については、一括してダウンロードができます。「一括ダウンロード用ファイル」のページから、「RDF/XML形式」「TSV形式」の2つの形式で取得することができます [5] 。このファイルには名称典拠は含まれません。
6. 今後の展開
これまで当館の典拠データは、JAPAN/MARCやNDL-OPACという閉じたシステムの中でしか利用できませんでした。しかし、このシステムでは、URIやSPARQLによって、外部からも典拠データを参照したり、検索したりすることが可能になりました。一例として、国立国会図書館サーチと連携し、関連キーワードの提示や、著者標目からの典拠コントロールされた再検索など付加価値の高い検索機能を実現しています。今後は、ヴァーチャル国際典拠ファイル(The Virtual International Authority File; VIAF)などを通じて海外へも提供し、我が国を代表する標準的データとして扱われるよう努めてまいります。
| 項番 | 項目名 | 内容 |
|---|---|---|
| 1 | ID | 典拠データ固有の番号。 |
| 2 | 標目 | 典拠データの標目形。 ルビとしてカタカナ読みが表示されます(ルビの表示はブラウザに依存しています)。 細目付き件名の主標目と細目、または細目同士は2つの半角ハイフン「--」で連結しています。 |
| 3 | 別名(を見よ参照) | 個人名・家族名・団体名・地名・統一タイトルの「を見よ」参照形。 ルビとしてカタカナ読みが表示されます(ルビの表示はブラウザに依存しています)。 個人名・団体名において、「名称の種類」(旧称・新称・略称・本名など)が記録されている場合は、標目形「森鴎外(1862-1922)」の参照形「森林太郎(本名)」のように、「名称の種類」が括弧つきで参照形の後ろに付記されます。 |
| 4 | 同義語 | 地名・普通件名・細目の「を見よ」参照形。 ルビとしてカタカナ読みが表示されます(ルビの表示はブラウザに依存しています)。 英字表記の同義語については、米国議会図書館(LC)の典拠データ・コード・語彙の提供サービスである「Authorities & Vocabularies」に動的に問い合わせを行い、リンク可能な場合のみ、「LCSH」と表示されます。 |
| 5 | 別名(をも見よ参照) | 個人名・家族名・団体名・統一タイトルの「をも見よ」参照形。 名称の種別が「新称」「旧称」「本名」である場合は、項目名の後に種別を示す文字列が表示されます。 |
| 6 | 上位語 | 地名・普通件名の上位語(グラフィカル表示可能)。 リンクをクリックすると、当該語を標目とする典拠データに遷移します。 |
| 7 | 下位語 | 地名・普通件名の下位語(グラフィカル表示可能)。 リンクをクリックすると、当該語を標目とする典拠データに遷移します。 |
| 8 | 関連語 | 地名・普通件名の関連語(グラフィカル表示可能)。 リンクをクリックすると、当該語を標目とする典拠データに遷移します。 |
| 9 | 参考(rdf:seeAlso) | 「主標目としても使用される細目」(例:年鑑)が、細目付き件名に含まれている場合、主標目と細目に分割され、それぞれの典拠データへのリンクが表示されます。 |
| 10 | 生年 | 個人名典拠に記録されている個人の生年。 |
| 11 | 没年 | 個人名典拠に記録されている個人の没年。 |
| 12 | 専攻 | 個人名典拠に記録されている個人の専攻。 |
| 13 | 職業・経歴 | 個人名典拠に記録されている個人の職業・経歴等。 |
| 14 | 設立年 | 団体名典拠に記録されている団体の設立年。 |
| 15 | 廃止年 | 団体名典拠に記録されている団体の廃止年。 |
| 16 | 期間 | 団体が廃止後に再度設立された場合の団体の活動期間。 |
| 17 | 来歴 | 団体名典拠に記録されている団体の来歴等。 |
| 18 | 分類記号 | 地名・統一タイトル・普通件名に付与された代表的な分類記号。 リンクをクリックすることにより、同一の"NDC"、"NDLC"を分類記号として持つ典拠データの一覧表示画面に遷移します。 |
| 19 | 関連リンク | LCのコントロール番号(LCCN)、または基本件名標目表(BSH)のID番号。 LCCNがLCの件名標目(LCSH)の番号である場合にはLCの「Authorities & Vocabularies」へとリンクし、名称典拠の番号である場合にはVIAFへリンクします。 BSHのID番号が表示されるのは、項目4の「同義語」に表示される参照形とBSHの標目形が一致する場合のみ。BSHへのリンクは表示されません。 |
| 20 | 出典 | 標目確立の根拠となった初出の資料のタイトルと責任表示、標目形を確定する際に根拠とした参考資料名等を表示します。 |
| 21 | 出典/関連リンク | 当該典拠データの標目形とBSHの標目形が一致する場合に、そのBSHのID番号を表示します。 |
| 22 | 注記 | 注記(「をも見よ」参照の指示、地理区分の可否等を含む)が表示されます。著者標目として使用している典拠のうち、機械的に生成されたものには「機械抽出典拠」、遡及入力時に作成されたものには「遡及入力典拠」と表記されています。件名標目として使用している典拠のうち、和図書で使用実績がない場合は「和図書不使用」と表記されています。 |
| 23 | 編集履歴 | 標目訂正に関する情報。 |
| 24 | 作成日 | 当該典拠データの新規作成日。 |
| 25 | 最終更新日 | 当該典拠データの最終更新日。 |
| 26 | 参考 | 標目形と同一の文字列の語彙がWikipediaの項目名にある場合は、当該Wikipediaページへのリンクを表示します。文字列のマッチングおよびリンク生成は機械的なものであり、国立国会図書館においてWikipediaの情報の信頼性を保証するものではありません。 |
| No | 項目 | 説明 | 一致条件 |
|---|---|---|---|
| 1 | w | キーワード検索を行います。(検索対象語彙:標目形、標目形の読み(カタカナ読み・ローマ字読み)、参照形、参照形の読み(カタカナ読み・ローマ字読み)) | 部分一致 |
| 2 | g | 検索対象とする典拠種別の指定を行います。 指定できる値は以下のとおりです。 "all":すべて "na":個人名・家族名・団体名・地名・統一タイトル "sh":普通件名・細目 "personalNames":個人名 "familyNames":家族名 "corporateNames":団体名 "geographicNames":地名 "uniformTitles":統一タイトル "topicalTerms":普通件名 "sub":細目 |
完全一致 |
| 3 | c | “NDC”、”NDLC”の分類記号による検索を行います。 | 完全一致 |
| 4 | pfx | "NDC"、"NDLC"のいずれかの値を指定します。 分類記号検索を行う場合、この引数は必須になります。 |
完全一致 |
(収集・書誌調整課 書誌調整係)
[1] 典拠レコードの累積件数については、「典拠データ提供統計」をご覧ください。
http://www.ndl.go.jp/jp/library/data/wt_data.html#data2 , (参照 2011-6-14)
[2] 著者標目については、以下の記事もご覧ください。
コラム:書誌データ探検 人名の標目―「個人」vs.「人格」編
http://www.ndl.go.jp/jp/library/data/bib_newsletter/2008_4/index.html#09 , (参照 2011-6-14)
コラム:書誌データ探検 人名の標目―「著者標目」vs.「人名件名標目」編
http://www.ndl.go.jp/jp/library/data/bib_newsletter/2009_1/index.html#07 , (参照 2011-6-14)
コラム:書誌データ探検 団体名の標目―企業、大学、一筋縄ではいかない団体名標目の選び方
http://www.ndl.go.jp/jp/library/data/bib_newsletter/2010_2/article_06.html , (参照 2011-6-14)
コラム:書誌データ探検隊 これまた一筋縄ではいかない、"団体名の変化"を追いかけよう!
http://www.ndl.go.jp/jp/library/data/bib_newsletter/2010_3/article_06.html , (参照 2011-6-14)
[3] 件名標目については、以下の記事もご覧ください。
コラム: 書誌データ探検 件名(1)図書館版キーワード検索―件名標目とは?
http://www.ndl.go.jp/jp/library/data/bib_newsletter/2009_2/index.html#07 , (参照 2011-6-14)
コラム: 書誌データ探検 件名(2)NDLSH メイキング―件名標目新設の現場
http://www.ndl.go.jp/jp/library/data/bib_newsletter/2009_3/index.html#08 , (参照 2011-6-14)
コラム: 書誌データ探検 件名(3)事前結合方式―件名標目の可能性の中心
http://www.ndl.go.jp/jp/library/data/bib_newsletter/2009_4/index.html#06 , (参照 2011-6-14)
コラム: 書誌データ探検 件名(4) 件名標目はウェブの中へ―セマンティック・ウェブ、トピックマップ…
http://www.ndl.go.jp/jp/library/data/bib_newsletter/2010_1/article_04.html , (参照 2011-6-14)
[4] 典拠については、以下の記事もご覧ください。
What's 書誌調整? 第3回 典拠ってなんだ
http://www.ndl.go.jp/jp/library/data/whats/3rd.html , (参照 2011-6-14)
[5]一括ダウンロード用ファイルは、非営利目的に限り、申請なしで自由にダウンロードしていただくことができますが、それに基づき研究成果の発表等を行う場合、「Web NDL Authorities」を利用している点を明記してください。
NDL書誌情報ニュースレター(年4回刊)
ISSN 1882-0468/ISSN-L 1882-0468
2011年2号(通号17号) 2011年7月7日発行
編集・発行 国立国会図書館収集書誌部
〒100-8924 東京都千代田区永田町1-10-1
E-mail: bib-news@ndl.go.jp (ニュースレター編集担当)
