ホーム > 書誌データの作成および提供 > NDL書誌情報ニュースレター > 2018年1号(通号44号)

図書館の目録データのLinked Data化に向けた取組み―MARCにおけるURIの使用

NDL書誌情報ニュースレター

NDL書誌情報ニュースレター2018年1号(通号44号)

【はじめに】

世界の図書館コミュニティでは、目録データをウェブで再利用・共有しやすくするために、「リンクするデータ」(Linked Data)への対応が進んでいます。その取組みの一つとして、Linked Dataの特性を効果的に反映できる書誌フレームワーク“BIBFRAME”の開発が、米国議会図書館(LC)を中心に進められています。BIBFRAMEは、MARCフォーマットに替わるものと期待されていますが、完成時期は未定です。その一方で、MARCフォーマットの仕様や入力方法を改善することで、従来の目録データをLinked Data化した際に、よりウェブに適したデータとして提供できるように備えておこうとする動きも見られます。本稿では、その一例として、米国国立医学図書館(NLM)による、MARC 21形式の書誌データに医学件名標目表(Medical Subject Headings; MeSH)のURIを埋め込む取組みを紹介します[1]

【取組みの背景】

NLMは、2012年に、BIBFRAMEの“Early Experimenters”としてデータモデルの実用可能性に関する調査等に参加して以来、目録データのLinked Data化に対して積極的に取り組んできました。その経験をふまえ、2017年9月にRDF(Resource Description Framework)形式のMeSHを、Linked Dataとして公開しました[2]。MeSHは、NLMが維持管理している生物学や医学用語を対象としたシソーラスです。NLMの書誌データでは、件名標目として使われています[3]

Linked Data化されたMeSHの各用語には、固有のURIが付与されています。NLMは、将来的な書誌データのLinked Data化を見据え、その準備段階として、MARC形式の書誌データにMeSHのURIを埋め込むことを決めました。

この取組みのもう一つの背景として、NLMが、国際的な共同目録の活動に積極的に関わっていることが挙げられます。NLMは、LC等による国際的な共同目録プログラム(Program for Cooperative Cataloging; PCC)に参加しています。PCCは、図書館の目録データをウェブに適したデータへ効率的に移行するための取組みを主導しています。PCCの中でも、MARCにおけるURIに関するタスクグループ(PCC Task Group on URIs in MARC)は、MARC形式の書誌データ・典拠データにおけるURIの使用に関するガイドラインの策定や、MARC 21の仕様改訂に取り組んでいます。NLMは、このタスクグループに参加しており、MARC形式の書誌データや典拠データにおける各種URIの自動付与プログラムの開発テストに協力していました。その結果をふまえ、実際の書誌データに対してもMeSHのURIを追加することを決定しました。

【URIを付与する前に:MARC 21の書誌データの構造化】

NLMでは、書誌データの入力フォーマットにMARC 21を使用しています。2015年までは、MeSHをMARC 21のフィールド650に記録していました。より詳細には、主標目(650$a)に対して、各種の統制語(地名、出版物のタイプ等)をサブフィールドで区別し、連結して記録していました(図1参照)。


図1 NLMのMARC形式の書誌データに付与されたMeSHの例(2015年以前)[4]

2016年以降は、MARC 21の主題アクセスのフィールド650(主標目)、651(地名)および655(出版物のタイプ。ジャンル・形式用語に相当。)の各サブフィールド$aに、MeSHの用語(文字列)を件名標目として記録しています。また、副標目(サブフィールド$x)と組み合わせられる統制語の種類を限定しています(図2参照)。こうした書誌データの構造化により、各件名標目に一意に対応するMeSHのURIを機械的に追加しやすくなりました。


図2 NLMのMARC形式の書誌データに付与されたMeSHの例(2016年以降)[5]

【書誌データにMeSHのURIを追加する方法】

書誌データにMeSHのURIを追加する具体的な方法は、以下の観点で検討されました。

  • 該当するフィールドにMeSHのURIを機械的に追加するためのシステム関係の費用(既存のプログラムを使用する場合と独自に開発する場合の費用対効果)
  • 既存の書誌データと新規に作成する書誌データの両方に対応可能なプログラムの要件
  • 作業対象となる書誌データの件数等

検討した結果、独自のプログラムを開発し、既存の書誌データの該当するフィールドに、サブフィールド$0とその値(MeSHのURI)を一括で追加することが決まりました。

作業は2段階に分けて実施されました。まずは、典拠データについて、すでに記録されているMeSHのIDを基に、“http://id.nlm.nih.gov/mesh/”から始まるURIを機械的に付与しました。つぎに、書誌データに付与された件名標目を典拠データの標目と照合した結果を基に、各書誌データの件名標目に対応するMeSHのURIを追加する方法がとられました。

また、新規作成または更新した書誌データに対しても、同様に、MeSHのURIを付与します。ただし、システムへの影響等を考慮し、上述の作業とおおむね同様の処理を、週次で行うことも決まりました。

【取組みの成果と今後】

NLMでは、今回の取組みを、今後書誌データをウェブで広く提供していく際に必要なプロセスの第一歩となったと評価しています。また、国立図書館として先進的に取組み、その経験や知見を広くフィードバックすることで、他の図書館等が今後Linked Data化を行う際にサポートできるとも考えています。

また、NLMでは、自館で作成した書誌データを、OCLCやLC等のさまざまな機関にMARC 21形式等で提供しています。各機関では、NLMの書誌データを利用するにあたり、新たに加わったサブフィールド$0とその値(MeSHのURI)がそれぞれのシステムやOPACの表示等に及ぼす影響について検討する必要が生じました。今後は、データ利用機関からのフィードバックや、MARC形式の書誌データ・典拠データにURIを埋め込む取組みに関するPCCの動向等をふまえ、書誌データの著者標目等にもURIを追加することを検討する予定です。また、今回はNLM自身が維持管理しているMeSHのURIを対象に実施しましたが、今後は、外部の語彙やURIを書誌データに追加することも検討していく予定です。

【おわりに】

こうしたMARC形式の書誌データ・典拠データにURIを埋め込む取組みが各図書館で進むことで、今後、これらのデータをBIBFRAME等のLinked Dataに対応した形式へ移行する際に、その作業をより円滑に進めることができると考えられます。また、Linked Dataとして公開された際に、さまざまなURIが含まれているデータは、機械可読性が高く、よりリンクや共有がされやすくなります。図書館の書誌データや典拠データが他機関のデータとリンクされることで、さまざまな場面で利用される機会が増え、その価値が高まることが期待されます。今後も欧米を中心にこうした取組みが進んでいく中で、その動向を引き続き注視していきたいと思います。

柴田 洋子
(しばた ようこ 収集・書誌調整課)

[1] 本稿の内容は、おもに以下の文献と講演動画に基づいています。
D. Boehr & B. Bushman. Preparing for the Future: National Library of Medicine's® Project to Add MeSH® RDF URIs to its Bibliographic and Authority Records. Cataloging & Classification Quarterly. 2017. https://www.tandfonline.com/doi/full/10.1080/01639374.2017.1382642, (参照 2018-01-26).
Sharon Willis. Augmenting Catalog Data with MeSH URIs: NLM Linked Data Project. 2017.
https://www.nlm.nih.gov/bsd/disted/video/mla_2017/bibframe.html, (参照 2018-01-26).

[2] RDF形式のMeSHの詳細については、以下のURLをご覧ください。
U.S. National Library of Medicine. “Medical Subject Headings RDF” .https://id.nlm.nih.gov/mesh/, (参照 2018-01-26).
MeSHは、XML、ASCII、MARC、RDFの各形式によるダウンロードや、専用インターフェースによる検索・表示もできます。
U.S. National Library of Medicine. “Files Available to Download”. https://www.nlm.nih.gov/mesh/filelist.html, (参照 2018-01-26).
U.S. National Library of Medicine. “MeSH Browser”. https://meshb.nlm.nih.gov/search, (参照 2018-01-26).

[3] MeSHのうち、書誌データで件名標目としておもに使われる用語は2種類あります。一つは“Descriptor”(統制語)と呼ばれるもので、“Anatomy”や“Mental Disorders”といった主題用語(主標目)と、文献や論文のジャンルや形式等を表す出版物のタイプ(“Government Publications”、“Abstracts”、“Review”等)、そして地名があります。もう一つは“Qualifiers”または“Subheadings”(副標目)と呼ばれ、主題をより具体的に表現するために主標目等と組み合わせて使用する副次的な標目です(“analysis”、“therapy”等)。MeSHの用語の種類の詳細は、以下のURLをご覧ください。
U.S. National Library of Medicine. “MeSH Record Types”. https://www.nlm.nih.gov/mesh/intro_record_types.html, (参照 2018-01-26).
U.S. National Library of Medicine. “Use of MeSH in Cataloging”. https://www.nlm.nih.gov/tsd/cataloging/MeSH_CatPractices.html, (参照 2018-01-26).

[4] 脚注[1]の文献の図を基に筆者が加工。

[5] 脚注[1]の文献の図を基に筆者が加工。


このページの先頭へ

NDL書誌情報ニュースレター(年4回刊)

ISSN 1882-0468/ISSN-L 1882-0468
2018年1号(通号44号) 2018年3月27日発行

編集 国立国会図書館収集書誌部
発行 国立国会図書館

〒100-8924 東京都千代田区永田町1-10-1

メールアドレス:bib-newsアットマークエヌディーエルピリオドジーオーピリオドジェーピー(ニュースレター編集担当)