ホーム > 書誌データの作成および提供 > NDL書誌情報ニュースレター > 2016年2号(通号37号)

ウェブ環境に適した新しい書誌フレームワーク:BIBFRAME

NDL書誌情報ニュースレター

NDL書誌情報ニュースレター2016年2号(通号37号)

【はじめに】

2011年5月、米国議会図書館(LC)は、書誌フレームワークの変革に向けた取組み“Bibliographic Framework Transition Initiative”を開始しました。書誌フレームワークとは、一言で言えば、書誌データの記録や流通、交換のための器です。取組みのおもな目的は、MARCフォーマットに替わる、書誌データの記録・共有の新たな方法を開発することです[1]。また、ウェブ上のさまざまなデータを関連(リンク)付けるLinked Data等の技術を採り入れることで、新しい書誌フレームワークがMARCフォーマットの単なる代替にとどまらず、図書館の枠を超え、より広い情報コミュニティとの関わりの中で書誌データを活用していく基盤となることが目指されています。

2012年11月、LCは「データのウェブとしての書誌フレームワーク:Linked Dataモデルと支援サービス[2]を公表し、Linked Dataを強く意識した、ウェブ時代にふさわしい新たなフォーマットのためのデータモデル“BIBFRAME”を提案しました。BIBFRAMEは、現在も検討段階にあり、その完成形は明らかになっていません。現在の事実上の国際標準といえるMARC 21フォーマット の後継となり、かつ、図書館の情報資源だけでなく、ウェブ上のあらゆる情報資源に対応できるものとして期待され、各国の図書館等を中心にその動向が注目されています[3]。そこで、本稿では、BIBFRAMEの概要と、その最新動向(2016年4月末現在)を紹介します[4]

1. BIBFRAMEとは?

Resource Description and Access(RDA)等の国際的な作成基準に則った書誌データを、ウェブ環境で有効に機能させるためには、個々のデータを適切に表現し、流通できるようにする器、つまり書誌フレームワークが必要になります。ウェブの世界では、データ同士をリンクして共有するLinked Dataを志向する流れにあります。一方、書誌データの流通・交換の基本をレコード単位とするMARCフォーマットでは、データ同士の関係性を記述してリンクするには限界がありました。そこで、LCにより提案されたのが、BIBFRAMEです。

BIBFRAMEでは、データモデルだけでなく、どのような情報資源を対象とするか、どのような目的や機能に応えるメタデータを作成するかといった要件や、そのデータモデルに対応するためのメタデータの種類や記述項目(語彙)も定義されています。また、データを交換するための標準的なファイル形式(エンコーディング方式)も検討されています。

データモデルの提案と並行して、LCは、英国やドイツの国立図書館やOCLC等の関係機関によるモデルの実用可能性調査プロジェクトを実施しました。そして、その成果をふまえ、データモデルや語彙等の1.0版(以下、「BIBFRAME 1.0」といいます。)を公開しました[5]。また、BIBFRAME 1.0に基づくデータ入力・編集ツールや、既存のMARCフォーマットからの変換ツール等も順次公開されました[6]。その後、これらを用いた図書館や関連機関による個別の実証試験や、メーリングリスト等を通じた活発な意見交換の結果を反映し、データモデル等の見直しが行われました。そして、2015年10月に、データモデルや語彙等の仕様案2.0版が公開されました。これらに対して寄せられたコメントをふまえ、2016年4月にBIBFRAME 2.0として正式に公開されました[7]

2. BIBFRAME 2.0の概要

BIBFRAMEは、独自のデータモデルが定められ、その語彙はRDF(Resource Description Framework)のクラスとプロパティによって表わされます。クラスは記述対象の特徴を種類分けするためのカテゴリ、プロパティは「タイトル」「著者」等の属性(記述項目)やクラス間の関連を表わす要素です。


図1 BIBFRAME 2.0のデータモデルの概要図 [8]

図1は、BIBFRAME 2.0のデータモデルの概要を表わしたものです。BIBFRAME 2.0は、「著作(Work)」「インスタンス(Instance)」「アイテム(Item)」の三つの主要なクラス(Core Class)で構成されています[9]。「著作」は、記述対象の概念的な本質を表わすものと定義されています。たとえば、「夏目漱石による『吾輩は猫である』」という知的創造を表わす、抽象的な実体です。「吾輩は猫である」が、まだ作者の夏目漱石の頭の中にあるアイデアの段階といえます。「インスタンス」は、「著作」をモノとして具体化したものです。この「モノ」には、図書や雑誌、CDやDVDのような有形の媒体だけでなく、電子書籍やウェブサイト等の電子媒体も含まれます。たとえば、出版地、出版者、出版年、フォーマット等の情報がこのクラスに属します。そして、「アイテム」は、「インスタンス」の物理的または電子的な複製で、一点ずつの資料に対する所蔵機関や排架場所等の情報等が該当します。

また、主要なクラスに関連する三つの重要な概念「エージェント(Agents)」「主題(Subjects)」「イベント(Events)」も定義されています。「エージェント」は、著者、編集者、撮影者、イラストレーター等の、「著作」や「インスタンス」に関連する個人や団体等です。「主題」は、その「著作」が何について表現されたものか、そのテーマとなる概念を表わします。テーマになり得る概念には、トピック、場所、時間、イベント、著作、インスタンス、アイテム、エージェント等が含まれます。「イベント」は、「著作」の内容になり得る、記録対象となる出来事です。たとえば、音楽演奏、野球の試合、戦争、記者会見、会議のような、特定の場所や日時、期間に起こることが該当します。

上記以外にも多様なクラスが定義されています。プロパティには、記述対象となる情報資源の属性だけでなく、たとえば「著作Aは著作Bの翻訳である」(translationOf)のように、情報資源同士の関連を記述する語彙も定められています。

3. LCのデータ試行プロジェクト[10]

LCでは、2015年6月から、BIBFRAMEに基づくデータの試行プロジェクトが行われています。第1段階では、既存データの変換と、BIBFRAME 1.0を用いた新規データの作成が行われました。前者は、既存のMARC形式の書誌データ約1,800万件と典拠データ800万件を対象に、BIBFRAME 1.0形式への変換を実施しました。後者については、LCの目録作成担当職員約40名が参加し、単行書、楽譜、雑誌、地図および録音映像資料等を対象としたデータの作成が行われました。プロジェクトの参加者に対しては、セマンティック・ウェブやLinked Dataに関する講義や、入力ツールを使用したデータ作成手順についての説明等の研修が実施されました[11]。2016年3月末で、ほとんどの資料群について作業が完了しましたが、着手が遅かった一部の資料群は、5月末まで作業を継続する予定です。データの作成には、BIBFRAME 1.0に対応した入力ツール[12]を用い、RDAを作成基準としました。そして、第1段階の試行結果として、約890件の試行データが公開されました[13]

また、2016年3月から、LCの写真等の目録作成担当職員が、静止画像を対象としたデータの試行を開始しました。こちらは、静止画資料の目録作成ガイドライン“Descriptive Cataloging of Rare Materials (Graphics) (DCRM(G))”を作成基準に使用し、7月末まで行われる予定です。

第2段階は、第1段階の試行結果をふまえ、BIBFRAME 2.0の語彙を用いて、2017年度に開始される予定です。入力ツール等の更新や、対象資料の拡大(電子情報や、美術館、博物館、文書館等の所蔵資料)も予定されています。また、RDAとBIBFRAMEの関係についての調査や、日本語の読み等を記録するMARC 21フォーマットの「880」タグ(他の字形による表現(カナ読み・ローマ字読み))の値に相当するデータへの対応等も課題とされています。

4. ウェブ環境におけるBIBFRAMEの可能性

先に少し触れましたが、MARCフォーマットは、図書館において伝統的に書誌データの流通等に用いられてきました。たとえば、MARC 21フォーマットに対応した図書館システムでは、「245」という項目(タグ)に記述された値は、タイトルに関する情報として理解され、適切に処理されます。しかし、Google等の検索エンジンは、MARC 21フォーマットによる書誌データが表わす意味を理解することができず、MARC 21フォーマットのタグ「245」であっても、ただの文字列「245」としてしか扱われません。また、タグ「245」に記述された値も、それが何に関する情報か理解できず、こちらも単なる文字列としてしか処理されません。コード化情報も同様です。コード化情報は、MARC 21フォーマットの中で、ある情報を特定の記号(コード)に置き換えて入力したものです。たとえば、資料の物理的な属性(性質)を記録するタグ「007」(物理的属性コード化情報)の値が「tb」の場合、その資料が大活字のテキスト(文字資料)であることを意味します。しかし、MARC 21フォーマットに対応した図書館システム以外では、「tb」は単なる二つの文字として処理され、その資料が大活字のテキストであるという情報は失われてしまいます。このように、MARC 21をはじめとするMARCフォーマットによる書誌データは、それが利用者にとって適切な情報だったとしても、検索エンジンでヒットしない、検索結果が本来の書誌データがもつ意味どおりに適切に表示されない、またはヒットしても上位に表示されない等、発見されづらい状況にあります。

BIBFRAMEを使うことで、図書館システムだけでなく、ウェブにおける検索エンジン等のコンピュータも意味を解釈できるデータが提供できます。図書館の書誌データが、ウェブでも検索できるようになると、利用者にとっては必要な情報資源へのアクセスの選択肢が広がります。たとえば、図2のように、ある資料をウェブで検索すると、現在は書店等によるデータが多く表示されますが、いずれは、図書館の書誌データもアクセス手段の一つとして適切かつ上位に表示され、ウェブ上で図書館の書誌データが発見される可能性が広がることが期待されます。


図2 Googleの検索結果で表示されるBIBFRAMEによるデータ(イメージ)[14]

図書館の書誌データがウェブ上で発見されやすくなると、情報資源へのアクセス可能性だけでなく、データの利活用可能性も広がります。図書館以外の分野でもデータの意味を共有できる機会が増え、さまざまな分野のデータとともに新たなアプリケーションやサービスを生み出す可能性が生まれます。BIBFRAMEは、特定のコミュニティのデータモデルや作成基準に拠らない、柔軟性の高いフレームワークとして志向されています。そのため、必ずしもRDAに則したデータに特化したものでなく、より相互運用性の高いものとなるよう、LCは、図書館以外の関連コミュニティによるコメントや実証試験への参加等も呼びかけています。今後、より多様な情報資源の記述に対応可能なフレームワークとしての検討も期待されます。

【おわりに:catalogingからcatalinkingへ】

「私たちは、カタロギングからカタリンキングへ向かっている(we are moving from cataloging to catalinking)」

この言葉は、データモデルの検討の初期に関与したZepheira社のEric Miller氏が、アメリカ図書館協会の2013年冬季年次大会でBIBFRAMEに関する発表を行った際に述べたものです[15]。「catalinking」はMiller氏の造語で、ウェブ環境における目録作業が、従来のMARCフォーマットによる書誌レコードの作成・提供から、人や主題、場所、出来事等に関するさまざまな情報資源へのリンクを有する書誌データの作成・提供へと変化していく必要がある、という説明の中で使われました。BIBFRAMEは、この新たなウェブ時代の目録環境により適したものとして紹介されています。

ウェブ環境に適した書誌データの流通・交換を実現するためには、そのための作成基準とフレームワーク、さらにそれに対応したシステムや作業フローも重要です。各国の取組み状況やシステムの実装状況等もあわせて、BIBFRAMEの最新動向を今後も注視していきます。

柴田 洋子
(しばた ようこ 収集・書誌調整課)

[1]本稿における「書誌データ」には、典拠データ等も含みます。また、「メタデータ」も同様の意味で用いています。

[2]この文書は、日本語訳が公開されています。
佐藤義則、吉田幸苗訳. データのウェブとしての書誌フレームワーク: リンクトデータ・モデルと支援サービス.
https://www.nii.ac.jp/CAT-ILL/archive/pdf/Bibliographic_Framework_as_a_Linked_Data_Model_Translation.pdf, (参照 2016-05-11).

[3] LCによるこの取組みでは、MARCフォーマットの中でも、特に、MARC 21フォーマットからの移行の手段や方法について重点的に検討される予定です。

[4]これまでの動向については、以下の記事もご覧ください。
柴田洋子. ウェブで広がる図書館のメタデータを目指して―RDAとBIBFRAME. カレントアウェアネス. 2014, (322), CA1837, p. 17-21. http://current.ndl.go.jp/ca1837, (参照 2016-05-11).

[5]BIBFRAME 1.0の語彙は、2014年1月に公開されました。
BIBFRAME Model & Vocabulary
http://bibframe.org/vocab/, (参照 2016-05-11).
また、2013年から2014年にかけて、論点や概要をまとめたディスカッションペーパーや仕様案が順次公開されました。
BIBFRAME Archive.
http://www.loc.gov/bibframe/docs/archive.html, (参照 2016-05-11).
BIBFRAME 1.0に関する日本語による解説については、以下の文献等をご覧ください。
渡邊隆弘. ウェブ時代の新しい書誌データモデル“BIBFRAME”. カレントアウェアネス-E.230. 2013.
http://current.ndl.go.jp/e1386, (参照 2016-05-11).
谷口祥一. BIBFRAMEとその問題点 RDAメタデータの観点から. 情報管理. 2015, vol. 58, no. 1, p. 20-27.
http://doi.org/10.1241/johokanri.58.20, (参照 2016-05-11).

[6]BIBFRAME Implementation & Testing.
http://www.loc.gov/bibframe/implementation/, (参照 2016-05-11).
今後、BIBFRAME 2.0に対応したツールも提供される予定です。

[7]データモデルの概要は、以下をご覧ください。
Overview of the BIBFRAME 2.0 Model
http://www.loc.gov/bibframe/docs/bibframe2-model.html, (参照 2016-05-11).
語彙や仕様は、以下をご覧ください。
BIBFRAME Model & Vocabulary
http://www.loc.gov/bibframe/docs/index.html, (参照 2016-05-11).

[8][7]のデータモデルの概要に掲載されている図の一部を筆者が和訳しました。

[9]BIBFRAME 1.0の主要なクラスは、「著作(Creative Work)」「インスタンス(Instance)」「典拠(Authority)」「アノテーション(Annotation)」の四つで構成されていました。詳細は[5]の渡邊氏の文献をご覧ください。

[10]Frank, Paul. “Library of Congress BIBFRAME Pilot update”. BIBFRAME Listerv.
http://listserv.loc.gov/cgi-bin/wa?A2=ind1603&L=bibframe&T=0&P=1473, (参照 2016-05-11).
Randall K. Barry. “Development and Testing of BIBFRAME at the Library of Congress”.
http://www.eastasianlib.org/ctp/Meetings/2016/BIBFRAME%20Development%20&%20Testing%20at%20LC%202016-03-31.ppt, (参照 2016-05-11).

[11]研修資料は、以下のページに公開されています。
http://www.loc.gov/catworkshop/bibframe/, (参照 2016-05-11).

[12]入力ツールのデモ画面が公開されています。
http://bibframe.org/tools/editor/, (参照 2016-05-11).

[13]以下のURLからダウンロードできます。データは、それぞれ3種類(JSON-LD、N3、RDF/XML)の形式で提供されています。
http://bibframe.org/static/data/lc-bibframe-pilot.zip, (参照 2016-05-11).

[14]以下の図(p.9)を基に、筆者が加筆しました。
Frank, Paul. "BIBFRAME: Why? What? Who?" Library of Congress, Washington, D.C., 2014-05-01.
http://www.loc.gov/pcc/bibframe/BIBFRAME%20paper%2020140501.docx, (参照 2016-05-11).

[15]Linked Data for Holdings and Cataloging: The First Step Is Always the Hardest!
http://alamw13.ala.org/node/9009, (参照 2016-05-11).


このページの先頭へ

NDL書誌情報ニュースレター(年4回刊)

ISSN 1882-0468/ISSN-L 1882-0468
2016年2号(通号37号) 2016年6月28日発行

編集 国立国会図書館収集書誌部
発行 国立国会図書館

〒100-8924 東京都千代田区永田町1-10-1

メールアドレス:bib-newsアットマークエヌディーエルピリオドジーオーピリオドジェーピー(ニュースレター編集担当)