メタデータの調和-2011年ダブリンコアとメタデータの応用に関する国際会議(DC2011)参加報告

NDL書誌情報ニュースレター2011年4号(通号19号)
「2011年ダブリンコアとメタデータの応用に関する国際会議(DC2011)」が、9月21日(水)から23日(金)までオランダ王立図書館を会場に開催されました。この会議は、ダブリンコア(Dublin Core)などのメタデータに関する研究発表や意見交換の場として毎年開かれています。11回目を迎える今回は、36カ国から170名の参加者があり、日本からは筆者を含め、計7名が参加しました。
21日はプレカンファレンスで、ダブリンコア、Linked Data、SKOS(Simple Knowledge Organization System)に関する基本事項を講義するチュートリアルと語彙に関する特別セッションが並行して開催されました。

チュートリアルの様子
本会議は、22日と23日に開催され、両日の午前中に基調講演2本、論文発表11本が行われたほか、午後にはプロジェクト報告、各タスクフォースによるワークショップ、会期中にテーマを設定する「アンカンファレンス(Unconference)」と呼ばれるセッションが同時並行で開催されました。
以下、トピックごとに会議の概要を紹介します。
1.メタデータの調和
今年の会議は、「メタデータの調和:記述言語間の連携」をテーマとして開催され、メタデータ・スキーマや標準がその相違を越えて連携するために解決が必要となる概念上または実践上の問題点について、講演や論文発表が行われました。
22日には、かつてDublin Core Metadata Initiative(DCMI)で各種標準策定に関わり、現在はGoogleにソフトウェアエンジニアとして在籍するニルソン(Mikael Nilsson)氏から、「メタデータの調和」をテーマとした基調講演が行われました。メタデータ・スキーマや標準が多数存在し、複合的に使用される現在においては、個別にスキーマや標準間でマッピングを定義してメタデータを交換するというアプローチでは、コストがかかりすぎて対応しきれないという状況になりつつあります。ニルソン氏は、「メタデータの相互運用性」を「個別にマッピングを定義するというような一定の方法により、意味の同一性を損なわない形で、システム間でメタデータ交換を行えること」と定義し、それとは別のあり方として、「メタデータの調和」を提唱しました。「メタデータの調和」とは、「複数のメタデータ・スキーマや標準を複合的に用いて記述したメタデータが、システム間の交換方法に関わらず、意味の同一性を担保しつつ、共有されること」と定義され、「意味」のレベルにおいて、個々の標準やスキーマが共通のコアとなるモデルに対応付けされることが、「メタデータの調和」にとって必要になることが述べられました。[1]
22日に行われた論文発表「セマンティック・ウェブにおけるマッピングの再考」でも、同様にメタデータの相互運用の方向性が変わっていることについて、「マッピング」の観点から言及がありました。セマンティック・ウェブを基盤とした環境では、意味の単位が、RDF(Resource Description Framework)のトリプル(主語・述語・目的語のセット。RDFによる記述の最小単位となる)のまとまりに還元されるため、メタデータ共有のあり方がこれまでの「レコードベース」から「トリプルベース」に変わってきていることが述べられました。これに伴い、セマンティック・ウェブ環境における「マッピング」の意味するところが、メタデータ・スキーマ間の対応関係を1対1で規定する方法から、メタデータ記述に使用する語彙同士の関係性(上位・下位・等価など)をRDFスキーマやOWL(Web Ontology Language)を用いて定義する「語彙マッピング」という方法へと転換してきているということでした。「語彙マッピング」の方法としては、ローカルな独自語彙を汎用的な語彙(たとえば、DCMI Metadata Terms)に対応付けする「ハブアンドスポーク方式」が推奨されるということで、その実例として、英国情報システム合同委員会(JISC)などにより開発された「Vocabulary Mapping Framework」が紹介されました。[2]
2.Linked Data
DC2009、DC2010に引き続き、今年の会議においても、Linked Dataに関する取り組みについて、多くの発表や報告が行われました。
23日には、フランスのポンピドゥー・センターでヴァーチャル・ミュージアムのプロジェクト・マネージャーを務めるベルメス(Emmanuelle Bermès)氏から「図書館・文書館・博物館のためのLinked Dataに向けて」と題する基調講演があり、図書館・文書館・博物館のデータがLinked Dataのクラウドに参加していくことで相乗効果が生まれること、ユーザ目線からLinked Dataのサービスを提供することが重要であることなどが述べられました。
論文発表では、Europeanaで実施されたLinked Open Dataのパイロットプロジェクト(data.europeana.eu)について、図書館・博物館・文書館でそれぞれ使用される典型的なメタデータ・スキーマを吸収でき、かつセマンティック・ウェブやLinked Dataに対応した表現が可能なデータモデル「Europeana Data Model」を採用したことや、データ提供者がこのプロジェクトへの参加を選択できるようにしたことなどについて紹介がありました。
そのほか、AGROVOC(国際連合食糧農業機関(FAO)が維持管理し、Linked Data形式でも提供している統制語彙集)をLCSH(Library of Congress Subject Headings)などと機械的にリンク付けする研究発表、細目付き件名に含まれる地理に関する語を抽出し、地理に関するオントロジーであるGeoNameの対応する語彙に機械的にリンク付けを行う研究発表がありました。
3.来歴情報の記述モデル
様々な機関からメタデータを収集し、集約して提供する場合、タイトルや作成者といった情報資源そのものに関する情報以外に、メタデータの提供者や更新日といった、メタデータ自体に関する情報も必要になります。こうしたメタデータに関する情報の記述モデルを考案するため、2年前に韓国で開催されたDC2009で「メタデータの来歴情報に関するタスクグループ」が立ち上げられました。今回の会議では、論文発表・ポスター発表で活動の成果が報告されるとともに、23日開催のワークショップでタスクグループが提案したモデルについて議論がなされました。
タスクグループからは、DCMI抽象モデルを拡張し、Description SetにAnnotation Setを付加するという方法が記述モデルとして提案されました。ワークショップでは、このモデルについて議論があり、今後の方向性として、来歴情報をDCMI抽象モデルに沿いつつどのように記述するかを示す勧告(Recommendation)と記述に使用する語彙の定義をそれぞれドキュメントとしてとりまとめること、今後の進め方について顧問会議の助言を受けることが決まりました。
4.RDA、FRBR、DC-Lib...
RDA・FRBRといった新時代の目録規則・モデルをどのようにメタデータに適用し、システム構築するかについても、一つの焦点となっていました。
「レガシーデータの新しい側面」というテーマで開催されたプロジェクト報告では、RDAに基づいて作成した書誌データをダブリンコア・メタデータとしてエンコードし、評価するという取り組みについて報告がありました。ダブリンコアが定義する語彙だけで、RDAに基づいて作成した書誌データを表現しようとすると、実体間の関連などを含め、様々な情報が欠落するという問題が出てきますが、簡易な交換用のフォーマットとして、ダブリンコア・メタデータを使用したいというニーズも考えられることから、今後RDAとダブリンコア間のマッピングやエンコード方法を示すアプリケーション・プロファイルを精査していく必要があるとのことでした。
このほか、インディアナ大学図書館で実施された、音楽資料のメタデータにFRBRの概念モデルを適用するプロジェクト「V/FRBR」について報告がありました。XMLベースでシステムを構築してきたが、近年の図書館におけるセマンティック・ウェブ対応の隆盛を受けて、独自語彙やオントロジーをRDFスキーマ・OWLで定義したほか、RDF形式のダンプデータも用意したことについて説明がありました。
22日午後には、DCMI/RDAタスクグループによるワークショップが、図書館アプリケーション・プロファイル(Library Application Profile:DC-Lib)のタスクグループによるワークショップと合同で開催されました。DCMI/RDAタスクグループは、RDAに基づいて作成された書誌データをセマンティック・ウェブと互換性のある形で表現できるようにするため、メタデータ記述に使用する語彙を定義し、Open Metadata Registryへの登録を行っています。一部語彙については「new proposed」から「published」にステータスの変更が完了しており、残りの語彙についても、2011年末までに最終確認を行う予定であると報告がありました。
そのほか、DC-Libとその維持管理組織である図書館コミュニティについて、対象範囲を「図書館」に限定せず、「文化遺産関連機関」にまで拡張することなどについて議論がされました。
5.おわりに
DC2011では、「メタデータの調和」というテーマのもと、メタデータの相互運用の新たな方向性が伺われたほか、Linked Dataに関する多くの実践例が共有されました。語彙マッピングやLinked Dataによるデータ提供が進展し、メタデータ間の連携が強化されることによって、利用者にとっての情報環境がより一層向上することが期待されます。
当会議の発表資料はDC2011のウェブサイトで公開されています。
来年の会議DC2012は、マレーシアのサラワク州クチンで、「Knowledge Technology Week」のイベントの一つとして、PRICAI(Pacific Rim International Conference on Artificial Intelligence)、PRIMA(Principles and Practice of Multi-Agent Systems)などの情報技術関連の会議と合同で開催される予定です。

DC2012プロモーション用ポスター
佐藤 良
(さとう りょう 電子情報部電子情報流通課)
[1] 「メタデータの調和(Metadata Harmonization)」の定義については、以下をご参照ください。
Dublin Core Metadata Initiative. Glossary/Metadata Harmonization - DCMI_MediaWiki.
http://wiki.dublincore.org/index.php/Glossary/Metadata_Harmonization,(参照 2011-11-25).
[2] Vocabulary Mapping Frameworkについては、以下の記事をご参照ください。
中嶋晋平. メタデータ語彙のオントロジー,VMFのアルファ版がリリース. カレントアウェアネス-E1011. 2010, No.164.
http://current.ndl.go.jp/e1011,(参照 2011-11-25).
■関連ページ■
・佐藤良. メタデータの更なる機能向上に向けて―2010年ダブリンコアとメタデータの応用に関する国際会議(DC2010)参加報告. NDL書誌情報ニュースレター. 2010, 2010.4.
http://www.ndl.go.jp/jp/library/data/bib_newsletter/2010_4/article_02.html,(参照 2011-11-25).
・村上一恵. 「つながる、ひろがる、すぐ見つかる」を目指して―2009年ダブリンコア(Dublin Core)とメタデータの応用に関する国際会議(DC2009)参加報告. NDL書誌情報ニュースレター. 2009, 2009.4.
http://www.ndl.go.jp/jp/library/data/bib_newsletter/2009_4/index.html#03,(参照 2011-11-25).
・柴田洋子.セマンティックウェブにおけるダブリンコアの可能性<報告>. カレントアウェアネス-E988. 2009, No.160.
http://current.ndl.go.jp/e988,(参照 2011-11-25).
・白石啓. 2008年ダブリンコア(Dublin Core)とメタデータの応用に関する国際会議(DC2008)参加報告. NDL書誌情報ニュースレター. 2008, 2008.4.
http://www.ndl.go.jp/jp/library/data/bib_newsletter/2008_4/index.html#07,(参照 2011-11-25).
NDL書誌情報ニュースレター(年4回刊)
ISSN 1882-0468/ISSN-L 1882-0468
2011年4号(通号19号) 2011年12月26日発行
編集・発行 国立国会図書館収集書誌部
〒100-8924 東京都千代田区永田町1-10-1
E-mail: bib-news@ndl.go.jp (ニュースレター編集担当)
