国立国会図書館ダブリンコアメタデータ記述(DC-NDL)解説
このページでは「国立国会図書館ダブリンコアメタデータ記述(DC-NDL)」について解説します。アスタリスク(*)を付記した用語は、「【参考】メタデータ関連用語集」にリンクしています。
目次
1. DC-NDLの概要
国立国会図書館は、情報資源の組織化および利用提供のためのメタデータ標準として「国立国会図書館ダブリンコアメタデータ記述(DC-NDL)」を定めています。DC-NDLは、国際的なメタデータ標準である「Dublin Core(ダブリンコア)*」をもとに(【解説:ダブリンコアについて】を参照)、日本語対応など独自に拡張したメタデータ記述語彙および記述規則の総称です。
DC-NDLでは、ダブリンコアを代表とする国際的なメタデータ標準で定義された語彙に加えて、国立国会図書館のメタデータ記述で必要となる語彙を独自定義するほか、既存語彙および独自語彙の双方を用いた標準的なメタデータ記述方法について定めています。
最新版は、「国立国会図書館ダブリンコアメタデータ記述」(DC-NDL2011年12月版)です。DC-NDLのこれまでの変遷については、【解説:DC-NDLの変遷】をご参考ください。
2. DC-NDLの特徴
DC-NDLの主な特徴を「アプリケーション・プロファイルへの対応」「既存語彙+独自語彙の併用」「セマンティックウェブ志向」「過去の基準の取扱い」の4点に分けて説明します。
2.1. アプリケーション・プロファイルへの対応
ダブリンコア*では、メタデータの相互運用性を向上するための基礎的なモデルとして、「アプリケーション・プロファイル*」を提唱しています。アプリケーション・プロファイルは、メタデータの記述にどのような語彙を使用し、その語彙を用いてどのような形式で記述するかを定義したメタデータの記述規則です。語彙のグローバルな共有を促し、相互利用性を高めるとともに、各メタデータ作成・提供機関による柔軟なメタデータ記述規則の設定を可能とするため、語彙の意味(セマンティクス)と語彙の記述方法・記述形式(シンタックス)は分けて定義することが推奨されています。アプリケーション・プロファイルは後者の語彙の記述方法・記述形式を定めるものであり、前者の語彙の意味を定義するエレメントセット(語彙集)*とは別に作成されます。(ダブリンコアにおけるアプリケーション・プロファイルについては【解説:ダブリンコアについて―アプリケーション・プロファイル】、語彙の意味(セマンティクス)と語彙の記述方法・記述形式(シンタックス)の分離については【解説:セマンティクスとシンタックスの分離】も併せてご参照ください。)
アプリケーション・プロファイルの方法を取り入れることにより、メタデータ作成・提供機関は、ダブリンコアといった既存語彙が利用できる場合にはそれを使用し、利用できない場合には語彙を独自定義し、既存語彙と独自語彙の双方を組み合わせてメタデータスキーマ*を構成できるようになります。従来のメタデータ記述規則では、他の規則で同じような意味を持つ語彙が定義されていた場合でも、一つの完結したシステム内でメタデータスキーマを定義するために、独自語彙として定義することが行われてきました。この方法に拠ると、異なるメタデータスキーマに基づいて作成されたメタデータを相互運用するためには、語彙ごとにマッピング(対応づけ)を定義する必要が生じます。一方、アプリケーション・プロファイルの枠組みに基づき、各メタデータスキーマでダブリンコアに代表される標準的な既存語彙を採用し、語彙の共有を進めることで、語彙やメタデータスキーマ間のマッピングにかかるコストを低減させ、メタデータの相互運用性を向上させることができます。
DC-NDLでは、こうしたアプリケーション・プロファイルの枠組みを取り入れ、「語彙の意味」と「語彙を用いたメタデータの記述方法・記述形式」を分けて定義しています。DC-NDLは三部のドキュメントで構成されていますが(「3. DC-NDLの構成」を参照)、第一部のNDL Metadata Termsは、国立国会図書館独自の語彙の意味を定義し、第二部のApplication Profileは、既存語彙および独自語彙の双方について、語彙に収める値の形式や入力レベルの目安といった語彙の記述方法・記述形式を定義しています。
2.2. 既存語彙+独自語彙の併用
「2.1. アプリケーション・プロファイルの枠組みへの対応」で述べたとおり、DC-NDLでは、国立国会図書館のメタデータ記述で必要となる語彙が、ダブリンコアを代表とする主要なメタデータ標準で定義されている場合には、それを使用し、定義されていない場合には、独自定義しています。既存語彙と独自語彙の双方を含め、DC-NDLで使用する語彙は、以下のとおりです。
| 語彙名 | 名前空間名 | 接頭辞 | 説明 |
|---|---|---|---|
| DCMI Metadata Terms | http://purl.org/dc/terms/ | dcterms | ダブリンコアの維持管理団体であるDCMI(Dublin Core Metadata Initiative)*が定める55個のプロパティ*等のメタデータ記述語彙。 詳細は、【解説:ダブリンコアについて―Dublin Core Metadata Element SetとDCMI Metadata Terms】を参照 |
| Dublin Core Metadata Element Set, Version 1.1 | http://purl.org/dc/elements/1.1/ | dc | DCMIが定めるタイトル・作成者等の基本15要素。いわゆるSimple DC。 詳細は、【解説:ダブリンコアについて―Dublin Core Metadata Element SetとDCMI Metadata Terms】を参照 |
| Dublin Core Type Vocabulary | http://purl.org/dc/dcmitype/ | dcmitype | DCMIが定める情報資源の種別を示すための語彙 |
| FOAF Vocabulary | http://xmlns.com/foaf/0.1/ | foaf | 人に関する情報をRDF(Resource Description Framework)*で記述するための語彙 |
| RDF Vocabulary | http://www.w3.org/1999/02/22-rdf-syntax-ns# | rdf | RDFモデル構文の名前空間で定義される語彙 |
| RDF Schema Vocabulary | http://www.w3.org/2000/01/rdf-schema# | rdfs | RDFスキーマの名前空間で定義される語彙 |
| OWL Web Ontology Language | http://www.w3.org/2002/07/owl# | owl | ウェブ・オントロジー言語による情報資源の記述に使用する語彙 |
| NDL Metadata Terms | http://ndl.go.jp/dcndl/terms/ | dcndl | DC-NDLで独自定義するプロパティ等のメタデータ記述語彙 |
| NDL Type Vocabulary | http://ndl.go.jp/ndltype/ | ndltype | DC-NDLで独自定義する情報資源の種別を示すための語彙 |
DC-NDLが採用する既存の語彙は、以下のとおり、用途に応じて、使い分けを行っています。
- タイトル、作成者、出版者、内容記述などの基本的な書誌情報
→ DCMI Metadata Terms、Dublin Core Metadata Element Set, Version 1.1 - デューイ十進分類法(DDC)、米国議会図書館件名標目表(LCSH)、ISO言語コード(ISO 639-2)等の国際的な統制語彙・コードの符号化スキーム
→ DCMI Metadata Terms - 関連するURLへの参照(See Also)
→ RDF Schema Vocabulary - 一次資料にアクセス可能なURI(Same As)
→ OWL Web Ontology Language - 資料のサムネイル画像URI(Thumbnail)
→ FOAF Vocabulary
一方、国立国会図書館が独自に定義する語彙には、以下のようなものがあります。
- よみ、各種タイトル、内容細目、版表示、価格等のいわゆる書誌情報
- 博士論文、デジタル化資料、雑誌記事等の資料の特性に関する語彙
- 請求記号、所蔵する逐次刊行物の巻次等の機関の所蔵情報に関する語彙
- 国立国会図書館のサービス要件(総合目録ネットワーク等)に関する語彙
独自語彙がDCMI Metadata TermsまたはDublin Core Metadata Element Set, Version 1.1の語彙を精緻化・詳細化したものである場合、独自語彙をこれら既存語彙の下位プロパティまたは下位クラスとして定義します。例えば、シリーズタイトル(dcndl:seriesTitle)は、ダブリンコアのタイトル(dc:title)の下位プロパティとして定義しています。このように語彙間の関係性を定義することにより、後述のセマンティックウェブ*に対応したプログラム(エージェント)が、関係性を用いた推論や自動処理を行うことが可能になります。
2.3. セマンティックウェブ志向
DC-NDLは、ウェブ上の情報資源に意味の明確なデータを付与し、機械的な意味処理を目指す「セマンティックウェブ*」への対応を行っています。
DC-NDLでは、セマンティックウェブにおけるメタデータの標準的な表現方法である「RDF (Resource Description Framework)*」による記述が可能となるように語彙定義を行っています。例えば、RDFの構造化表現(【解説:構造化表現の必要性】を参照)を用いて、タイトルとその読みをセットで表現できるように、読みを記述するための語彙dcndl:transcriptionを設定しています。一方、DC-NDLを採用するシステムや機関が必ずしもRDFに対応できるとは限らないため、RDF形式で記述できない場合の語彙もDC-NDLでは用意しています。例えば、タイトルをRDFの構造化表現により読みと値をセットで表現できない場合は、読みをdcndl:titleTranscriptionで表現することができます(【解説:Transcriptionと○○Transcriptionの使い分け】を参照)。
DC-NDLでは、独自定義した語彙の意味を機械にも理解可能にするために、語彙の記述対象となるリソースの範囲を指定する定義域、語彙の値が取り得る範囲を指定する値域をそれぞれ設定するとともに、DCMIが定義する主要な語彙と下位プロパティの関係を設定し、これらの内容を「RDFスキーマ*」として定義しています。
DC-NDLでは、名前空間ごとに、「NDL Metadata Terms」「NDLタイプ語彙」のRDFスキーマを用意しています。
2.4 過去の基準の取扱い
DC-NDLは過去に改訂を行っており(【解説:DC-NDLの変遷】を参照)、版の区別には年月次を使用しています。
- 「DC-NDL2007年版」
- 「DC-NDL2010年6月版」
- 「DC-NDL2011年12月版」←最新版
旧版を採用しているシステムもあるため、改訂後も過去の標準を引き続き公開しています。
3. DC-NDLの構成
DC-NDLは「第一部 NDL Metadata Terms」「第二部 Application Profile」「第三部 RDFスキーマ」の三部構成です。ここでは、各部の概要および全体構成についてご説明します。
3.1. 第一部 NDL Metadata Terms
「第一部NDL Metadata Terms」は、国立国会図書館が独自に定義したメタデータの記述のための語彙集です。読み(dcndl:transcription)、シリーズタイトル(dcndl:seriesTitle)、博士論文の学位名(dcndl:degreeName)などを定義しています。各語彙で定義する項目は、以下のとおりです。
| 項目 | 内容 | dcndl:transcriptionの例 |
|---|---|---|
| 語彙の名前 | Transcription | |
| URI | 当該語彙が意味定義されているURI* | http://ndl.go.jp/dcndl/terms/transcription |
| 表示名 | 利用者の理解を助けるために与える短い表示名 | Transcription |
| 定義 | NDL Metadata Termsで与える語彙の定義 | 読み又は翻字形 |
| 補足説明 | 「定義」の詳細・補足説明等 | Title、Creator等の値とセットで表現できる場合に使用する。 |
| 語彙のタイプ | 語彙のタイプ。「プロパティ*」「語彙符号化スキーム*」「構文符号化スキーム*」「クラス*」のいずれかを選択する。 | プロパティ |
| 上位プロパティ | 当該語彙の上位にあるプロパティ | ― |
| 「をも見よ」参照 | 関係のある語彙の参照先 | ― |
| 定義域 | プロパティの主語が取りうるクラスの範囲 | ― |
| 値域 | プロパティの値が取りうるクラスの範囲 | http://www.w3.org/2000/01/rdf-schema#Literal |
| ~のサブクラスである | 当該語彙が属する上位のクラス | ― |
| ~のメンバーである | 当該語彙が属する語彙符号化スキームのセット | ― |
| 語彙の作成日 | NDL Metadata Termsで当該語彙を定義した年月日 | 2010-06-21 |
| 語彙の最終更新日 | NDL Metadata Termsで当該語彙を最後に更新した年月日 | 2011-12-01 |
DCMIが定義する語彙、例えばタイトル(dcterms:title)、作成者(dcterms:creator)等については、DC-NDLでは再定義していないため、第一部には含まれていません。DCMIが定義する語彙を含むDC-NDLで採用する全語彙の一覧については、「付録 語彙一覧表」をご参照ください。
3.2. 第二部 Application Profile
「第二部 Application Profile」は、DCMI等が定義する語彙、国立国会図書館が独自定義する語彙の双方を用いたメタデータの標準的な記述方法を説明したものです。以下のとおり、各語彙の使用法、表現例、値の記述形式、入力レベル等を定めています。
| 項目 | 内容 | dcndl:transcriptionの例 | ||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| 語彙の名前 [QName] |
Transcription [dcndl:transcription] | |||||||||
| プロパティURI (Property URI) |
当該プロパティを表す、参照先となるURIを示す。 | http://ndl.go.jp/dcndl/terms/transcription | ||||||||
| QName (Qualified Name for Property) |
接頭辞と語彙の組み合わせによって、プロパティURIの短縮形を表す。 | dcndl:transcription | ||||||||
| 定義の発生源 (Defined by) |
プロパティの定義元をURIで示す。 | NDL Metadata Terms http://ndl.go.jp/dcndl/terms |
||||||||
| 語彙のタイプ (Type of Term) |
語彙のタイプを記す。 | プロパティ | ||||||||
| 表示名 (Label) |
利用者の理解を助けるために与える短い表示名(Label)。利用の場面において、この表示名の採用を求めるものではない。 Application Profileでは、当該語彙(Property)がNDL Metadata Termsで独自に定義したものでなければ、原則として定義元によって与えられたLabelをそのまま採用する。 |
Transcription | ||||||||
| 使用法 (Usage in Application Profile) |
Application Profileにおける使用法を記す。元の定義については、DCMI Metadata Terms、及びNDLMetadata Termsをそれぞれ参照のこと。 | 当該情報資源の読み又は翻字形をここに収める。 | ||||||||
| 補足説明 (Comment for Usage in Application Profile) |
「使用法」の詳細・補足説明等を記す。 | DC Title、DCTERMS Creator等の値とセットで表現する。ある一つの値に対し、読みが複数ある場合はTranscriptionを繰り返す。 | ||||||||
| 語彙符号化スキームの使用 (Uses Vocabulary Encoding Scheme) |
当該語彙に使用する語彙符号化スキーム(Vocabulary Encoding Scheme)*を示す。 語彙符号化スキームは、必要に応じて使用する。各語彙における語彙符号化スキームの採否、出現順序、繰返しについては、Application Profileでは制約を設けない。 |
指定しない | ||||||||
| 値(Value)の記述形式 | プロパティ(Property)の値(Value)の記述形式を示す。URI(Value URI)による記述、任意の文字列(Value String)による記述、構文符号化スキーム(Syntax Encoding Scheme)*による記述、入れ子による記述(Rich Representation)がそれぞれ可能であるかどうか記す。 入れ子による記述とは、RDF形式を用い、構造化して表現することを指す。 また、記述形式に制約がある場合はここに示す。 |
|
||||||||
| 表現例 (RDF/XML) |
RDF/XML形式による表現例を示す。「△」は半角スペースを意味する。 |
|
||||||||
| 入力レベル (Obligation) |
DC-NDLにおける記述の入力レベルの目安を、「必須」、「あれば必須」、「推奨」、「選択」の4段階で示す。 | 推奨 |
「第二部 Application Profile」で規定するメタデータの記述方法は、特定のシステムの実装に基づかない、国立国会図書館における標準的な記述方法を示したものであり、入力レベルの目安を示しているものの、各語彙の採否については各システムで定めることとしています。また、出現順序、繰り返し(最大出現回数・最小出現回数)についても各システムにおいて個別に定義することとし、原則として制約を設けていません。そのため、各システムでは、「第二部 Application Profile」を基に、各自のサービス要件・システム要件を踏まえて、別途アプリケーション・プロファイルを用意する必要があります。
3.3. 第三部 RDFスキーマ
「第三部 RDFスキーマ」は、国立国会図書館で独自定義した語彙「NDL Metadata Terms」をRDF形式で記述したファイルです。RDF形式で語彙定義を行うことにより、その語彙がどのような意味を持つのか、どの語彙と上下関係にあるのか、どのリソースを記述対象とし(定義域)、どの範囲の値を記述できるのか(値域)といった語彙定義の内容をコンピュータが理解できるようになります。
NDL Metadata Terms(プロパティ・語彙符号化スキーム・構文符号化スキーム)のファイルから、読みの表現に使用する語彙「Transcription」の定義部分を抜粋すると以下のとおりです。
<rdf:Description rdf:about="http://ndl.go.jp/dcndl/terms/transcription">
<rdfs:label>Transcription</rdfs:label>
<rdfs:comment>読み又は翻字形</rdfs:comment>
<dcterms:description>Title、Creator等の値とセットで表現できる場合に使用する。</dcterms:description>
<rdf:type rdf:resource="http://www.w3.org/1999/02/22-rdf-syntax-ns#Property"/>
<rdfs:range rdf:resource="http://www.w3.org/2000/01/rdf-schema#Literal"/>
<dcterms:created>2010-06-21</dcterms:created>
<dcterms:modified>2011-12-01</dcterms:modified>
</rdf:Description>
冒頭の2行で「http://ndl.go.jp/dcndl/terms/transcription」のURIで定義された語彙名「Transcription」についての記述であることが述べられます。3行目のrdfs:commentで語彙の定義、4行目のdcterms:descriptionで補足説明、5行目のrdf:typeでこの語彙がプロパティであることを示し、6行目のrdfs:rangeでこの語彙の値域が文字列(リテラル)に制約されることを示しています。7行目のdcterms:created、8行目のdcterms:modifiedはそれぞれ語彙の作成日と最終更新日を表しています。
3.4. DC-NDLの全体構成について(1): 概念モデル
DC-NDLでは、「管理情報」、「書誌情報」、「個体情報」の三層構造とし、各データ間をリンクするデータモデルをとっています。「管理情報」はメタデータ自体に関する管理情報、「書誌情報」は記述対象リソースの書誌情報、「個体情報」は各図書館等の所蔵情報をそれぞれ表現します。

図 1:概念モデルのイメージ図
3.5. DC-NDLの全体構成について(2): 語彙の分類
DC-NDLで使用する語彙は、「プロパティ」「語彙符号化スキーム」「構文符号化スキーム」「クラス」「NDLタイプ語彙」の5つに分類されます。「プロパティ」は更に「標準的なプロパティ」と「拡張的なプロパティ」に細分されます。
- プロパティ: リソースの属性を記述するのに使用。
- 標準的なプロパティ
- 図書や雑誌記事等の一般の書誌情報の記録に使用される語彙(Title、Creator、Series Title、Edition等)
- RDF形式による記述に適した語彙(Transcription等)
- 拡張的なプロパティ
- システム上の制約等によりRDF形式に対応できない場合の語彙(Title Transcription、Creator Transcription等)
- 国立国会図書館のサービス要件上、必要な語彙(Bibliographic Record Category、Cataloguing Status等)
- 標準的なプロパティ
- 語彙符号化スキーム: プロパティのとる値がどのような統制語彙(分類表、シソーラス等)に基づくかを示すのに使用。語彙符号化スキームには、NDC(日本十進分類法)、NDLC(国立国会図書館分類表)、NDLSH(国立国会図書館件名標目表)等があります。
- 構文符号化スキーム: プロパティのとる値がどのような構文(形式・書式)で記述されているかを示すのに使用。構文符号化スキームには、ISBN(国際標準図書番号)、ISSN(国際標準逐次刊行物番号)、ISO 639-2(言語コード)等があります。
- クラス: リソースをグループ化するためのカテゴリーを示すのに使用。DC-NDLでは、クラスとして、Bib Admin Resource(管理情報のクラス)、Bib Resource(書誌情報のクラス)、Item(個体情報のクラス)を定義しています。これは上述した三層構造の表現に使用しています。
- NDLタイプ語彙: 記述対象リソースの種類を表現するのに使用。形態的な種別(Book, Article, Newspaper, National Publication)や内容的な種別(Painting, Music)を定義しています。
4. DC-NDLのメタデータフォーマット(エンコーディング方式)
4.1 2種類のメタデータフォーマット
システムのメタデータスキーマ*にDC-NDLを採用する場合、各システムの内部では、それぞれに適したデータ形式で実装しても問題ありませんが、メタデータをシステム間で交換・共有する場合、相互運用性を確保するために、標準的なメタデータフォーマット(エンコーディング方式)で入出力を行うことが望まれます。そのため、国立国会図書館ではRDF/XML形式による「DC-NDL(RDF)」、XML形式による「DC-NDL(Simple)」の二つのメタデータフォーマットを用意しています。
これらのメタデータフォーマットは、国立国会図書館における標準的なメタデータ語彙の記述方法を示した「第二部 Application Profile」をもとに、実際のシステムにおけるメタデータの入出力に対応するように最大出現回数・最小出現回数や入力レベル等を具体的に設定しています。
DC-NDLの三部構成と二つのメタデータフォーマットの関係を図示すると、以下のとおりです。

図 2:DC-NDLとメタデータフォーマット
2種類のメタデータフォーマットの特徴は以下のとおりです。
- DC-NDL (RDF)
- DC-NDLで記述したメタデータをRDF/XML形式で出力する際のフォーマット
- RDFによる構造化表現を用いて、値とその読みなどをセットで表現
- DC-NDL(Simple)に比べて情報量が多い
- DC-NDL (Simple)
- DC-NDLで記述したメタデータをXML形式で出力する際のフォーマット
- 構造化表現を用いず、文字列(リテラル)での記述を中心としたフラットな表現をとる
- 利用頻度の高い要素のみを使用する

図 3:メタデータフォーマット仕様のイメージ
上記のメタデータフォーマットの仕様は、「メインページ > 国立国会図書館サーチについて > メタデータ」のページでご覧になれます。
4.2. 国立国会図書館サーチにおけるメタデータフォーマット
国立国会図書館サーチでは、DC-NDL(RDF)とDC-NDL(Simple)の双方をメタデータの収集・提供用フォーマットとして使用しています。国立国会図書館サーチから出力したDC-NDL(RDF)とDC-NDL(Simple)形式のメタデータをそれぞれ見てみましょう。
DC-NDL(RDF)
DC-NDL(RDF)形式のメタデータは、国立国会図書館サーチの各書誌詳細画面から取得することができます。書誌詳細画面の右下に設置されている「書誌情報をDC-NDL(RDF)で出力」のボタンをクリックすると、DC-NDL(RDF)形式のメタデータをダウンロードすることが可能です。
国立国会図書館サーチから出力したデータは、「DC-NDLの全体構成について(1): 概念モデル」で説明した、「管理情報」「書誌情報」「個体情報」の三層構造により表現されます。

図 4:DC-NDL(RDF)形式で出力したメタデータのイメージ
上記にあげた方法以外にも、OAI-PMHやSRU/SRWといったプロトコルによっても、DC-NDL(RDF)形式のメタデータを取得することができます。こちらの詳細については、「外部提供インタフェース(API)」のページをご参照ください。
DC-NDL (Simple)
DC-NDL(Simple)は、DC-NDL(RDF)のように各書誌詳細画面から出力することはできませんが、APIを用いて取得することができます。OAI-PMHのプロトコルを用いて、出力したDC-NDL(Simple)形式のメタデータは以下のとおりです。
http://iss.ndl.go.jp/api/oaipmh?verb=GetRecord&metadataPrefix=dcndl_simple&identifier=oai:iss.ndl.go.jp:R100000002-I000011254088-00
DC-NDL(Simple)には、DC-NDL(RDF)とは異なり、管理情報・個体情報の記述が含まれません。また、DC-NDL(Simple)では、値と読みなどをセットで表現するための構造化表現を使用しておらず、フラットな形でデータ項目が表現されています。構造化表現をとることのメリットについては、【解説:構造化表現の必要性】をご参照ください。 OAI-PMH以外のプロトコルによるDC-NDL(Simple)形式のメタデータの取得方法については、「外部提供インタフェース(API)」のページをご参照ください。
5. DC-NDLはつながる ~おわりに~
国立国会図書館は、保有するメタデータをウェブと親和性の高い機械可読形式で提供し、様々なシステムやアプリケーションでの利活用が可能になるように、語彙の定義やメタデータフォーマット仕様の整備を進めてきました。近年、機械可読形式で構造化データをウェブ上に公開し、連係させることによって、構造化データ同士がリンクし合う「データのウェブ(Web of Data)」と呼ばれるグローバルな情報空間を形成する仕組みとして「Linked Data*」が注目を集めています。図書館界においてもLinked Dataの実践が進んでおり、2011年10月にはW3Cの図書館Linked DataインキュベータグループがLinked Dataを図書館データに適用することの利点やその方法等を提言する最終報告書を刊行しました(日本語訳)。DC-NDLは、このLinked Dataの世界に図書館データを接続するための役割を果たすことを目指しています。
国立国会図書館が作成し、維持管理する書誌データは「国立国会図書館サーチ」から、典拠データは「国立国会図書館典拠データ検索・提供サービス(Web NDL Authorities)」からそれぞれLinked Dataに対応した形式でメタデータの提供を行っています。これらのシステムで提供されるメタデータのデータモデル図は以下のとおりです。
図 5:国立国会図書館メタデータモデル図
書誌データの著者標目からは著者実体URI*、件名標目からは件名典拠URIにそれぞれリンクし、これらのURIに対して標目形・参照形・根拠・注記等の典拠情報が記述されます。典拠データ中にリンク情報がある場合は、ヴァーチャル国際典拠ファイル(VIAF)や米国議会図書館件名標目表(LCSH)にリンクしており、国際的な「データのウェブ」の世界へと繋がっています。このようにDC-NDLは、図書館データを機械可読形式による構造化データとして表現可能にすることで、「データのウェブ」の世界へと橋渡しする役割を担っています。
DC-NDLは、これまで図書館が蓄積してきたデータをウェブの世界につなげるということに加え、交換用メタデータスキーマとして、各システム間を連携させる、つまりはシステム間のメタデータ交換で共通して利用される「ハブ」となることによって、メタデータの相互運用性の向上に資することも目的としています。メタデータの相互運用性を向上させ、メタデータの共有を進めることで、ユーザとコンテンツを結ぶルートをより豊かにすることも可能になります。国立国会図書館では、メタデータの円滑で効率的な交換・共有が一層進展するよう、コンピュータにも人にも理解しやすく、より汎用的で可用性の高いメタデータ標準として、DC-NDLを維持管理し、普及させていくことを目指しています。

図 6:DC-NDLがシステム間のメタデータ交換・共有におけるハブとなる図
解説:ダブリンコアについて
ダブリンコア*は、1995年頃からインターネット上の情報資源の発見を目的として開発が進められたメタデータ記述要素です。Dublin Core Metadata Initiative (DCMI)のもと、維持管理が行われています。
Dublin Core Metadata Element SetとDCMI Metadata Terms
ダブリンコアの中核となる基本15要素を定義したのがDublin Core Metadata Element Set(DCMES)*です。このDCMESは、1997年秋に実質的に確定し、その後、2000年にCEN/ISSS(CWA 13874)、2001年10月にANSI(Z39.85)でそれぞれ標準化され、2003年には国際標準(ISO 15836)として定められました。2005年には国内標準(JIS X 0836)としても規格化されました。
DCMESは、「Dublin Core Metadata Element Set, version 1.1」としてDCMIのウェブサイト上で公開されています。DCMESは、Simple DCとも呼ばれています。
DCMESは、シンプルかつ自由度の高いメタデータ記述が可能であることから広く普及しましたが、セマンティックウェブ*環境でのコンピュータによる自動処理には、より厳密で精緻なメタデータ記述が必要とされる等の理由から、見直しが図られ、2008年1月にはDCMESとは別の名前空間に、基本15要素を含む計55個の記述要素(プロパティ)を定義した「DCMI Metadata Terms*」が新たに公開されました。
DCMI Metadata Termsでは、各プロパティに記述対象の範囲を指定する「定義域」、値の範囲を指定する「値域」を設定したほか、プロパティに加えて、値の属する統制語彙(分類表、シソーラス等)を指定する「語彙符号化スキーム」計9個、値の記述形式を示す「構文符号化スキーム」計12個、共通する特性を有する要素をグループ化するためのカテゴリーを示す「クラス」計22個、情報資源のタイプを示す「DCMIタイプ語彙」計12個をそれぞれ定義しています。
現在、DCMESは旧式の語彙(レガシー)として位置づけられ、DCMI Metadata Termsの使用が推奨されています。
Dublin Core Metadata Element Set (DCMES)
- 基本15要素を定義
- 国際標準(ISO 15836)、国内標準(JIS X 0836 ダブリンコアメタデータ基本記述要素集合)
- シンプルで記述の自由度が高い
- 旧式の語彙(レガシー)の位置づけ
| 基本記述要素名 | 表示名(※JIS X 0836に準拠) |
|---|---|
| Title | タイトル |
| Creator | 作成者 |
| Subject | キーワード |
| Description | 内容記述 |
| Publisher | 公開者 |
| Contributor | 寄与者 |
| Date | 日付 |
| Type | 資源タイプ |
| Format | 記録形式 |
| Identifier | 資源識別子 |
| Source | 出処 |
| Language | 言語 |
| Relation | 関係 |
| Coverage | 時空間範囲 |
| Rights | 権利管理 |
DCMI Metadata Terms
- DCMESとは別の名前空間に、基本15要素を含む計55の記述要素(プロパティ)を定義
- 基本15要素を再定義し、DCMESの各記述要素に対する下位プロパティと位置づける
- 各プロパティに対して、定義域と値域を設定
- プロパティ以外にも、9個の語彙符号化スキーム、12個の構文符号化スキーム、22個のクラス、12個のDCMIタイプ語彙を定義
DCMI抽象モデル
ダブリンコアでは、メタデータの相互運用性を担保するための基礎的モデルとして、2000年代後半にDCMI抽象モデル(DCMI Abstract Model)*やアプリケーション・プロファイル(Application Profile)*が整備されました。
DCMI 抽象モデルは、セマンティックウェブにおけるメタデータの表現方法としてW3C(World Wide Web Consortium)により規格化されているRDF(Resource Description Framework)*のモデルをもとに、ダブリンコアメタデータの概念的な構造を示したものです。DCMI抽象モデルは、2005年3月に推奨となり、その後2007 年6 月に改訂されて現在に至ります。DCMI抽象モデルでは、統一モデリング言語(UML)の記法を使用して、以下のような構造を示しています。
- メタデータレコードは、1個以上の記述セット(Description Set)から構成される。
- 記述セットは、1個以上の記述(Description)から構成される。
- 記述は、1個以上の文(Statement)、0または1個の記述対象リソースのURIから構成される。
- 文は、一つ以上のプロパティとその値の対で構成される。
- 値はリテラル(文字列で値を直接表現する:Literal Value)または非リテラル(Non-Literal Value)のいずれかをとる。
アプリケーション・プロファイル
DCMI抽象モデルがダブリンコアメタデータに内在する概念的な構造モデルを示すのに対し、メタデータを実際に作成・提供する際に適用するメタデータスキーマの構成規則や符号化方法を示すのが「アプリケーション・プロファイル*」です。例えば、アプリケーション・プロファイルとして有名なものに、図書館データを対象とする「DC-Library Application Profile (DC-Lib)」、学術論文を対象とする「Scholarly Works Application Profile (SWAP)」、コレクションを対象とする「Dublin Core Collections Application Profile」があります。これらは、それぞれの場合において、記述対象となるリソースの特徴に合わせて、どのようにメタデータスキーマを構成し、符号化するかを定めています。
アプリケーション・プロファイルは、2007年8月にシンガポールで開催された「ダブリンコアとメタデータの応用に関する国際会議(DC2007)」において、「シンガポールフレームワーク*」と呼ばれる枠組みが示され、2008年1月に「アプリケーション・プロファイルのためのシンガポールフレームワーク(The Singapore Framework for Dublin Core Application Profiles)」として文書化されました。その後、2009年5月に、アプリケーション・プロファイルの考え方を詳説した「ダブリンコア・アプリケーション・プロファイルのためのガイドライン(Guidelines for Dublin Core Application Profiles)」が公開されました。
アプリケーション・プロファイルの枠組みを示す「シンガポールフレームワーク」は、以下の図で示されます。

図 7:シンガポールフレームワークの図(”http://dublincore.org/documents/singapore-framework/”の図を和訳)
アプリケーション・プロファイルは、「機能要求」「ドメインモデル」「記述セットプロファイル」「利用ガイドライン」「構文ガイドライン・データフォーマット」から構成されます。各構成要素の説明は以下のとおりです。
- 機能要求
アプリケーション・プロファイルにおいて実現が要求される機能、またはスコープ外となる機能を定義します。 - ドメインモデル
アプリケーション・プロファイルで記述対象となる実体および実体間の基本的な関係性を定義します。 - 記述セットプロファイル
アプリケーション・プロファイルによって定義されるシステムやサービスにおけるメタデータレコードの構造制約を定義し、妥当性検証を可能にするための要素です。使用するメタデータ語彙やその値形式など、メタデータの記述規則を規定します。 - 利用ガイドライン
アプリケーション・プロファイルの適用方法、適用時に意図されているプロパティの使用法等のガイドラインです。 - 構文ガイドライン・データフォーマット
アプリケーション・プロファイルで示されるメタデータスキーマをシステムやサービスで実装するための符号化方式またはそのガイドラインです。
アプリケーション・プロファイルを規定する際、この五つの要素のうち、「機能要求」「ドメインモデル」「記述セットプロファイル」の定義は必須とされており、「利用ガイドライン」「構文ガイドライン」は任意です。
図7のシンガポールフレームワークに示されるように、「メタデータ語彙」は、個々の分野・領域において合意された標準である「ドメイン標準」の領域において定義され、どの語彙をどのように使用するかは、アプリケーション・プロファイルの「記述セットプロファイル」で規定することになります。下図で示すとおり、「記述セットプロファイル」では、複数の「メタデータ語彙」を選択して作成することができます。

図 8:メタデータ語彙と記述セットプロファイルの関係性
前述の「2.1. アプリケーション・プロファイルへの対応」で説明するとおり、DC-NDLもこの方法に基づき、語彙定義とアプリケーション・プロファイル(記述セットプロファイル)の定義を分離しています。
解説:DC-NDLの変遷
DC-NDLの祖は、2001年3月に策定した「国立国会図書館メタデータ記述要素(NDLメタデータ)」に遡ります。その後、2007年5月に「国立国会図書館ダブリンコアメタデータ記述要素(DC-NDL2007年版)」、2010年6月に「国立国会図書館ダブリンコアメタデータ記述(DC-NDL2010年6月版)」を策定しました。現在の最新版である「国立国会図書館ダブリンコアメタデータ記述(DC-NDL2011年12月版)」は、DC-NDL2010年6月版を一部改訂したものです。これまでのDC-NDLの変遷は、以下をご参照ください。
| 文書名 | 策定年月 | 概要 |
|---|---|---|
| 国立国会図書館メタデータ記述要素(NDLメタデータ) | 2001年3月 |
|
| 国立国会図書館ダブリンコアメタデータ記述要素(DC-NDL2007年版) | 2007年5月 |
|
| 国立国会図書館ダブリンコアメタデータ記述(DC-NDL2010年6月版) | 2010年6月 |
|
| 国立国会図書館ダブリンコアメタデータ記述(DC-NDL2011年12月版) | 2011年12月 |
|
解説:セマンティクスとシンタックスの分離
「2.1. アプリケーション・プロファイルへの対応」で説明するとおり、語彙の意味(セマンティクス)を定義するエレメントセット*と語彙の記述方法・記述形式(シンタックス)を定義するアプリケーション・プロファイル*は、別に分けることが推奨されており、DC-NDLもこれに従っています。セマンティクスとシンタックスの関係は、図で表すと、以下のようになります。

図 9:セマンティクスとシンタックスの関係図(1)
アプリケーション・プロファイルは、各種のエレメントセットからメタデータ記述に使用する語彙を選択し、選択した語彙の使用法を規定します。例えば、DC-NDLのアプリケーション・プロファイルでは、DCMI Metadata Terms*からタイトル(dcterms:title)や作成者(dcterms:creator)、NDL Metadata Termsから版表示(dcndl:edition)や価格(dcndl:price)をそれぞれ選択しています。
下図に示すとおり、他のシステムや機関がエレメントセットから必要な語彙を選択して、アプリケーション・プロファイルを作成することで、メタデータの提供を行う機関間で語彙の意味共有が容易になり、メタデータの連携・交換がしやすくなります。セマンティクスとシンタックスの分離は、メタデータの相互運用性を向上させるための基盤をもたらしていると言えます。

図 10:マンティクスとシンタックスの関係図(2)
解説:Transcriptionと○○ Transcriptionの使い分け
○○ Transcriptionには、タイトルの読み(Title Transcription)、作成者の読み(Creator Transcription)、主題の読み(Subject Transcription)といった語彙があります。
例えば、TranscriptionとTitle Transcriptionは、以下のとおりの使い分けを行っています。
- Transcription → RDF*形式で記述できる場合に使用。構造化により、値と読みをセットで表現することができます。
- Title Transcription → RDF形式で記述できない場合に使用。値と読みの対応関係はデータ上、表現されません。
(例1)
<dc:title>
<rdf:Description>
<rdf:value>国立国会図書館資料デジタル化の手引</rdf:value>
<dcndl:transcription>コクリツ コッカイ トショカン シリョウ デジタルカ ノ テビキ</dcndl:transcription>
</rdf:Description>
</dc:title>
(例2)
<dcterms:title>国立国会図書館資料デジタル化の手引</dcterms:title>
<dcndl:titleTranscription>コクリツ コッカイ トショカン シリョウ デジタルカ ノ テビキ</dcndl:titleTranscription>
解説:構造化表現の必要性
RDF*の構造化表現が有用な例として、国立国会図書館サーチで「図書館・図書館学の発展 : 21世紀初頭の図書館」の書誌詳細画面にアクセスしてみましょう。
このメタデータには、内容細目の各著作のタイトルと責任表示が複数記録されています。

図 11:「図書館・図書館学の発展 : 21世紀初頭の図書館」の書誌詳細画面イメージ
DC-NDL(RDF)形式のメタデータを見てみると、dcndl:partInformationの配下で、以下に抜粋するとおり、内容細目の各著作のタイトルと責任表示がセットで表現されています。
<dcndl:partInformation>
<rdf:Description>
<dcterms:title>総論 図書館の法と政策に関する動き</dcterms:title>
<dc:creator>山本順一 著</dc:creator>
</rdf:Description>
</dcndl:partInformation>
<dcndl:partInformation>
<rdf:Description>
<dcterms:title>「図書館の自由」をめぐって</dcterms:title>
<dc:creator>山家篤夫 著</dc:creator>
</rdf:Description>
</dcndl:partInformation>
<dcndl:partInformation>
<rdf:Description>
<dcterms:title>図書館像をめぐる論争</dcterms:title>
<dc:creator>嶋田学 著</dc:creator>
</rdf:Description>
</dcndl:partInformation>
<dcndl:partInformation>
<rdf:Description>
<dcterms:title>デジタル環境下の図書館</dcterms:title>
<dc:creator>高鍬裕樹 著</dc:creator>
</rdf:Description>
</dcndl:partInformation>
<dcndl:partInformation>
<rdf:Description>
<dcterms:title>館種別状況 公共図書館</dcterms:title>
<dc:creator>新出 著</dc:creator>
</rdf:Description>
</dcndl:partInformation>
一方、DC-NDL(Simple)形式のメタデータでは、内容細目の各著作のタイトルと責任表示はセットで表現されません。
<dcndl:partTitle>総論 図書館の法と政策に関する動き</dcndl:partTitle>
<dcndl:partTitle>「図書館の自由」をめぐって</dcndl:partTitle>
<dcndl:partTitle>図書館像をめぐる論争</dcndl:partTitle>
<dcndl:partTitle>デジタル環境下の図書館</dcndl:partTitle>
<dcndl:partTitle>館種別状況 公共図書館</dcndl:partTitle>
<dcndl:partCreator>山本順一 著</dcndl:partCreator>
<dcndl:partCreator>山家篤夫 著</dcndl:partCreator>
<dcndl:partCreator>嶋田学 著</dcndl:partCreator>
<dcndl:partCreator>高鍬裕樹 著</dcndl:partCreator>
<dcndl:partCreator>新出 著</dcndl:partCreator>
DC-NDL(Simple)形式のメタデータの場合、内容細目のタイトルと著者の組合せは、n×m通り存在することになります。構造化は、元データの意味構造(関係性)をそのまま表現できるようにすることで、コンピュータが意味構造を理解し、処理することを可能にしていると言えます。

図 12:内容細目のタイトルと著者の組合せイメージ
用語集
当ページに出現する各用語の説明については、「【参考】メタデータ関連用語集」をご参照ください。
この解説は、2012年4月に開催された情報組織化研究グループ月例研究会報告における「国立国会図書館ダブリンコアメタデータ記述(DC-NDL)解読講座」(国立国会図書館電子情報部 柴田洋子)の発表内容を再構成・編集したものです。当日の発表の概要、配布資料は以下をご覧ください。
【参考文献】
[1] 杉本重雄, 「Dublin Coreについて 第1回 ―概要―」, 情報管理, 45(4), p. 241, 2002,
http://dx.doi.org/10.1241/johokanri.45.241, (参照2012-10-17).
[2] 杉本重雄, 「Dublin Coreについて 第2回 ―より深い理解のために―」, 情報管理, 45(5), p. 321-335, 2002,
http://dx.doi.org/10.1241/johokanri.45.321, (参照2012-10-17).
[3] 杉本重雄, 「Dublin Coreの現在 (『ディジタル図書館』ワークショップ第36回 発表論文)」, ディジタル図書館, 36, p. 32-45, 2009,
http://hdl.handle.net/2241/103603, (参照2012-10-17).
[4] 杉本重雄, 「メタデータについて : Dublin Coreを中心として」, 情報知識学会誌, 10(3), p. 53-58, 2000,
http://ci.nii.ac.jp/naid/110003320657, (参照2012-10-17).
[5] 谷口祥一, メタデータの「現在」 : 情報組織化の新たな展開. 勉誠出版, 2010.
【DC-NDL等のメタデータ標準に関する問い合わせ先】
国立国会図書館 電子情報部
電子情報流通課 標準化推進係
E-mail:

