• 利用案内
  • サービス概要
  • 東京本館
  • 関西館
  • 国際子ども図書館
  • アクセス
  • 複写サービス
  • 登録利用者制度
  • オンラインサービス
  • オンラインサービス一覧
  • 国会関連情報
  • 蔵書検索
  • 電子図書館
  • 調べ方案内
  • 電子展示会

コラム:書誌データ利活用(2) ―ダウンロードファイルのあれこれ

NDL書誌情報ニュースレター

NDL書誌情報ニュースレター2013年4号(通号27号)

 前号で全国書誌データを利用するためのさまざまな機能を紹介しましたが、本号ではNDL-OPACからダウンロードしたファイルの活用方法についてご紹介します。

1. NDL-OPACからのダウンロード

 最初に、NDL-OPACからファイルをダウンロードする流れ(図1参照)について、簡単にご紹介します。ファイルのダウンロードは、検索結果一覧画面又は書誌情報画面から行えます。検索結果をまとめて取得するときは、検索結果一覧画面からダウンロードされることが多いのではないでしょうか。また、全国書誌データをまとめてダウンロードする場合は、全国書誌提供サービス画面において日付で絞り込んでから検索結果一覧画面に遷移し、ダウンロードを行います。


図1 ファイルダウンロードまでの流れ

 ダウンロードを行う際のご注意として、一度に大量の書誌データをダウンロードしたときにダウンロードに時間がかかったら、項目の表示順などが壊れる場合(例えば、出版者の項目で出版地と出版者の順序が入れ替わる等)があります。その際は、件数を減らしたり(1,500件未満を推奨)、改めてダウンロードしなおしたりしてください。また、当館の書誌データはunicodeに対応していますので、SHIFT-JISでダウンロードした場合、SHIFT-JISコードを持たない文字は削除されて詰められます。

ダウンロードするファイル形式は、全部で6種類あります。利用目的に合わせて形式を選択し、ダウンロードします。

  1. 標準形式
  2. 引用形式
  3. MARCタグ形式
  4. MARC形式
  5. ALEPHシーケンシャル形式(ASF)
  6. 記号区切り形式($区切り)


図2 ファイル形式の選択(ダウンロード画面)

それでは、ダウンロードファイルの幾つかを見てみましょう。

2. 標準形式

 標準形式は、図3のように画面表示(標準形式)とダウンロードファイルがほとんど同じ内容です(MARCタグ形式も画面表示(標準形式)とダウンロードファイルがほとんど同じ内容です)。
 標準形式は、画面表示を意識した内容になっていますので、ファイルの内容を見て理解しやすいことが特徴といえます。そのため、標準形式から一覧リストを作成したり、データの一部分を抽出したりするなどの利用にはあまり向きません。手間がかかりますので、データ処理を行う簡単なプログラム、Excelのマクロなどを活用するしかありません。


図3 書誌情報画面と標準形式のダウンロードファイル

3. MARC形式

 図4をご覧ください。明らかに、MARC形式は、利用者が中身を確認して内容がすぐにわかるような形式ではありません。これは、コンピュータがデータを処理する形式なのです。データの前半に数字で表現されているレコードラベル部とディレクトリ部が存在し、後半に実際の書誌データが格納されています。データ中の黒四角(■)はフィールドの区分文字(バイナリコード)です。また、ファイル中に改行コードはありませんので、全体が1行で表現されます(図4では、画面右端で折り返す表示)。
 データの中身はなんとなくわかりますが、数字で表現された部分と書誌データの部分を組み合わせないと、どのような項目のデータなのか明確にはわかりません。MARC形式は、JAPAN/MARC形式を取り込める図書館システムなどでの利用に限定されます。


図4 MARC形式のダウンロードファイル(メモ帳で表示)

4. 記号区切り形式($区切り)

 記号区切り形式(図5参照)は、書誌データのリストを作成するときなどにお使いいただけます。書誌データの内容はおおむね必要な情報が揃っています。区切り記号が「$」というところで、違和感を持たれるかもしれません。
 Excelで利用する場合は、Excelでダウンロードしたファイルを開き、区切り方を選択してから表示させます。書誌データ中に改行コードがあると行が変わり、繰り返し項目等によりデータの表示位置がずれます。図6を見ると、出版事項(網掛け箇所)の表示された列が異なっていることがわかりますので、利用の際には注意が必要です。


図5 区切り記号形式($区切り)のダウンロードファイル(メモ帳で表示)


図6 Excelで表示した場合

5. おわりに

 NDL-OPACでは6種類のファイル形式から目的に合わせて書誌データをダウンロードし利用することができますが、ダウンロードファイルをそのまま簡単にご利用いただけるわけではありません。また、図書館で、書誌データをシステムに取り込んで利用する際には、『ファイルをダウンロードする。』という手間をかけてから取込み処理を行うことになります。できれば、その手間を省きたいものです。

 次回は、テーマを変えて、Web NDL Authorities(国立国会図書館典拠データ検索・提供サービス)をご紹介します。

(収集・書誌調整課 書誌サービス係)


このページの先頭へ

NDL書誌情報ニュースレター(年4回刊)

ISSN 1882-0468/ISSN-L 1882-0468
2013年4号(通号27号) 2013年12月25日発行
編集・発行 国立国会図書館収集書誌部
〒100-8924 東京都千代田区永田町1-10-1
E-mail: bib-newsアットマークエヌディーエルピリオドジーオーピリオドジェーピー(ニュースレター編集担当)