• 利用案内
  • サービス概要
  • 東京本館
  • 関西館
  • 国際子ども図書館
  • アクセス
  • 複写サービス
  • 登録利用者制度
  • オンラインサービス
  • オンラインサービス一覧
  • 国会関連情報
  • 蔵書検索
  • 電子図書館
  • 調べ方案内
  • 電子展示会

コラム:書誌データ利活用(4) ―全国書誌(電子書籍・電子雑誌編)TSVファイルを利用しよう!

NDL書誌情報ニュースレター

NDL書誌情報ニュースレター2014年2号(通号29号)

 

1. はじめに

国立国会図書館が提供する書誌データ・典拠データの利活用方法を具体的にご紹介する連載コラム、今回は全国書誌(電子書籍・電子雑誌編)TSVファイル(以下、TSVファイルといいます)のExcelによる利用方法を取り上げます。今号には、「全国書誌(電子書籍・電子雑誌編)の提供」の記事も掲載していますので、合わせてお読みいただければと思います。

TSVファイルは、以下のページからダウンロードできます。

2. TSVファイルに出力する項目は?

TSVファイルに出力される項目は、以下のとおりです。

各フィールド(項目)はタブで区切られ、データ内に同じフィールドが複数ある場合は、「△;△」(半角スペース+半角セミコロン+半角スペース)で連結し、一つにまとまります。

NDLサーチ書誌詳細画面URL,ISBN,セットISBN,ISSN,ISSN-L,DOI,NDLJP(国立国会図書館が付与する永続的識別子),タイトル,巻次・部編番号,部編名,別タイトル,シリーズタイトル,版,著者,出版者,出版地,出版年月日,受理日,目次,注記,言語,大きさ・容量,記録形式,掲載誌名,掲載巻,掲載号,掲載通号,提供元書誌詳細画面のURL,一次資料へのリンク,原資料へのリンク,関連資料,異版を持つ,掲載誌情報,目次・記事,別の記録形式である,別の記録形式を持つ

なお、本誌今号「全国書誌(電子書籍・電子雑誌編)の提供」の記事でもご紹介しましたが、全国書誌(電子書籍・電子雑誌編)には、オンライン資料収集制度(eデポ)インターネット資料収集保存事業(WARP)で収集し、国立国会図書館デジタルコレクションに保存された電子書籍・電子雑誌のメタデータが収録されています。収録されているメタデータはさまざまで、以下のいずれかになります[1]

  • 単行資料で、多巻ものでないもの(第一階層:タイトルレベルのメタデータ)
  • 単行資料で、多巻もの(第二階層:巻号レベルのメタデータ)
  • 逐刊資料で、記事レベルを持たないもの(第二階層:巻号レベルのメタデータ)
  • 記事単位のもの(第三階層:記事レベルのメタデータ)

3. TSVファイルをダウンロード

それでは、TSVファイルをダウンロードしてみましょう。最近3か月分のTSVファイルは「全国書誌(電子書籍・電子雑誌編)TSVファイル一覧」のページ(図1参照)からダウンロードできます。


図1 全国書誌(電子書籍・電子雑誌編)TSVファイル一覧

また、3か月より前の日付のファイルも、URLを指定してダウンロードすることができます。ここでは、以下のURLから、2013年7月2日に国立国会図書館デジタルコレクションに登録された資料のTSVファイルを取得します[2]

http://iss.ndl.go.jp/data/download/digital_20130702.tsv

上記URLの拡張子(.tsv)の前の年月日を示す数字8ケタを変更することで、ダウンロードしたいTSVファイルを一日単位で取得できます。

4. TSVファイルをExcelで開く

それでは、上記のURLから2013年7月2日分のTSVファイルをダウンロードして、Excelで開いてみましょう。あらかじめ自分のパソコンからExcelで開くように設定しておけば、TSVファイルを直接クリックしても開きますが、文字化けする可能性が大きいです。この文字化けは、TSVファイルの文字コードがUnicodeであるために起こります。Excelを立ち上げてからファイルを開けば、問題ありません。

この後の内容は、実際にExcelを使いながらご覧ください。ここでは、Excel2013を使って説明します。

TSVファイルをExcelで開くと、以下の図2のように表示されます(ファイルの開き方を選ぶよう求められたら、タブ区切りを選択して開いてください)。最初の行に項目名が入っていて、各項目が一つの列に一項目ずつ割り当てられていることがわかります。最初の列(A列)を見ると、URLが表示されていますので、クリックするとNDLサーチの書誌詳細画面を確認することができます。


図2 TSVファイル(2013年7月2日分のサンプル)をExcelで開いた状態

5. 列を分割する

以下の図3で、著者の項目(N列)を見てみましょう。ここには、一つのセルの中に複数の著者の情報が存在することがわかります。このまま使っていただいても問題ありませんが、著者ごとに列を分割することもできます。


図3 図2のN列複数

N列を選択し、データタブから、区切り位置の機能(図4参照)を使って分割することができます。区切り記号として、半角セミコロンを指定して分割すると、図5のように著者の列を分けることができます。分割のときに、「既にデータがありますが、置き換えますか?」と確認されたら、いったんキャンセルして、必要な数だけ列を挿入してください。そのままだとO列以降が上書きされてしまいます。複数データが含まれる他の項目(列)でも同様の方法で対応できます。


図4 区切り位置の機能を使った列の分割


図5 N列を4つに分割した状態

図6をご覧ください。原資料へのリンクの項目ですが、クリックすると原資料の内容を見ることができます。URLが複数ある場合には、半角セミコロンで連結されています。連結されているとハイパーリンクとして機能しませんので、上記の著者の場合と同様の方法で分割してから原資料へのリンクを活用してください。


図6 原資料へのリンク(複数)

6. データを追加する

最後に、すでにダウンロードしたTSVファイルにデータを追加してみましょう。ここでは、2013年7月2日分のTSVファイルに、2013年7月3日分のデータを追加してみます。

まずは、2013年7月3日分をダウンロードします。

TSVファイルがダウンロードできたら、7月2日分のファイルでデータを追加したい箇所(ここでは、A108セル)を選択し、データタブから、外部データの取り込み(テキストファイル)の機能(図7参照)を使います(追加するときは、必ずタブ区切りを選択)。


図7 外部データの取り込み(テキストファイル)

図8のように、7月3日分のデータが追加されます。あとは、必要のないタイトル行(108行目)を削除したり、データタブから、重複の削除の機能を使って、同一のメタデータで古い方のデータを削除したりして、リストを完成させてみてください。


図8 取込み実行後の画面

7. おわりに

全国書誌(電子書籍・電子雑誌編)のTSVファイルをExcelで開いて加工することで、さまざまな活用ができます。また、TSVファイルの中には、タイトル、著者、出版年等の情報のほかにURLの情報も含んでいますので、リンクをたどり、電子書籍・電子雑誌の本文を見ることもできます。

今回紹介した利用方法は、ごく一部にすぎませんので、ぜひさまざまな方法を試してみてください。

(収集・書誌調整課 書誌サービス係)

[1] メタデータについては、本誌前号の「オンライン資料の収集とメタデータの作成」もご覧ください。
http://dl.ndl.go.jp/view/download/digidepo_8436034_po_2014_1.pdf?contentNo=1, (参照2014-5-13)

[2] 2013年7月2日分は、全国書誌(電子書籍・電子雑誌編)TSVファイルの第1号です。


このページの先頭へ

NDL書誌情報ニュースレター(年4回刊)

ISSN 1882-0468/ISSN-L 1882-0468
2014年2号(通号29号) 2014年6月26日発行

編集・発行 国立国会図書館収集書誌部

〒100-8924 東京都千代田区永田町1-10-1

メールアドレス:bib-newsアットマークエヌディーエルピリオドジーオーピリオドジェーピー(ニュースレター編集担当)