ホーム > 資料の収集 > 科学技術情報整備審議会 > 議事録 > 第3回科学技術情報整備審議会議事録

第3回科学技術情報整備審議会議事録

日時:
平成25年7月25日(木)午後2時から午後4時まで
場所:
国立国会図書館 東京本館総務課第一会議室
出席者:
科学技術情報整備審議会委員 9名
有川節夫委員長、倉田敬子委員長代理、喜連川優委員、塚原修一委員、土屋俊委員、時実象一委員、戸山芳昭委員、中村利雄委員、中村道治委員
(菱山豊委員、松浦祥次郎委員は欠席。)
館側出席者 15名
館長、副館長、総務部長、調査及び立法考査局長、収集書誌部長、利用者サービス部長、電子情報部長、関西館長、国際子ども図書館長、総務部副部長企画課長事務取扱、同部会計課長、収集書誌部主任司書、利用者サービス部副部長サービス企画課長事務取扱、電子情報部副部長電子情報企画課長事務取扱、利用者サービス部科学技術・経済課長
会議次第:
1. 開会
2. 館長挨拶
3. 新委員紹介
4. 幹事異動等報告
5. 報告及び懇談
 (1)第三期科学技術情報整備基本計画の中間総括
 (2)東日本大震災アーカイブ事業の進捗状況
 (3)その他
 (4)懇談
6. 閉会
配付資料:
第3回科学技術情報整備審議会 次第(PDF: 140KB)
(資料1)科学技術情報整備審議会委員及び幹事名簿(平成25年7月25日現在)(PDF: 191KB)
(資料2)(報告1) 第三期科学技術情報整備基本計画の中間総括(PDF: 975KB)
(資料3)(報告2) 東日本大震災アーカイブ事業の進捗状況(PDF: 1.45MB)
(資料4)科学技術振興機構(JST)作成資料(PDF: 2.04MB)
(資料5)国立情報学研究所(NII)作成資料(PDF: 2.23MB)
(参考資料)
科学技術情報整備審議会規則(PDF: 195KB)
科学技術情報整備審議会議事規則(PDF: 187KB)
第三期科学技術情報整備基本計画(PDF: 234KB)
「私たちの使命・目標2012-2016」及び「戦略的目標」(PDF: 240KB)
(机上配付:参考資料)
国立国会図書館東日本大震災アーカイブ「ひなぎく」パンフレット(PDF: 1.20MB)
『国立国会図書館における今後の科学技術情報整備の基本方針に関する提言』(平成23年1月19日 科学技術関係資料整備審議会)(PDF: 2.30MB)

議事録:
1.開会
有川委員長: 第3回科学技術情報整備審議会を始めます。最初に事務局から連絡があります。
川鍋
科学技術・
経済課長:
本日はお忙しい中、御出席くださいましてありがとうございます。本日、菱山豊委員、松浦祥次郎委員は所用のため御欠席、また、中村利雄委員は遅れての御出席という連絡を事前に頂戴しています。本日の資料は、机上に配付しています。配付資料一覧にあります資料と、冊子、パンフレットがお手元にあるかと存じます。資料に不備がございましたら、お知らせください。
委員長: それでは、開会にあたりまして、大滝館長から挨拶があります。
 
2.館長挨拶
大滝館長: 御多忙のところ、第3回科学技術情報整備審議会に御出席いただきまして、誠にありがとうございます。
本日は、平成23年1月の本審議会による『国立国会図書館における今後の科学技術情報整備の基本方針に関する提言』を踏まえて策定いたしました「第三期科学技術情報整備基本計画」(以下、三期計画)の事業実施状況の中間総括について御報告申し上げ、忌憚のない御審議をお願いしたいと存じます。
この三期計画が策定されて以降、日本社会は、未曾有の東日本大震災に遭遇して、被災からの復興という大課題が生じ、様々な社会活動におきまして、これまでにない試練に直面しているところであります。国立国会図書館におきましては、被災直後から特に資料・情報に関連する活動を行い、また、東日本大震災アーカイブの構築を通じまして、大災害のあらゆる記録を集め、伝える活動に取り組んでまいりました。この東日本大震災アーカイブ構築は、昨年の本審議会の席上で御報告申し上げたとおり、三期計画において方向付けられた「知識インフラ」の構築を段階的に進める重要な一環として取り組んでいるところでもございます。この意味で、本日の中間総括には、東日本大震災アーカイブ構築の進捗状況に関する御報告も含めさせていだだきました。
一方、昨年度は、国立国会図書館の関西館開館10周年を迎えることができました。関西館は、国立国会図書館の担う図書館資料の収蔵スペースを長期的に確保するとともに、21世紀の高度情報化社会における情報需要に的確に対応するという、二つの目的をもって建設されました。その開館後は、東京本館、関西館、国際子ども図書館の三つの大型施設が一体として一つの国立国会図書館の使命を果たす体制として順調に発展することができていることは、真に幸いなことと考えております。特に、遠隔複写サービスを通じて、国立国会図書館全体が有する科学技術関係資料の膨大な蓄積を従前よりも便利に利用していただくことなど、これまで一定の実績を示しているところであります。また、関西館開館後の国立国会図書館の新体制のもとで、折からの急速な技術革新を基盤とする電子図書館機能を格段に増強し、利用者サービス面の向上を様々に図ることができていることも、この10年間の成果と考えております。長年にわたり、科学技術情報整備審議会の有川委員長はじめ、委員の皆様方には、日頃から様々に御指導いただいておりますことに、この機会に心から感謝申し上げる次第であります。
本日、委員の皆様からは、今後に国立国会図書館が取り組むべき科学技術情報整備の方向性等について、率直な御意見をいただくなど、活発な御審議をお願い申し上げ、御挨拶させていただきます。
 
3.新委員紹介
委員長: 新しい委員の紹介をお願いします。
川鍋
科学技術・
経済課長:
新たに委員に御就任された先生を紹介します。
文部科学省大臣官房審議官の菱山豊先生、日本原子力研究開発機構理事長の松浦祥次郎先生が委員に御就任くださいました。委員名簿を資料1として配付していますので、御覧ください。
 
4.幹事異動報告
委員長: 幹事の異動の報告をお願いします。
川鍋
科学技術・
経済課長:
当審議会の活動を補佐するために、当館の部局長を幹事に任命しています。当館内の人事異動に伴い、幹事に異動がありましたので報告します。豊田収集書誌部長、山田関西館長が、前回の審議会以降に新たに幹事に任命されました。本日は、幹事のほかに、大滝館長、池本副館長、審議会事務局の職員が出席しています。どうぞよろしくお願いします。
 
5.報告及び懇談
委員長: それでは、報告及び懇談に移ります。本日は、まず三期計画の中間総括と、東日本大震災アーカイブ事業の進捗状況について報告がありまして、それについて議論をします。その後で、最近起こっている大きな動きで国立国会図書館(以下、NDL)とも非常に深く関係することがありますので、科学技術振興機構(以下、JST)の中村(道)委員、国立情報学研究所(以下、NII)の喜連川委員から、話題提供があります。その上で、深い議論をしていきます。よろしくお願いします。
それでは、報告1について、説明をお願いします。
川鍋
科学技術・
経済課長:
(資料2に沿って説明)
委員長: 続いて報告2について、説明をお願いします。
佐藤
電子情報部
副部長:
(資料3に沿って説明)
委員長: 2件の報告がありました。いずれも、「知識インフラ」に関連があるものです。これまでNDLが伝統的に行ってきた図書など文書になったものの他に、いわゆるデータも含めインフラをきちんと整備していくというのが「知識インフラ」の特徴ですが、期せずして、東日本大震災という、一つの大きな事業をやる上での、言葉は妥当ではないと思いますが、実験・実証の場面に遭遇してしまった。そこで「知識インフラ」という目標を掲げたNDLがどこまでできるか、というのが非常に重要だと感じてきました。2件目の報告の最後にありますが、この時期、とにかくコンテンツを残すことが一番大事で、散逸・消滅させることなく残すことができればなんとかなると考えなければならないと思います。例えば、この時代、携帯電話やスマートフォン、タブレットPCなどを使って、個人が動画も含め記録を撮影していることがあるので、呼びかけて集めるものは集めて残しておくフェーズが必要ではないかと思います。そのようなことも含め、とにかく残すことの大事さを感じました。
それでは、この2件の報告につきまして御意見をお願いします。
時実委員: 東日本大震災アーカイブという、短期間に大変良いものを作られて、とても感心しています。これからもコンテンツを集めるなどの努力をされていくと思いますが、同時にここで得た技術やノウハウを使って、国内の様々なアーカイブのネットワークのようなものを構想されるお考えはないのでしょうか。というのは、欧州ではEuropeana、米国ではDigital Public Library of Americaといった、国家規模の非常に大きいアーカイブのネットワークがあります。そういうのを日本でできるのはNDLではないかと思います。
中山
電子情報部長:
「ひなぎく」で使用している技術は、当館が独自に開発した技術ではなく、報告中にもあったように、JST、NII等の関係機関や大学等の研究成果を活用して展開しているものです。そういう意味で、この「ひなぎく」が完成すると、「知識インフラ」に向けた第一歩となると思います。そしてEuropeanaのような形で見せ方、コンテンツの集め方等のシステムというサービスに発展できればと思います。
倉田委員: 東日本大震災アーカイブに関して確認させてください。(資料3)4ページに、収集したデジタルコンテンツが約1,300点、国の機関、自治体等のウェブサイトが約9,100個体とありますが、どう数えるのか難しいことは分かりますが、これは今公開されているという意味なのか、収集したものがこれだけということなのですか。
佐藤
電子情報部
副部長:
(資料3)4ページにあるのは収集したものの総数です。コンテンツで公開しているものは5ページの表に「ネット公開」とあるものです。ウェブサイトは基本的にインターネットで公開されているものですが、これをNDLで収集して更に公開できるかとなると、個人情報が入っているものをいつまでも保存されるのは困るといった配慮を必要とするものがあります。そのため、必ずしも全てが公開できているわけではありません。
倉田委員: 先程、収集されている点数は十分でないという認識とうかがいましたが、誰が考えても、この時期にこの点数というのは少ないと思います。もちろん、点数の数え方によるとは思いますが。やはり国関係ではこれが限界ということでしょうか。
佐藤
電子情報部
副部長:
そのようには考えていません。国の機関で公表しているものはインターネット資料収集保存事業で制度的に収集したウェブサイトにも入っているので、そこから切り出し、公表するという作業を進めています。その一方で、行政機関との間で関係府省連絡会議を立ち上げて、トップダウンの形で収集を進めることにも取り組んでおり、ようやく会議が立ち上がる段階に来ています。このようなアプローチのほか、独立行政法人からのアプローチなど、いろいろな攻め口で更にコンテンツを増やしていこうと考えています。
土屋委員: それはいかにもNDLらしい発想です。今回に関して言えば、広く国民に直接呼び掛けて集めるのも十分可能だったと思います。先ほど有川委員長が言われたように、デジタルデバイスでとった画像などを皆さん持っていたわけです。今は持っているかどうかわかりませんが。ところが、機関ベースでものを考えてしまったのでそういう個人の記録を収集するチャンスが失われてしまった。そういうアプローチがどうしてとれないのでしょうか。行政機関とか自治体だけの問題でなくて国民一人ひとりにとっての問題だったので、国民に資料提供を呼びかけるのは可能でしたし、まだ可能だと思いますが、なぜそういう発想が出てこないのか。きちんと上手に受け口を作っておき送ってもらえばよくて、それは本人が提供したものですから少なくとも本人に関しては個人情報の問題はないわけです。行政機関を通すから個人情報の話がややこしくなるが、本人了承のもとで収集しているものは何の問題もないわけですから。
喜連川委員: 本人以外に、他人が写っていることもあります。
土屋委員: その問題はもちろんあります。けれども、どうして国民一人ひとりの問題について、国民に対して、こういうのを集めていることを伝える努力がなされないのか、不思議な感じがします。
佐藤
電子情報部
副部長:
ウェブサイトにつきましては災害発生後、直ちに集中的な収集を開始し、公の機関については制度的に収集しているのはもちろんですが、民間が発信したウェブサイトは法的に収集する権限がないので、Internet Archiveという米国の団体と連携して収集してもらうことを行っています。自ら民間に呼びかけることは体制の問題もあって議論できなかったという面はあると思います。
大滝館長: 土屋委員から御指摘があった点について補足しますと、(資料3)9ページ目の表14、15番にありますように、Yahoo! JAPAN、Googleとの連携をとって一般からの投稿に対するアーカイビングが行われており、国民がアクセスできています。特にYahoo!についてはアーカイブされている写真等を今後どのように保持していくかという問題があり、館にこのコレクションを全部移行して館の方で提供の仕組みを作るといった形で一部着手していることもあります。今後の展開の中で今御指摘があったような点においては、更に考えながらすすめたいと思います。専門家のお話では、これまでの様々な経験から、大体5年ぐらいで資料がなくなる、特に震災から2年以上が経過したこの時期から急速になくなるという知見があります。したがって、これから1、2年が保存する取組において大きな節目になると思います。そういう問題意識を持ち、連携しながら進めていきたいと思っています。
委員長: 非常に重要な問題提起をしてくださいました。最初に申し上げましたが、コンテンツを残すということは将来に対して過去を残すことです。消滅してしまったら、悲惨な地震・津波の記録が残らないことになります。そこで考えられるのは、収集することと公開することとを区別することです。公開をしようとすると著作権などの問題が生じますが、貴重なデータや資料を散逸させない、とにかく収集することは可能ではないでしょうか。オープンアクセスや電子ジャーナルにもそういうコンセプトがあります。それに似た発想と捉えてよいと思います。
それから、いろいろなデータベースに関して、(資料3)8、9ページ辺りにある他の研究機関等が構築されたものは大体東日本大震災に関係していることが分かります。ところが10ページにあるNDLの表を見ますと、どこにも震災に関係するものがありません。普通の資料と何が違うのかという感じがします。東日本大震災アーカイブを構築しているのですから、もう少し違う扱い方があるのではないかと思います。
佐藤
電子情報部
副部長:
(資料3)10ページについて補足します。確かに、単なる当館所蔵資料の目録を出しているように見えますが、ここに出ている検索可能件数は、一番下の注記「※」に書いてあるように、いずれも震災関連のデータをキーワード等で抽出して登録しているもので、震災関連の項目に関しての検索可能件数です。ですから、館全体としての蔵書目録の件数はこれよりも大分多いのですが、そこから絞り込んだ数字ということです。
委員長: 確かに、注記されていますが、事業として東日本大震災アーカイブをやるからには、それも表に出すべきではないでしょうか。ちゃんと書いてあるから、キーワードで抽出できるからいいだろう、とかそういうことではないと思います。
佐藤
電子情報部
副部長:
申し訳ありません。その辺の見せ方についても更に検討、改善していきたいと思います。
土屋委員: 抽出済みの数がこれですか。
佐藤
電子情報部
副部長:
「ひなぎく」で検索できる件数ということです。
委員長: この大きなデータベースとしてこうあるんだというように考えているのですね。
大滝館長: 「ひなぎく」を大震災の記録に特化したデータベースと考えると、優先的に検索結果が出る語についてはノイズを少なくしたいという意図があります。つまり、雑誌記事索引も含めたNDL-OPACを全部連携させるのではなく、検索結果として出てくるものについては一定の質を絞り込んで、様々な問題意識に、ある程度高品質で合うような作業をしているということです。確かに、こういうものが検索できるデータベースということと、大震災の記録ということとの連関性を利用者が理解しやすい表現や、どういう利便性があるかについて理解を進めるような努力は、まだ必要であると思います。
委員長: 一頃ポータルサイトを構築するという考え方に対して、検索エンジンがあるから特になくていいという言い方がされていました。誤解があるのかもしれませんが、「ひなぎく」で検索はできている、ということにとどまっています。それでよいのでしょうか。
土屋委員: 最初の倉田委員の御質問に戻りますが、(資料3)4ページの検索対象総件数と収集したコンテンツの桁の違いがこれだけありながら、最後のページでとにかく残すと書いてあるのは無謀ではないか。
委員長: 検索対象総件数241万件の中には(資料3)7ページの日本原子力研究開発機構の116万件が含まれています。
土屋委員: (資料3)7、8、9、10ページの検索可能件数を全部足すと240万件なのでしょうか。
佐藤
電子情報部
副部長:
そうです。
土屋委員: この検索できるデータベースと、NDLがコンテンツを収集している話とは独立で動いています。どのくらいコンテンツが収集できているかというと、先程の話では、せいぜい1万件とのこと。1万の一つずつに1メタデータがついていたとすると、240万分の1万だけコンテンツを持っていることになります。それで、とにかくコンテンツを残すとは、言ってもいいですが、今まで何をしていたのかと問われた時にどう答えるのでしょうか。
喜連川委員: ですが、別にNDLが持っている必要はないわけですから。NDLはそのアドヴォカシーを啓蒙・普及されて、NDL以外のステークホルダーが持っていても構わないと思います。
土屋委員: 構わない部分もありますが、先程館長が言われた、Yahoo! JAPANが持っているものはNDLで保存するといったことに関連する話で、海外のGoogleやハーバード大学等が持っているコンテンツの場合はどうなるのか、という問題は当然出てきます。そういうものもNDLで持つべきだという議論も十分ありえます。私個人は喜連川委員に近い考え方ですが、しかし、コンテンツを自分で持っているべきという議論は当然あると思います。コンテンツそのものを自分のところに置いておくことについての方針、どうお考えかお聞きした上で、とにかくコンテンツを残すということの意味は何かをうかがいたいと思います。
委員長: ネット上にあるコンテンツは、どこかが保存しておいてくれていると考えることはできます。さっき言いましたのは、個人が自分のスマートフォンや携帯で、ネットに出ても構わない、非常に大変なものを音声も含めて撮影していることがあるかもしれない。そういうものは、携帯の機種が変わったら大体一緒に捨てられてしまいます。そのように消滅してしまうことがもったいない。(資料3の)最後のまとめ方が「とにかくコンテンツを残す」でしたので、こういったことを発言したわけです。
NDLがきちんと収集します、勝手に使ったりはしません、本当に大事な時になくなってしまうのが問題だから責任もって集めます、というメッセージを出せば、「これはNDLに送っておこう」と反応される人が相当いるのではないかと思います。そういう感覚でインターネット社会は展開しているのだと思います。今後東日本大震災に関しては、これから3年目にかかるので、そういった取組の仕方があるのではという気がします。なぜこのようなことを言うかというと、「知識インフラ」という新しい基軸を出した直後に東日本大震災が起き、新しい基軸を立てているので、それらしいこと、他ではとてもやれなかったことを東日本大震災アーカイブでする必要があるのではないか、と思うからです。紙媒体はいろいろな形で複本や複製などがあり、震災などが起きてもどこかに保存されてきたと思いますが、デジタルデータに関してはそういうことがまず期待できない。そこに新しいNDLの使命、出番があると感じるので、申し上げました。NDLは皆さんに頼りにされていると思いますので、お考えいただければと思います。
大滝館長: 公開が権利関係やプライバシーの問題で難しいとすれば、とにかく収集をし、公開は長い目で考えていくという手法が必要ではないかという御指摘でしたが、まさに我々の視点も同じです。そこにプラスして、所在の追求も行っています。とにかく収集する、その中で、Yahoo!の巨大な写真データベースのように、持ち切れなくなった段階で館に担わせてください、という働きかけもしています。公開・二次利用の問題では、例えば津波の映像は当事者からすれば記憶が生々しくよみがえるのでやめてほしいという声も聞いていますし、国として記録は残し、これから長く活用できるように保存するという方法が一番現実的ではないかと思います。
委員長: 多分そうだろうと思いましたが、今日の報告からは読み取ることがしにくいように感じました。
報告1に関しては何かありませんか。
土屋委員: 出版物のデジタル化と提供、図書館等への送信に関して、事実関係がよく分からないので質問します。大正新脩大蔵経のデジタル提供の停止問題について、これから公開停止を要求する人がたくさん出てきた場合、要求されたらすぐ停止するのでしょうか。古い資料で著作権が切れたものは一般に公開することもあるわけですが、他方で絶版等に関して図書館送信するのも「嫌だ」と言われたら止めるという原則なのでしょうか。今回は著作権の保護期間が切れたものについて起きたという明確な線があるにも関わらず、商売など理由は何であれ、誰かが止めてと言ったから止めた。方針として、これから止めて欲しいという人が出てきたら提供を止めるのでしょうか。
佐藤
電子情報部
副部長:
大正新脩大蔵経は、確かに出版社側から御指摘があり、現在インターネット提供を止めている状況です。しかし、今後ずっとインターネット提供を止めると決めたわけではありません。土屋委員の御指摘の通り、法的には著作権の期限は切れているので提供することについて何ら問題はないものです。一方で、商業出版に対する配慮が必要なのかどうか、この機会にきちんと考えてみるべきではないかと思い、検討するために一時インターネット提供を休止しています。現在、館内で検討体を作り、急いで検討を行っています。方針策定にあたっては、外部有識者の方の意見も取り入れて、近いうちに方針を示し、公開の可否に関わらず結果を公表しようと考えています。
土屋委員: 同じく絶版資料等の図書館に対するデジタル化データの提供も、幾つかの入手可能性チェックをクリアすれば、誰が何と言おうと提供するのでしょうか。
佐藤
電子情報部
副部長:
図書館送信をするものは著作権保護期間中のコンテンツで、先程の新脩大蔵経は著作権保護期間が切れているものなので、分けて考える必要があります。図書館送信についても除外手続があり、基準を設けています。現在出版流通していることが申し出によって明らかになったもの、あるいは著作権管理団体が管理していることが明らかになったもの、あるいは著作者から申し出があったもの、という基準を設けています。その基準にあたらないものは図書館送信します。
土屋委員: 当然送信するということですか。
佐藤
電子情報部
副部長:
そういう対応をします。
時実委員: 今の話は非常に大事な問題です。もし商業的な利用をするから公開を差し止めるとなると、例えば、青空文庫では、よいものはほとんど全部が駄目になってしまいます。例えば夏目漱石や森鴎外などはいろいろな文庫で出版されていて、結構売れています。吉川英治は今年著作権が切れて、早速ある出版社で文庫を売ってそれなりに商売になっていますが、青空文庫は無料で提供しています。そういう活動を阻害する恐れが出てくるので、かなり慎重でなければならないと思います。ここはそれを議論する場所ではありませんが、有識者と密室で考えるよりは、パブリックコメントをとるくらいのことを考えてもよいのではないかと思います。
委員長: 相当大きな問題でここでは処理し難いのですが、ただ、こうして議論を進め、問題の所在を明らかにしたことによって迅速に問題が解決したこともありますので、問題提起をすることは極めて大事だと思います。
時実委員: (資料2)10、11ページに国内の学術出版の収集について、また、14ページに学会の出版物に関する学会宛てのアンケートが出ています。これに関連して、NDLのインターネット資料収集保存事業(以下、WARP)において、タイトル単位で数えると学術系の定期刊行物が2千近く載っており、小さいものもいっぱいあり、企業の技報などもありますが、これを何年かおきに見ると、URLがすぐに変わっていくことが分かります。極端な場合は次の収集時にはなく、どんどんリンク切れしています。今WARPは基本的にリンクで提供しているわけですが、やっぱりこれは急いで収集すべきと思います。ここに載っている多くの物は大体NDLの電子収集の基準に合うものだと思いますので、なるべく早く収集して、WARPからNDLの蔵書にリンクするような形にすることが望ましいと思います。
土屋委員: DOIの普及もありますが。
委員長: これは課題提起ですね。この後の話とも関係がありますので、今の件に関してお答えいただきましたら次に進みたいと思います。
中山
電子情報部長:
WARPは電子雑誌、コンテンツを収集している仕組みですので、今言われたのはDnaviではないでしょうか。
時実委員: WARPではなく、Dnaviでした。
中山
電子情報部長:
Dnaviは、データベースの入口を指している仕組みなので、アドレスが変わった時に確認ができればリンク先を見直すことは常時行っています。
委員長: 報告の1についていろいろな御意見はあると思いますが、中村(道)委員と喜連川委員に御報告をお願いしまして、そのあと、議論します。
中村道治委員: (資料4)「OA(オープンアクセス)の流れと震災復興プロジェクトについて」を御覧ください。2ページにありますように、世界のオープン化の流れが急に加速してきました。去年の今頃は、専ら査読つきの科学技術ジャーナルに対するオープンアクセスの議論をしていましたが、ここへきて研究データに関しても急に議論が活発になってきました。3ページにありますように、論文のオープンアクセス化は、既に主要国の主要ファンディング機関が各々の方針を決めて具体的な取組を始めています。国によって少しずつニュアンスが違いますが、総じて言えることは、やはり各国ともファンディング機関がリードしてオープンアクセス化を実現するという動きです。4ページにありますように、日本国内でも去年の7月、有川委員長のもとで文部科学省 科学技術・学術審議会 研究環境基盤部会 学術情報基盤作業部会で審議があり、研究成果のオープンアクセス推進を推奨するという方針が出されました。去年の12月に、Global Research Council(以下、GRC)という世界のファンディング機関の長の会合のアジア太平洋地域会合で、日本学術振興会(以下、JSPS)とJSTがこの問題を取り上げて、各国と議論しました。今年の4月にJSTは、「オープンアクセスに関するJSTの方針」を発表しました。18ページにそのコピーがありますが、一言で申しますと、「JSTはこれからオープンアクセス化を支持します」ということです。JSTのファンディングによる研究成果を電子ジャーナルで出版するときは、1年以内に各機関のリポジトリに載せてオープン化することを強くお願いするという方針です。それを今年の5月のGRC年次総会でも各国に紹介しましたので、やっと日本も世界の先進国の流れにキャッチアップしてきたという認識を持ってもらえたと思います。日本国内ではJSPSの方が圧倒的にたくさん論文を出していますが、いろいろな事情があって、まだ方針を明確にしていないと聞いています。そこでJSTが少し先を走って日本の流れを作れないものかと思っています。データについても同様の動きでして、各国がだいたい方針を決めました。これからどうするかは、大変だなあというのが今年5月の議論の状況でしたが、6ページにありますように、6月にG8の科学大臣及びアカデミー会長会合で、研究データのオープン化に関する共同声明文が出ました。各国でこの方向に沿ってこれから具体的にいろいろ取り組むということで、想定していたよりも全体の動きが加速されるのではないかと思っています。7ページから順に説明しますが、JSTでは、オープンアクセスについては基本的にJ-STAGEにできる限り論文を出してもらう、あるいはジャーナルをJ-STAGEの上で運用してもらいオープンアクセスにするということを既に始めています。他のところに出されたものも、今後はオープンアクセスをお願いします。8ページにある研究データについては、まさにこれからの議論であり、日本全体の研究データをどういう形で集めるか、あるいはそれをオープンにするかは、まだ議論が十分に詰まってないと私は理解しています。今オープンデータとして行っているのは、バイオサイエンスデータベースセンター(NBDC)で、農林水産省、文部科学省、厚生労働省、経済産業省が持っているバイオのデータを統合して横断的に検索等ができるようにしていく、日々充実させていくというものです。物質材料関係については、MatNaviを物質・材料研究機構(NIMS)が運用し、地球環境関係についてはデータ統合・解析システム(DIAS)が、といったように、日本国内で既に始まっているものもあります。もっと広く、より付加的なものを、分野ごとに他の分野も含めて、これからどうするかを議論していかなければならないと思っています。来年の5月のGRCでは、もう一度オープンアクセスデータについてさらに議論し、各国の進捗状況を報告することになっています。
2番目の話は、先ほどの「ひなぎく」に関係します。我々は従来の事業モデルを、単に情報を一方的に提供するというクローズドモデルから、我々がオープンモデルと呼んでいる「情報循環事業」で行っていきたいと考えています。その例として、NDLの「ひなぎく」もありますし、「みちのく震録伝」等との連携もしながら、震災関係のアーカイブについて、タグ付けやメタデータの取り方などの検討を行い、ツール化しようとしています。11ページは、実際の被災状況の把握から防災計画作成に持っていくときに、この場合の写真にどういうタグ付けが必要か、どういう方法にするか、試行錯誤しているところです。12ページは、長期的に見て、いくつかステップが必要ということを指摘しており、人手による分類プラス機械学習、あるいは中程度の人手による分類と機械学習から、少しずつ人手を減らしていって、その間に機械学習を重ねていくということがあります。最終的には専門家等が、精緻に分類するということをオープンに進めて、よりタグ付け等を精緻なものにするというアプローチをすることになると思います。具体的には、13ページにあるように、こういう写真の場合にこの関係論文につなぐなど、他のデータとの連携がとれるようにタグ付けするといったことを、試行錯誤して行っています。14ページ以降は今後の展開です。これは願望の話で、まだ影も形もありません。今後いろいろなデータを持つようになった場合に、画像等にタグ付けして、それを様々な論文や特許、研究者等とも紐づけることによって、研究者が研究する際に非常に役立つのではないかと期待しています。それを基にしてまた次のより高いレベルのデータの整理の仕方、タグの付け方、メタデータの与え方等に反映していく、というのをオープンな環境でしようと考えています。そこでJSTは、構築してきたシソーラスを使うことによって、いろいろな分野との連携というのも期待できるのではないか、こういうことをJSTの付加価値にできるのではないかと思っています。16ページにあるのは今後のスケジュールです。マイルストーンを含め工程表的なものです。平成25年度は、震災画像の自動タグ付けシステムの開発ということを進めてプロトタイピングをしています。それから学会との連携やオープンモデルへのタグ付けを行っています。平成26年度以降は、研究者向けの専門的なアーカイブの在り方の検討を始めます。今年度中に、最初のプロトタイプをNDLにお持ちして、いろいろと評価して頂くことができるかと思っています。
委員長: ありがとうございました。それでは喜連川委員お願いします。
喜連川委員: (資料5に沿って説明)NIIには、原則として二つのフィーチャーがあります。情報学の基礎研究を行うことと同時にネットワークを運用していること、この二つですが、後者が、非常に大きな部分を占めています。今、NIIは700大学全部を接続するネットワークを運用しており、情報通信研究機構(NICT)はJapan Gigabit Network(JGN)などを実験の場としておりますが、現業には使っておられませんのに対しまして、NIIは大学間の全てのサイエンスの情報の流れを作るサービスをしている点が大きな特徴です。
(資料5;4ページ)これはアタカマの天文台の図です。天文台そのものもさることながら、天文台から出てくる観測データに意味があります。このデータは我々がオペレートしていますネットワーク経由で伝送されてきます。「知識インフラ」につきましては、先ほどのNDLの報告でもデータに対しても「知識インフラ」を考えていくというお話がありましたので、私どものやっている『ビッグデータ』の感覚をお話しますと(資料5;5ページ)、結局、サイエンスの基盤は、アタカマに行って実験をしている研究者はとても少なく、欧州原子核研究機構(CERN)に行っている研究者も多くはなく、実際はデータを前にして研究をする研究者が大多数という状況となっています。このデータ基盤を作ることが要だとはみな分かっていますが、実はなかなかしんどいところです。先ほど中村(道)委員が地球環境ではDIASとおっしゃいましたが、霞が関で出てくる資料には、DIASかNBDCの二つが非常に多くなっています。私どもが取り組んでいるDIASがNBDCと違う点は、DIASはノンポータルということです。つまり、いろいろなところにリンクを張って横断検索するのがNBDCですが、DIASはそういうことを一切やっていません。全部データを我々のところに持ってくるようにしています。アジア圏の各国から過去20年分のいろんな降水データ等が来ます。アフリカからも来ます。なぜデータが来るかというと、こちらのデータベースが強いからです。ここに来て解析をさせて欲しいということでデータを集める、というモデルになっています。完全に世界一極のオンリーワンになりました。大きなデータベース、そのオントロジーから何から、ありとあらゆることをしなければならないので大変ですが、現在だいたい15PBくらいの規模です。(資料5;9ページ)今年度末の補正で25PBくらいまで規模拡大の予定となっています。東京は電力が不足していますので、NII千葉分館に、あるいは北海道にも、設置してしのいでおります。データの基盤というのは1年や2年くらいでは到底できないのが実情です。(資料5;10ページ)このように長年かけて、相当涙ぐましい努力をしていかなければならない次第です。(資料5;11)別の事例としまして、NDLでもインターネットアーカイブ的なことをされていますが、我々も同じようなことをしてきて12、3年続けて参りまして、現時点ではアジア圏では最大級となっており、容量は1PBを超えるという状態です。Twitterは100億つぶやき以上集めています。ここで申し上げたいことは、データの維持は大変手間がかかりしんどいということです。(資料5;14ページ)ビッグデータの優先領域について、米国国立科学財団(NSF)は、7領域を挙げています。環境、ヘルス、災害からの回復力、マニュファクチュアリング、サイバースペース、輸送とエネルギー、教育の七つですが、いずれもビッグデータを使うことで大きく世界を変える、いわゆるインターディシプリナリーではなくトランスディシプリナリーな世界に変えていくことが期待されております。(資料5;15ページ)ポイントを纏めますと、ビッグデータは知識インフラ上極めて重要ですが、とにかく維持が大変だということです。また、全てがデジタル化されているということで、先進的なITをどうやって駆使していくか、ここが本当の生命線になると言えます。
(資料5;16ページ)現状のNDLのサービスがあるわけですが、(資料5;17ページ)NDLラボ、これのウェブページはもう少しアクセスしやすくする必要がありますが、このNDLラボ事業の成果をNDLのサービスに反映させるといった流れを作るべきと考えます。長期にわたり一生懸命に仕様書を作成し、外注して作ってもできた頃には世の中的には普通になっているという話をお伺いしましたが、ITシステムでは、まあそうだろうなという気がします。今のテクノロジーを用いてNDLがどうあるべきかを考える際に、NIIが底辺を支えるという形で御協力できる部分はあると思います。また、NDLの一番大きな魅力ポイントはNDL自身がビッグデータを持っているということです。これをプレイグラウンドに出して、いろいろな研究者を呼び寄せることについても、NIIがお世話をすることが可能なのではないかと思います。
ここからはNIIの事業についてです(資料5;CSIとNIのコンテンツ事業2ページ)。Cyber Science Infrastructure(CSI)の中でいろいろしているうちの一つが学術コンテンツ基盤で、NDLにも御支援を頂いております。学術情報基盤の構築はこうあるべきというより、インクリメンタルに作っていくのでなかなかきれいに整理はできにくいというのが現実ではないかと思います。目録所在情報サービスについては、NACSISというNIIの前の組織からずっと努力をしているので、登録機関は約1,300あり、図書館にとってなくてはならないシステムを運用しています。ただ、最近デジタル化が進んでいますので、図書館でのコピーは減っております。CiNii Articlesに関しましては、オープンして以来どんどん伸びていますし、CiNii Booksも同様の状況です。KAKENについては、どちらかというとJSTよりもJSPSに関係がありますが、年間2,000億の科研費のどういった成果がどの論文につながっているのか、ということを管理しているので、国力をこれで表すことができる貴重な情報となっております。先ほど中村(道)委員よりオープンアクセスというお話がありましたが、私はオープンアクセスに関しては、昨日の文部科学省の学術情報委員会でも、したたかな戦略をとるべきだ、という発言をしています。現状では、ファンディング機関からみたオープンアクセスと、図書館が感じているオープンアクセスというのは、相当意識が違います。NIIはその中間的なところ、つまりそれぞれの研究者が自身でオープンにするところを担っています。機関リポジトリは、学位論文のインターネット公開がドライバになっていますが、NIIは文部科学省からの御指導を受ける前から推進しており、今は350の機関がNIIによるリポジトリを持っています。年間億単位の予算で、いろいろな機関のリポジトリの構築を促してきました。その間オープン化を進めるに当たっては、著者の意志に従って研究成果をオープンにしてきたということがあります。世界の機関リポジトリの構築数について(資料5;CSIとNIのコンテンツ事業10ページ)、この統計はやや古いため、日本は4番目ですが、実質的には3番目というところまで来ています。コンテンツとしては、学術雑誌論文や紀要論文が半分くらいを占めています。リポジトリに登録されている数は直線的に増えています。JAIRO Cloudでは、リポジトリを運用することが荷が重いという大学に、NIIの「WEKO」というオープンソースのプログラムを使って簡単に機関リポジトリを作れるようにしています。博士論文については、NDLと連携して、機関リポジトリの主要なコンテンツである博士論文を我々のところから連携アクセスできるようにしていきます。国際的な立場ではSPARC Japanというものを運用しており、中村(道)委員からお話があったDOI付与などもしています。大学図書館との連携活動体制について(資料5;CSIとNIのコンテンツ事業17ページ)、ここがファンディング機関と図書館との非常に大きな物の見方の違いだと思いますが、我々は大学図書館コンソーシアム連合運営委員会(JUSTICE)という活動を主催しておりまして、商用電子ジャーナルとどのように価格交渉をしてゆくかというのが一番大きな課題となっております。東日本大震災アーカイブに関しましては、NIIはネットワークを運用しなくてはなりませんでしたので、言わばJRやNTTと同じようなインフラ屋としての立場になりますので、コンテンツの収集よりもネットワークの維持に注力せざるを得ない状況でした。個人的には、日本水産学会や海洋学会が持っている、例えば福島原発の前を海中ロボットが動いていく映像などのポータルを運営しております。倉田委員の御指摘のように、まだまだいろいろ、コンテンツは山のようにあるのではないかと感じる次第ですがNIIとしましても情報技術に関して可能な限り御支援致したく思います。
委員長: ありがとうございました。それでは、もうお一方、三期計画のもとになりました提言を部会長としてまとめてくださった倉田委員に一言お願いします。
倉田委員: 今の中村(道)委員、喜連川委員の御発表を聞いて、前に出した提言では先はあまり読めていなかったということと、大きな方向性としてはやはりこれで進めるしかないのではないか、ということの両面を感じました。先ほどのオープンデータの話は、私も外部の動きがすごく速いということをひしひしと感じています。その一方で、私が調査をしていると、研究者はすごく保守的で、簡単に動きそうもないとも感じています。そんな簡単にはいかない部分があるのと同時に、方向性としては、研究、学術情報の基本として、ある程度自由な利活用がなければ先に進まないという部分があるという私の思いは変わりません。そこを、国の機関が、どういう形でアプローチしていくかが重要であると思います。NIIの事業やJSTの事業で、NDLではできない部分は多々あると思います。それならば、NDLができることを、今までの考え方とは違ってもよいので、あえて踏み出してほしいと思います。ただ、それがないからNDLだったといえるのかもしれないですし、基本はぶれないでほしい、基礎的な部分として支えてほしいという思いはやはりあります。余所では、新しいことをしていきたいのでそこまでできないというときに、NDLは最後に何かを持っていてくれる、何かをしていてくれるという安心感は欲しい、というのはあります。しかし、それだけでよいのか、という思いがあります。デジタルの動きは印刷物の世界とは感覚が違うというのはすごく大きいので、その感覚の違いに合った形での計画を、全部は無理でも、一部でもよいので、何か考えてほしいと思います。その意味では、先ほどの研究者との共同研究は、以前に御提案を聞いた時には非常に期待しましたが、今は私の目から見てもあまり実質的に動いてない感じがするので、どなたかと個別にやるのではなく、この際広く何かできないかという気がします。成果を期待するというより、もっとNDLが変わったという印象が与えられるような試みを、何か一つでもしてみると面白いのではないかと思います。
委員長: 非常に大事な御指摘をしてくださいました。NDLは変わらないということは非常に大事ですが、一方ではどんどん変わっている、その二面性が常に求められると思います。提言の「知識インフラ」ではかなり大胆なことを言っていました。日本中、世界中から出てくる研究データを、単にアーカイブするだけではなく、組織化して、そこから知識と関連付けるといったようなことで、非常にアンビシャスであったことは確かです。先ほどの中村(道)委員のお話にあったように、ジャーナル関係に関してはオープンアクセスが長いこと言われていたのですが、最近データに関してオープンデータが言われるようになった。そのデータを作るために、ものすごくお金もかかるという状況で、オープンにしてシェアする以外にないというのが一方ではあると思います。それに対して、人文系の古い歴史上のものを研究している先生方からすると、自分が一所懸命集めたデータをオープンにするわけにはいかない。資料自体も自分が研究するまでは見せたくないという文化がある中でデータをオープンにすることはありえないだろうという、そのくらい両方に振れるのだろうと思います。
しかし、先ほど中村(道)委員のお話にもあったように、今年6月のG8でこういう問題が議論されるというのは、ものすごく速いペースで進んでいるということです。ビッグデータは喜連川委員が詳しいですが、一般に言われるようになったのは去年の3月29日のオバマ大統領の「ビッグデータ研究開発イニシアティブ」からで、それから一年と少ししか経っていないのにこのような状況です。この場では先ほどから、ビッグデータについてかなりアカデミックにお話してくださいましたが、普通の世界では、ビッグデータというのは、昔データマイニングをしていた時のようにビジネスの場面で使われることが非常に多いわけです。ですので、中村(道)委員はビッグデータという言葉はあえて使われなかったのだと思いました。
歴史的にみますと、JSTは日本科学技術情報センター(以下、JICST)との統合といった歴史を持っています。皆さんあまりご存じないかもしれませんが、JICSTでは抄録集の発行や、文献データベースのサービスを一生懸命行っていたわけです。今はファンディング機関的なところが目立つのかもしれませんが。NIIは、先ほど喜連川委員が言われたように、NACSIS時代を経て今日があるわけです。そういう意味では、図書であれネットワークであれ、科学技術情報の流通も含めて言うと、文字通りインフラをきちんと押さえたうえで成り立っていて、それぞれ変化しながら来ています。このほか、国の機関ではJSPSがあります。JSPSは科研費などのファンディングを行っていますが、ジャーナルと論文のオープンアクセスについては、JSPSがもっと踏み込まなければならない面があると思います。先ほど中村(道)委員から言及がありました、文部科学省の学術情報基盤作業部会においても、私からそういったことも言いましたし、研究費部会にも投げかけて、研究費部会からJSPSに言ってもらうという動きもしました。オープンアクセスに関しては、いろんな問題があるとのことで、JSTの迅速な動きに比べると動きが遅いように見えますが、JSPSでもそういった動きは認識しているようで、いろいろ変わってくるのではという感触は受けています。
したがって、データもそうですが、ジャーナルに関するオープンアクセスについても、新しい展開になっていくと思います。変わっていかなければ、このインターネット社会、ICTがここまで進歩した時代にふさわしくないのではないかということは皆さん共通にお持ちだと思います。それとNDLがどう関わっていくのかは、無防備に手を広げたら何もできないかもしれませんが、うまい機能の仕方というのがあるのではないかと思います。どう見つけていくかというのは普通の発想では出てこないと思いますが、倉田委員の御指摘のように、面白い、大胆な仕掛けも含めて考えるのが必要ではないかと私も感じています。
今までのことを少し関連付ける必要があろうと思って、お話しました。御意見ありますか。
土屋委員: 三期計画の「1(3)国立国会図書館の役割と計画の範囲」の第2段落に、NDLが「知識インフラ」推進の中核機関という位置付けをされて、これまで取り組んできた電子図書館事業を発展させ云々するとともに、「知識インフラ」構築のため関係機関との協議の場の形成に向けた働きかけと調整を行う必要がある、という二つのことが書かれていると思います。今日うかがった話は、基本的には電子図書館事業の延長上の話が非常に多かったという感じがします。NDL一館が所蔵したり、収集したりするものの限界というのは明らかで、かつ、「知識インフラ」構築といった場合に、先ほども喜連川委員がおっしゃったように、ネットワーク全体がインフラとして機能しないと意味がないわけです。それをどこか一箇所に集めておくというのは便利なのかもしれないが、それはそれで使いにくいのかもしれない。そうすると、日本における知識のネットワークが支えているところで関与できるところが協力していかないことにはどうしようもないと思うのですが、その協力関係における重要な働きかけと調整の拠点になるような感じのことが書かれているのに、何もしていないという印象を持ちます。ですから、例えば海外の学術雑誌を購入するお金がなくなってどんどん切っているといった話がある中で、国全体としてどうするのかという問題に対して、どうアプローチするかといったことを、是非、関係機関で検討するきっかけを作ってほしい。JST、NII、NDLの三機関の定期的な協議というのが、いつしか不定期になり、そして途絶えたという噂も聞きます。途絶えてなくて単に止まっているだけだという話も聞きますが。
福士利用者サービス部長: 業務連絡会と定期懇談会が今もあります。
土屋委員: JST前理事長、NII前所長、NDL前館長でしていたことがあったように記憶しています。
喜連川委員: 知らなかった。
佐藤電子情報副部長: ありました。
土屋委員: NDL自身が何をするかということ以上に、協力関係の核になるという役割を持ちうると思いますし、皆さんNDLに協力するとおっしゃっているので、折角この三期計画を立てた中で、電子図書館事業の発展形態を超えた、日本における「知識インフラ」の構築の拠点になるような、単なる自分でできることだけではなくて、みんなを連携させるためにできるような、そういう端緒を進めてほしいと思います。
委員長: 冒頭から何回も言っているように、「知識インフラ」という言葉は非常に新鮮な感じで出てきましたが、その後から、クラウド、ビッグデータ、という言葉がどんどん出てきました。そのくらい変化が速いことを考えなければなりません。
また、前政権の時の補正予算で、NDLのデジタル化に関して相当な額のお金がつき、その結果として、学位論文もかなりデジタル化しました。結果的には著作権処理等が確認できてインターネット公開できたのは1割程度だったと記憶していますが。そういった経験を踏まえたうえで、二次的なこととしては、NIIを中心に大学は機関リポジトリ構築の努力をしてきたわけです。一方で世界の流れもあり、極めて例外的に、中央教育審議会に大臣から諮問があってすぐ、今年4月から学位論文はインターネット公開を原則とすることになりました。これは際立った成果だと思います。NDLが過去の学位論文に関してデジタル化を進めようとすると大規模デジタル化の時と同じように大変なことになりますが、これから先については自動的にその問題からは解放されることになったわけです。それはこの審議会での議論や、実際の大変な御苦労が実を結んだ一例であると思います。そういったポジティブな面もあるので、先ほど土屋委員や他の方が言われたように、NDLがこの時代に何をしなければならないのかを考えていくことが必要です。「知識インフラ」を三期計画に入れていますが、NDLだけが全体をまとめて面倒をみることができると思うこと自体がおかしいという状況になっていますので、その中でNDLらしい機能を考えていくのは、大変だとは思いますが本当にやりがいのある仕事ではないかと思います。
時間がなくなりましたが、最後にこれだけは言っておきたいという事はありますか。
喜連川委員: 有川委員長が言われたように、動きがすごく速い。2年前はそうでもなかったのですが、今はもうどこも「データは出さない」というムードになっています。つまり、今までビッグデータの価値を認識しているところは、企業体を含めほとんどなかったのですが、今はもうデータが全てだということが意識の上の方に来ています。その中で、オープン化の戦略について、国益のレベルで、どうするかということをもう一回丁寧に考えていく必要があるのではないかと思います。つまり、何でもオープンにするのは許されないということもあるということです。そこを真剣に議論することも、今後我が国にとって非常に重要になってくると思います。NDLがその音頭をとられれば、この国の中核機関として非常に重要な役割を果たせるのではないかと思います。
中村利雄委員: TPPでも、国境を越えたデータのフローやビッグデータについて議論をしようとしているそうです。特に、米国の企業群は非常に関心を持っていて、サーバの設置を義務付ける、自分が持っているデータは自分のところからしか出さないということだと思うのですが、そういうことが議論されているそうです。
中村道治委員: みんなが世界中で同じような実験をして同じようなデータを取っています。どこまでのデータが取れていてどこまでのデータが取れていないと分かれば、その先のことをすればよい。そうして研究開発の効率を上げようというところから議論が始まります。JSTも、日本もお金がないので、それに対して反論のしようはありません。他方で、喜連川委員が言われたようなことをみんな思っています。今年10月にアジアのファンディング機関の会議でこの議論をしなければならなくて、来年9月にはグローバルな会議で議論しなければならないので、是非先生方のお知恵をいただきたいです。
委員長: 本日は時間が来たので終わらなければなりません。本当に大事な御指摘・御認識を示してくださいました。非常に有意義な議論ができたと感じています。ありがとうございました。

このページの先頭へ