国立国会図書館電子図書館推進会議報告書
5. 電子図書館システムの技術的課題
5.1. 利用者にとって使いやすいという観点
5.1.1. 情報源の網羅性、透過性、信頼性
情報をディジタル化することによりネットワークを介した流通性が高まると、利用者は、豊富な情報源にアクセスして並列横断的な検索をすることが可能になる。より多くの情報を収集することは、国立国会図書館に求められている資料の網羅性という観点からも重要である。そのために各図書館の電子化資料(二次情報を含む)規格や情報通信手順の統一、あるいは相互運用性の確保を情報通信基盤として整備する必要がある。特に、標準化/相互運用性は図書館内外の情報を同様の手順で操作可能にする透過性を確保するために重要な課題となっている。OPAC間の相互接続に用いられるZ39.50はその一例である。なお、 WWWのようにネットワーク上で出版される情報は、変化・消滅が激しいため、時間情報(タイム・スタンプ)付きの情報として扱うことが必要になると考えられる。また、情報源に対する信頼性の確保は重要な課題であるが、そのために情報の格付けを行う必要があるのか、また国の機関として情報の格付けを行うことが適切かは議論の分かれるところである。外部情報の取込みに関しては、信頼性の高い格付け機関との連携により情報源を選別する等の仕組みを取り入れる必要があるかもしれない。
5.1.2. 適切なナビゲーション
膨大な情報空間の中で、適切に利用者を導くためには、利用者の要求を的確に把握した上でそれに応じた適切な情報を自動的に選択・提示し、利用者の目的とする情報へと導くナビゲーション技術が求められる。明確な目的をもたず興味に任せて書架を行き来(ブラウジング)するようなウィンドウ・ショッピング形式の検索や、アクセス頻度など統計情報を基にしたナビゲーションなどが考えられる。
ナビゲーションを実現するためには、情報の組織化を行い、利用者が目的の情報へたどりつけるようにする必要がある。ここで重要なことは、利用者にとって、検索対象としている情報空間がどのように組織化されていて、自分は今どこにいるかを把握できるようになっていること、システムとの対話によりその情報空間の中を目的の情報へどのように案内されているかを理解できるようになっていることである。メニュー検索を例にとれば、分類一覧により書物全体の分類の仕方が分かり、ある分野を選択するとさらに小分類一覧が現れるというシステム操作により、目的とする情報へ絞り込んで行くナビゲーション方式などがある。情報組織化の方法については、多くの利用者に共通するような一般的な分類を用意するとともに、研究者向けの高度な検索に対応できるようなインデックスを付けるようなことも望まれる。
これまでにも、図書館は情報の組織化、分類法、目録法、件名標目法などに長い間の伝統の蓄積がある。これまでの図書館における資料組織化法は必ずしもすべてがコンピュータによる情報検索において適切に当てはまるものではないが、これまで培ってきた知見を適切に援用し、使いやすいナビゲーション・システムを構築すべきである。
5.1.3. 利用者インタフェース
電子図書館にとって情報検索システムは必須である。利用者にとっての使いやすさとは必ずしもデザインの良さや高度な技術を要するものではない。むしろ、多様な利用者に対して共通に理解できるよういかに簡明にするかにその関心が払われるべきである。
利用者向けのインタフェースとしては、主として文字と分かりやすいアイコンによって、年齢層も背景も異なるさまざまな利用者が直感的に理解できるものが好ましい。ただし、児童の本探しや電子図書館の入り口で迷っている利用者のためには、いかにも図書館の中を歩いているように見せる仮想現実技術を利用することが効果的である場合もある。
情報端末機器については、持ち歩きやすく、表示面積が広く、さらにルビまでが明瞭に読み取れる精細な画面をもつ端末を開発することが望まれる。また、利用者にとって分かりやすく、魅力のあるものにしていくために、対話性のあるものや親近感のもてるプレゼンテーション技術も優れたインタフェース構築に必要になるかもしれない。ただし、端末等のハードウェアの開発は電子図書館固有の問題ではないため、利用者にとってできるだけ標準的な環境を想定した上で、いかに魅力的で分かりやすい利用者向けインタフェースを実現するかの方にむしろ重点を置くべきであろう。
操作性については、応答の早さが重要であり、外部情報アクセスのための広帯域ネットワーキング技術はもとより、端末機器の性能などハードウェア、オペレーティング・システムを含めた利用者インタフェースの基本性能の向上が必要なことはいうまでもない。
(1)操作方法
操作方法としては、キーボードやマウスによる方法が一般的である。ただし、キーボードに慣れていない利用者や身体に不自由のある利用者のためにタッチ・パネル、音声入力、三次元マウス等による操作方法も今後考慮すべきであろう。このような分野では仮想空間移動、画像処理技術を応用した手話認識等、さまざまなマルチメディア関連技術の採用・組合せが考えられるが、今後の研究開発課題であり、利用者からのフィードバックを待って徐々に優先順位の高いものから実現してゆく必要があるものと考えられる。
キーワード入力の補助的機能としては、翻訳機能による多言語対応、各種辞書機能(シソーラス、略語、専門用語等)によるキーワード想起支援があげられる。ただし、これらの補助機能については、利用者が各自のパソコンに独自に市販のアプリケーション・ソフトを組み込むことで対処できる場合も多いため、基本機能は簡潔にし、プラグイン・ソフトとして用意し、必要な人にはダウンロードして利用できる機会を提供することが望ましい。
(2)閲覧方法
基本的には、通常のそれほど高機能なものでないパソコン等で資料を閲覧できることを想定すべきであり、標準的なブラウザで必要最低限の電子図書館機能が利用できるものと考えるべきである。
ただし、閲覧方法として、ズーム、フォント変更、縦書き/横書き切替えなど、利用者が見やすいように表示形式を変更できる機能や、自動ぺージ捲り機能によるブラウジング(内容早見)、目次・索引からのハイパーリンクによる関連ページへのジャンプ機能があれば閲覧は容易である。また、補助機能として、翻訳機能による多言語対応、読上げ機能や点字表示などのメディア変換も多様な利用者への対応上有効である。そして、ディジタル化された資料のダウンロード、紙への印刷など高品質なデータ提供に関しては、特に、著作権を保護できるような技術について検討する必要がある。
(3)コンテンツ
資料の性質に応じた閲覧ツールを準備することも重要である。これらは電子図書館独自に用意するというのではなく、コンテンツに応じて、有効なプラグイン・ソフトを指示することとなるだろう。例えば、書物についてはページ捲り形式の、巻物についてはスクロール形式のビューワが適している・覗釗Σ山擇覆匹離泪襯船瓮妊・◆Ε灰鵐謄鵐弔砲弔い討蓮▲瓮妊・△鳳・犬榛得献帖璽襪・・廚任△襦・泙拭、D-ROMなどの資料については、その再生手段も将来にわたって確保する必要があり、上位互換性のある再生システムの開発などの技術的課題がある。
また、コンテンツに関連した重要な問題として文字コードの問題がある。日本語は漢字を使用する言語であり、中国、韓国・北朝鮮を含めて、東アジア文化圏では漢字を使用する文化をもった国が多い。これらの漢字を統一的に取り扱うための国際規格としてUnicodeがある。しかし、それぞれ文化の異なる国の漢字を統一的に扱うことの問題点が我が国をはじめ、これらの諸国から多く指摘されている。また、日本語の漢字についても、旧字、異体字、俗字等をどのように取り扱うかは、重要な課題である。技術的課題というよりは、標準化の問題であるが、文字データと関わりの深い電子図書館にとっては関心をもつべき課題であり、解決に向けて努力すべきである。
5.1.4. 個人環境の構築
電子図書館のコンテンツを時折り閲覧するという利用者にはあまり必要ないかもしれないが、電子図書館を仮想的な書斎としたい利用者にとっては、以下の機能が用意されていると便利である。
よく使う検索方式やオプションの設定などを登録しておいて、容易に再利用できる仕組みや、しおりを挟んで継続的に閲覧できる仕組みは頻繁に利用される機能になるだろう。さらに、パソコン側でのブックマークの登録やパーソナル・ライブラリ、注釈(メモ)貼付け、特定のページを切り抜いて集めたスクラップ・ブックなどと連携した、資料の編集および保存までも可能な作業環境を用意することが、電子図書館ならではの機能として望まれる。また、個人の嗜好に応じたニュース配信サービスのように、登録しておいた個人プロファイルに従って、定期的に、検索エージェントが自動検索を行い、新刊書やWWWサイトの情報をメールで通知するサービスなども有効と思われる。
利用形態に関しても、来館のみでなく、利用場所として、自宅、会社、移動中などが想定され、利用端末や利用目的等の違いに応じた環境設定が登録でき、スムーズに切り替えることのできる仕掛けが望まれる。
なお、個人データについては、プライバシー保護の観点から留意されるべき問題であり、セキュリティの保障が課題となる。また、別の観点から見ると、個人的な注釈を他人に公表したり、複数の利用者の間で情報を交換したり、共同編集を行ったりする場をつくることにより、知的生産活動を支援する技術も将来有用と考えられる。
5.1.5. 拡張性・自由度
インターネットの爆発的な普及の要因の一つに、誰でも自由に新しい機能やサービスを開発・提案し、その中で便利なものは自然に広まるという文化がある。電子図書館の機能・サービスについても、図書館側だけでなく、利用者が自由に開発して他の利用者が利用できるようなインタフェースを用意することが望ましい。また、コンテンツやプロトコルについても、電子図書館独自の規格を押し付けるのではなく、既存のデファクト規格を採用するなど、拡張性や自由度を重視した方針をとることが望まれる。この場合、相互接続性を保障するために、フォーマット変換等の技術により異質性をカバーすることを検討する必要がある。
5.2. 効果的な情報検索の観点
5.2.1. 現状の検索システムの問題点
検索結果の評価によく用いられる指標として、ノイズの少なさを表す適合率と検索漏れの少なさを表す再現率がある。一般にこの二つの指標は表裏一体の関係にある。現在インターネット上のサーチ・エンジンで用いられる全文検索の問題点は、文献中の自然語を対象にするために検索結果に漏れとノイズが多いことである。この対策としては、統制語句を検索用に付与するか、異表記や関連語、曖昧語まで検索語の範囲を広げることが考えられる。前者は言葉を絞ることでノイズを減らすことができるが、目的情報を的確に表現する統制語がないと、検索洩れが生じる危険性がある。後者は、検索語を増やすことで検索漏れを減らすことができるが、関係の薄い情報も多く拾ってしまう危険性がある。
検索行為を情報学的に表現すると、利用者の組織化した情報空間とシステムの組織化した情報空間のマッピング(対応関係を表現すること)を行い、利用者が自分の情報空間の言葉で表現された目的情報をシステムの情報空間内で見つけ出すことと言える。その実現手段として、利用者とシステムのどちらが歩み寄るかによって二つのアプローチが考えられる。一つは、利用者がシステムの組織化方法をただちに理解し、その観点に合わせて検索できるような分かりやすいシステムを構築する方法で、先ほどの全文検索の例で言えば、標準化された統制語の辞書等を準備することに当たる。もう一つは、利用者独自の情報のとらえ方に合わせてシステムが情報を再組織化(再評価)する方法であり、例で言えば、曖昧語に関するシソーラスを用意し、利用者が似ていると考える検索語を複数指定してもらって検索することに当たる。
効果的な検索システムとは、上記のような検索の不完全さを認識しつつ、何度か検索を繰り返すうちに目標とする情報に到達するまでの労力をできるだけ小さくするシステムである。文中の語の意味的な重み付けを加味する評価機能を適用し、結果の順位付けを数量化することで、対象とする情報空間と得られる情報の粒度を把握しやすくし、きめ細かい検索を可能とするという方法も考えられる。
5.2.2. 情報組織化
膨大な情報の中から利用者が求める情報をうまく選択できるように支援するためには、情報を整理、組織化することが必要である。単純な例としては、分類コードなど索引語の付与、複雑な例としては、ある観点に基づいた資料間のハイパーリンクがあげられる。また、SGMLなど文書自体の構造(章・段落などの階層構造や図表・注などの参照関係)記述も有用である。一方、例えば人気ランキングやFAQ集のように、利用動向による組織化の形態もある。
歉来から図書や雑誌に用いられてきた資料組織化法と、インターネット情報のような更新頻度が高く、不特定多数の情報の組織化とは観点が異なることも認識する必要がある。人手による作業を最小化した効率的な自動組織化方法について十分に検討を行う必要がある。
情報の組織化については、新しい情報の追加への対応や別の手法や観点からの再整理など運用に伴う作業量も多く、ハード、ソフト、運用体制を含めて技術的な検討を加える必要がある。
5.2.3. 高度な検索
高度な検索を支える基盤として、高速ネットワーク、高機能端末、マルチメディア・データベース技術などによるデータ操作・検索/応答時間の向上は必須である。情報収集・組織化に関しては、インデックス再構築などの処理や、リアルタイムな辞書の整備の必要性があげられる。さらに、ネットワーク経由で多くの利用者が同時にアクセスしてくる状況も想定されるので、十分な機器性能とネットワーク環境を確保しなければならない。以下に、高度な検索手法をいくつか述べる。
(1)利用者適応型検索
検索技術は、利用者層やその利用目的に適した方法やインタフェースにより提供されることが望ましい。そのために、簡単なヒアリングにより利用者の機器操作習熟度や嗜好をプロファイル化し、その情報を検索に役立てることが考えられる。検索条件を与えておいて自動的に必要なものだけを表示するフィルタリング機能や、利用者の専門分野に特化した検索機能、利用者に固有の観点・主観に基づく感性検索などがこのタイプの高度検索手法としてあげられる。また、インタフェースを自分の使いやすいようにカスタマイズするなどの環境設定機能も重要である。利用者に適応してゆく手段として、利用者の利用履歴などから学習するシステムも考えられる。一方、利用者が自分の検索要求を巧みに言語化できない場合があるので、対話を繰り返しながら利用者の考え方を把握し、検索要求を特定してゆくような機能も有効である。
(2)マルチメディア検索
画像や映像に対する類似画像検索、音楽に対するメロディー検索などの、マルチメディア情報に対する直接検索は、まだ研究段階ではあるが、今後予想されるマルチメディア・コンテンツの増大とともに必要性が増すと考えられる。また、感覚的にとらえられるメディアの検索には、印象語を用いた感性検索も有効であると思われる。何を比較の特徴量とするかという表現形式に関する検討が必要である。
(3)意味検索、概念検索
連想検索や類似検索を包摂する検索方式で、キーワードなど表層的なマッチングではなく、コンテンツの意味内容に対する検索である。一般的な主題検索や、判例などの事例検索がその例としてあげられる。コンテンツの意味内容の表現形式とその比較方法に関する検討が必要である。
(4)分散協調エージェント検索
複数の電子図書館や出版者などの外部情報源に対する横断的な検索である。特に、インターネットに代表されるように時々刻々と変化していく情報を的確に把握するためには、広域に分散している情報源に対してほぼ同時点の検索を行うことが望まれる。そのためには、各地域を担当する複数の検索エージェントが協調して短時間に情報を集約する仕組みが必要となる。実用においては、まだ今後の研究開発に待つ部分が多いが、この検索方式を効率よく実現するには、各情報源のメタデータを共通化し、基本検索機能のインタフェースを共通化することが求められる。これらは各情報提供者の運営方法に関わる問題であり、検索サービス・レベルでの相互運用性を保障するという緩やかな連携方法も現実的なアプローチとして考慮すべきである。
5.3. コンテンツ権利保護等の観点
5.3.1. 著作権管理・保護
ディジタル情報は複製・流通が容易であるという性質をもつため、著作者の権利を保護するためのシステムの開発が望まれる。具体的には、著作者の情報やコンテンツの利用条件などを管理し、二次利用に際して権利処理・売買を代行する著作権管理の側面と、電子化コンテンツのネットワーク流通を可能とするためのセキュリティ確保や不正コピー防止・摘発などの著作権保護の側面がある。
(1)著作権管理
コンテンツの著作権表示は、データ・ヘッダ等に明記する方式や、電子署名や電子透かしを利用して書き込むなどの方法がある。コンテンツに著作権情報を持たせるのはデータ量・情報処理量が増大するという問題もあり、単に識別記号(ID)のみを付与して、詳細情報は照会センターで管理する方式が現実的と考えられる。権利処理については、著作者や使用条件に関する情報をデータベース管理することで、二次利用や権利の譲渡などが容易になると考えられる。
(2)著作権保護
提供されたコンテンツの著作権保護を厳格に実施していくのは困難な問題があるが、不正な利用に対する心理的抑止効果や不正な利用が発見された場合の証拠確保のために、電子透かし技術や電子署名技術が有効となる。例えば、コンテンツの利用時に利用者のID情報を埋め込むことで提供元を特定できる。このままでは不正コピーを防ぐことはできないが、ネットワーク上を巡回しコンテンツのID情報から不正利用を摘発するような仕組みを併用すればかなりの抑止力となると考えられる。また、コンテンツ再生機構にハードウェア・プロテクトをかけることにより、利用端末での不正コピー防止や利用度に応じた課金を可能にする超流通技術も有効である。
5.3.2. 課金・決済
コンテンツを得るために料金が必要な場合は、電子的な料金決済を行う電子商取引技術が適用可能である。セキュリティ管理、利用者認証、契約の電子公リなども基本技術として必要である。コンテンツを販売するのではなく、利用の度ごとに記録し、その具体的な利用に応じて課金していくシステムも検討する必要がある。例えば、通常の複写のような少額の課金に対しては、電子商取引におけるマイクロペイメントのような低負荷/低コスト決済を可能とする技術が向いていると考えられる。
また、課金のために、コンテンツの利用者と利用状況を監視する仕組みを導入するにあたっては、著作者の権利保護もさることながら、利用者のプライバシーを保護する必要がある。保護の観点には、意図せずに違法アクセスしてしまうことを予防する仕組みも検討する必要があると考えられる。
5.4. 電子図書館構築上の観点
5.4.1. 将来にわたる安定運用(アーキテクチャ)
国立国会図書館は国の中央図書館であり、その電子図書館は、公共的なサービスの提供や情報の永久的な保存などの機能が必要とされるため、将来にわたって拡張可能で、安定的に運用していけるシステムとしなければならない。そのため、システムのモジュール化によって随時最新技術との入れ替えを容易にする技術や標準技術の採用が望まれる。基本的には、マルチベンダによる効率的な開発を可能にするような構造が望ましい。また、他の図書館など外部情報発信機関との連携を可能とするためのデータ形式や情報通信の標準化や相互運用性を確保できるようなアーキテクチャを検討すべきである。また、既存の業務システムや他の図書館との連携も考慮すべきである。
5.4.2.一次コンテンツの収集・長期保存
今後は出版界においても出版物の電子化が進むとともに電子納本が可能になると考えられるが、既存の紙媒体資料の電子化作業が大きな課題である。入力のためには、スキャナ、カメラ等の光学機器を用いるが、ページ捲り、取込み位置合わせや解像度の調整などをできるだけ自動化する支援装置が必要である。
一方、情報を網羅的に収集する際の大きな課題として、WWWに代表されるようなネットワーク上で出版される情報の収集・保存がある。これらの情報は紙媒体と異なり、変化や消滅が激しく、ハイパーメディアとしての特質であるリンク先の情報を何段先まで保存したらよいのか曖昧なところがある。また、外部情報に関しては、情報源に対する信頼性の確保が重要である。
保存に関しては、画像などデータの大容量化への対処を考慮するとともに、さまざまなフォーマットが並存する電子的なコンテンツをどのように統一的に蓄積し、索引を作成するかという課題がある。また、ネットワーク上で出版される情報については、タイム・スタンプ付きのデータとして扱わざるを得ず、そのようなある時点のスナップショットの積み重ねとして情報のバージョン管理まで行う必要が出てくると考えられる。さらに、古いフォーマットで作られたファイルを後になっても利用できるように再生システムと併せて保存するか、コンテンツを上位互換性のあるフォーマットに変換して保存し直すなどの作業が必要となる。保存システムのアーキテクチャも、利用者のアクセス分散や定期的なバックアップ体制、他の情報提供機関との連携を考慮した分散構成とするなどの検討が必要である。
5.4.3. メタデータの作成
メタデータの作成・蓄積は情報アクセスのために必須の作業である。OCRを利用した自動キーワード抽出や、典型的な書物の構造を利用して目次や索引からページへのリンクを貼るなど、メタデータの自動作成技術、作成支援技術が求められる。
また、外部機関とのメタデータ共有や作成分担を可能にするためには、標準化や相互変換技術が必要である。さらに、情報の組織化は個人や団体独自の観点による意味付けを与えるものもあるため、出所を付けて提供するような仕組みも将来必要になると考えられる。
