1-016

バチカン図書館がNTTデータと進める「文献デジタル化プロジェクト」

  • このエントリーをはてなブックマークに追加

by [2015年1月28日]

バチカン図書館 Information Technology Centre CIO

バチカン図書館 Information Technology Centre CIO
Luciano Ammenti 氏

1月23日に開催された「NTT DATA Innovation Conference 2015」では、バチカン図書館の最高情報責任者である Luciano Ammenti (ルシアノ・アメンティ氏)が登壇し、NTTデータとともに手掛けている「長期デジタル保存プロジェクト」についてプレゼンテーションを行ないました。

図書館に所蔵されている約8万冊の文献は、2世紀から20世紀に描き残された、様々な国や宗教からくるものだそうです。

図書館の使命とは

バチカン図書館は、保存をするという使命があります。

我々は、500年以上にわたり歴史的図書の保存、保護、修復という役割を果たしてきました。手書き文献をこれから先、幅広いユーザーが閲覧できるようにするため、バチカン図書館は「デジタル化および長期保存」プロジェクトをスタートさせました。しかしデジタル化を進めるには、テクノロジーや技術、デバイスを使うことになります。しかし、これは段階を追って少しずつ使っていかないと、手書き文献が破損されていく可能性があります。

2010年より始まったこの一大プロジェクトでは、まず高解像度のビデオカメラが設置されるようになりました。この手書き文献は非常にデリケートなので、カメラを設置したことにより安全性とセキュリティが強化されました。

また、RFID※の技術を手書き文献にも利用することより、バチカン図書館のどこにその文献があり、誰がアクセスしているかもコンピュータによって状況を把握することができました。こういった指針を導入することによって、図書館で保管されている全ての情報が順次データセンターに届けられます。

※RFID:(Radio Frequency Identifier)ID情報を埋め込んだRFタグから、近距離の無線通信によって情報をやり取りするもの(wikipedia より)

新たなフォーマットを導入

しかしデジタル化というものには、大きなリスクを背負うことになります。たくさんのお金を投資してデジタル化を進めたものの、デバイスが変わったり、フォーマットが変わることで、データを閲覧できなくなってしまったら大変です。そのため、このような大掛かりなデジタル化の作業はどこも着手しませんでした。
1-050

当然のことながら、テクノロジーはどんどん進化していきます。我々は文献、あるいは保存物に関しては、基本となるフォーマットで保存することが大鉄則だと考えました。そこで、我々が導入したフォーマットが「FITS」です。これは既に天体物理学の世界で実証済みの40数年前からあるフォーマットで、NASAと共に天体物理学のために考案されたオープンソースのフォーマットです。なおかつ、このフォーマットはいまだに半年ごとにアップデートされており、今は64ビット、3次元のプラットフォームにも対応しています。また、FITS であれば、ハイレベルのイメージや高精度のマニュスクリプト(手書きの文書)にも対応しています。さらに何十年先という、画像をダウンロードするということも問題なくできるでしょう。

デジタル化はどこまで進んでいるのか

現在、我々のデジタル化は、コード番号だけを使っていく「マニュスクリプトのみ」をデジタル化するものと、研究者向けの「カタログ」のデジタル化をするやり方があります。カタログ作りは、当然一般向けより難しいです。これは、タイトルが1つとは限らないからです。手書きの文書はまさにカリグラフィー(文字を美しく書く技術。日本であれば書道)の世界です。カリグラフィーを読み解いて初めて、マニュスクリプトに記述されているデータ、意味や情報が理解できます。マニュスクリプトに複数人が書いた場合には、そのカリグラフィーを解読するための作業に様々な研究工程があります。

また、ドキュメントの画像を取り込むときの保存方法として、パターン認識検索という仕組みも導入しております。画像に関するデータの洪水があった場合には言うまでもなく、例えばこの絵画と絵画の因果関係を見定めるというのはなかなか大変です。したがって、ソフトウェアなどを使いながらパターン認識を行うという検索方法も導入してあります。

デジタル化を進めるにあたってリスクがあるという風に申し上げました。そこで我々は非常に堅牢で高い性能を兼ね備えた物理的なインフラによって、リスクと変化を管理することを可能しています。

インフィニバンドへの切り替え、つまりサーバーのバックプレーンは100ギガビットということで非常に効率性を担保しています。本当に膨大な量のデータが転送されています。従来型のスイッチでは対応し切れません。10ギガ以上は必要になってきます。これもインフィニバンドを使いながら動的に変えていかなければなりません。そして夜間転送を極力心がけつつファイルの移管を行っています。柔軟なインフラが必要だということは皆様ご理解いただけると思います。ここはもうNTTデータの担当者が本当によく対応してくださっています。何か必要があれば、すぐにさらなる効率アップのために切り替えを行ってくれています。現場で動いていただいている方も、本当に専門意識を持っていただいているということが大きな鍵だと思います。これは他社では体験したことがないことです。

1つ言えるのは、テクノロジーは変わっていくということ。しかしながら、夢とフォーマットは変えることができません。そして何よりもこのプロジェクトに携わる方々は本当にプロ意識を持っているので、必ずやこのプロジェクトは成功すると私も確信しております。

NTTデータが考案したデジタルアーカイブソリューション「AMLAD」(アムラッド)ソフトは、すべてを一元的に、1つのインターフェースで何でも検索できるうえ、ユーザーフレンドリーです。これもやはりワークフローがさらに一歩効率よく変わっていくための布石となったでしょう。

このプロジェクトの実現のために必要なのはテクノロジー、お金だけではありません。人類の人的資源というものがこのプロジェクトでは本質的に不可欠なものなのです。

▼参考リンク
バチカン図書館
NTTDATA Innovation Conference 2015

コメントは受け付けていません。

タグ:
PageTopへ