「セミナーリポート」
ネットワーク社会とマルチメディアデータベース


●WWWとDBMSの共通点と相違点

●WWW上でのDBMS技術の応用

●さらに求められるDBMS技術



私たちの社会は今、言うまでもなくインターネットに代表されるようなグローバ ルなネットワークの時代を迎えています。そしてネットワークの環境が整備され るにつれ、テキストだけではなく、映像や音声といったマルチメディア関連の情 報もネットワーク上で操作できるようになってきました。さらにネットワーク上 に分散しているマルチメディア情報の共有・統合を効果的・効率的に行いたいと いう需要が高まってきました。このような状況に対応するため、新しいDBMS (Data Base Management System)とその関連技術が求められています。

●WWWとDBMSの共通点と相違点

現在、インターネット上での情報共有・検索を行うための基盤ソフトウェアは、 DBMSではなく、分散型ハイパーテキストシステム=WWW(World Wide Web )です。DBMSは主としてWWWのバックエンドエンジンとして使用されてい ます。

情報を検索するツールであるという点から見れば、WWWとDBMSは同じ道具 です。しかしながら、WWWは分散型ハイパーテキストであり、一方でDBMS はフォーマット化されたデータの共有・管理ツールであるなど、相違点も有して います。WWWとDBMSには、詳しく見ていくと主に3つの共通点と5つの相 違点があります。まずは永続性という点です。WWWもDBMSも永続的なデー タを対象としており、情報の検索などを行うソフトウェアですが、DBMSはフ ォーマット化された定形的なデータを主な対象としているのに対して、WWWは 非定形的で半構造的なデータを対象としています。

次にWWWとDBMSはともに、アプリケーションやデータを統合するための統 合ミドルウェアと位置づけられています。ただし、DBMSではデータが中心に あってアプリケーションをその上に置くという非対称的な統合です。一方WWW では、ノードとリンクからなるハイパーテキストに基づいてデータやアプリケー ションの対称的な統合が行われています。

そして両者はともに実世界のモデリング機能を有しているという点が3つ目です 。DBMSが格納したい情報の構造を中心にしてモデル化するというアプローチ をとるのに対し、WWWは文書や実空間といった現実にあるものをベースに、そ こに情報を関連づけていくわけです。

4つ目の相違点は、情報共有の観点からいうと、DBMSが、個人化された多様 な視点を提供するためのビュー機能を有しているのに対し、WWWはデータに対 する視点をそのデータファイル作者からの視点でのみサポートするシングルビュ ー機能が与えられている点です。

そして最後に情報管理という点で、WWWとDBMSは相違します。DBMSは 一貫性管理がスキームや完全性制約のもとで厳密に行われているのに対して、W WWでは一貫性管理は行われておりません。これは、システム全体が開放系であ るために、一貫性に関する制約が設定しにくいという問題があるためです。

●WWW上でのDBMS技術の応用
さて、WWWとDBMSがそれぞれに採用する技術・特性を踏まえ、WWW上に おいてどのようなDBMS技術をどのように応用していけばよいのでしょうか。 DBMSとWWWの大きな違いは、スキーマを持つか持たないかという点です。

DBMSでは、データの格納構造であるスキーマが確定して初めてデータ操作が 行えるという点でスキーマ主導の考えが徹底しています。しっかりと全体を構造 化しなければデータ操作が行えません。一方WWWでは、スキーマに相当する概 念はなく、データ主導、すなわちインスタンス主導のシステムと位置づけられて います。つまりWWWではその利点として、ネットワーク上に分散したデータベ ース全体の論理構造などを知らなくても、データの蓄積や検索が、データからデ ータへのナビゲーションという形で比較的容易に行えるのです。しかし、欲しい データがどこのサイトにあるかが分からない場合、WWW上に存在する大量の情 報の中から欲しい情報を効果的に検索してくれる機能が必須となります。そこで 、この大量の情報を全体として一望できるような機能、そしてそこからスキーマ が浮き出てくるような機能 "自己組織化システム" があれば、より便利であると 考えられます。

イメージとしては、 Web文書に対する分類マップのような感じで しょうか。このマップの各セルはそれぞれを特徴づける特徴ベクトルを持ち、ま た各入力データ(文書)も同次元の特徴ベクトルを持ちます。各入力データの特 徴ベクトルと、最も距離的に近いベクトルを持つセルとその周囲のセルのベクト ルの値を、入力データのそれに近づくように繰り返し修正、学習させるというの がこの仕組みです。

●さらに求められるDBMS技術

WWW上では、情報共有をする際にユーザビュー機能、つまり個々のユーザの視 点からWWWが異なった形で見えるような機能や、HTML文書の作成者以外の ユーザが自分の視点でハイパーリンクを追加する機能の必要性が生じてきます。 この機能を追加するにあたって、WWW文書の中身であるコンテンツと、HTM L文書の機能であるハイパーリンクを分離する方式である Dexterモデル*1など が提唱されています。私どもも「質問対リンク」という概念を提唱し,これによ って,利用者の視点からさまざまなリンクを動的にオーバーレイできる機構を開 発しています。

この方式は今後のWWW技術を拡張するヒントとなるでしょう。
また、大規模なマルチメディアデータベースを構築する上で最も重要で困難な課 題として、もともと生データとして与えられている映像データの内容の記述、す なわちオーサリングと、映像データの構造化をどのように行えばよいかという点 が挙げられます。これまで提案されてきた多くの動画像データモデル(たとえば Algebraic Video*2や我々のOVIDモデル*3は、これらの課題に十分な答え を与えているとはいえません。そこで、映像データの内容記述については、内容 記述情報(2次情報)のレベルと構造、内容記述のストーリー依存度、文字・音 声などによる内容記述情報の存在に留意することが大切になります。

最後に、現在ネットワーク上におけるマルチメディア情報の共有・統合に対する需要は高まっているものの、各組織が有する機密レベルの高いデータへのアクセス権管理 をどのように行うかなどが、重要なテーマになっています。

従来のDBMSにおけるアクセス制御は、各ユーザとデータの組み合せわに対し てアクセス権を定義し、アクセス権が与えられるユーザにのみそのデータを表示 でき、与えられていなければ表示できないという「all or nothing」的なもので した。しかし空間データの表示の際には、同じものを表示するさまざまな詳細度 の表示が考えられ、表示が許される詳細度が各ユーザごとに異なる、というよう な制御が必要であり有効であると考えられています。このように、マルチメディ ア情報のアクセス権を「all or nothing」とは異なった形で管理するためのDB MS技術なども求められています。

神戸大学大学院
自然科学研究科 情報メディア科学専攻
専任教授 田中 克己