●メディア技術としてのCV
●3次元テレビジョンへの道
●サイバースペースでの臨場感
●メディア技術としてのCV CVはもともと人工知能の一分野として発展しました。人工知能の研究目標が、人間のもつ知能の仕組みを解明することと、人間の知能のまねをできる機械を造ることの2つであるのと同様に、CV研究の目標は、視覚の仕組みを解明することと、視覚のまねをできる機械を造ることの2つとされています。CV研究には、ロボット技術としてのCVとメディアとしてのCVとがあります。ロボット技術は、基本的には人間を置き換えるための機械が主体となる技術と考えられています。一方、メディアとしてのコンピュータを考える場合には、主体はあくまで人間です。いわゆる知的ヒューマンインタフェースであり、CV技術は、コンピュータに接している人間の顔や表情、身振りや手振りを認識する役割を期待されます。また、CVは文書・映像メディアハンドリング、3次元画像メディアにも活用されます。 ●3次元テレビジョンへの道 最近、実際の情景を撮影した画像からCV技術を用いて3次元モデルを自動的に生成しCGシステムへの入力とする試みが行われ始めました。これは、一長一短あった既存3次元画像メディアに対して、新しい3次元画像メディア――観察者の移動に応じて提示する画像を変化させる3次元画像表示方式の内、3次元モデルと画像を統合させたもの――を目指すものです。CGがそれまでの描画から実写画像入力を取り込むことでCVに歩み寄り、一方のCVも、マルチメディアに飛びついた一部のCV研究者がCGの方を向くことになったのです。ただし、既存のCV技術とCG技術を単純に接合したシステムを試作しても、その結果は落胆あるのみでしょう。ロボット技術として研究されてきたCVを、3次元画像メディアの要素技術として用いるには、解決していくべき問題が山積しています。 ●サイバースペースでの臨場感 例えばバーチャルな空間の中で会話をすることを考えたとき、リアリティ、臨場感のようなものをどこまで求めるかが問題になります。1対1の場合では相手の顔が見えるだけでもかなりの臨場感になります。ただ、不特定多数、あるいは人間以外の空間をサイバースペースの中につくり出した場合、臨場感の創造は容易ではありません。3次元画像メディアとしてのCV技術も様々な側面でこの問題に貢献すると思われますが、大切なのは、その空間を利用する際の目的と合致した臨場感の創造であり、技術であると言えます。 例えば先生と生徒という関係で成り立っている「教室」のような空間は、サイバースペース上につくり出す上でも、その関係を臨場感として持たせる必要があります。先生なのか生徒なのか認識できないようでは場が成り立たないわけです。また、テレビ電話だったら、バックグラウンドの空間に対しては「そんなものいらないよ」ということになるかもしれません。バックグラウンドにバーチャル空間を置くという意義をもっとしっかり考える必要があります。 サイバースペースは、必ずしもリアルである必要はないと思うのです。言い方をかえれば、実社会のを模倣した形ではサイバースペース上のリアリティは創り出せないと言うことです。コミュニケーションを目的としたチャットのような場合でも、相手の手足がどう動いているかということよりも、声の調子や表情が際だって表現されていることのほうが望まれるのではないでしょうか。 3次元画像メディアの要素技術としてのCVも、当面はある技術レベルがあった時に、それを生かして使えるようなアプリケーションを探し出して、実際に使ってみる。そのような中で技術レベルを高めつつ、インフラ等の環境を整えないと、ある時点で爆発的に応用が広がるというところまではいかないのかもしれません。CVはまだ技術的に高めていく時期であり、すぐに応用が利くようになるかどうかはわかりません。ただ、技術者とコンテンツ側とが協力して、世の中の役に立つアプリケーションを見つけていく。そういうことの繰り返しが大切だと思います。
●3次元テレビジョンへの道 最近、実際の情景を撮影した画像からCV技術を用いて3次元モデルを自動的に生成しCGシステムへの入力とする試みが行われ始めました。これは、一長一短あった既存3次元画像メディアに対して、新しい3次元画像メディア――観察者の移動に応じて提示する画像を変化させる3次元画像表示方式の内、3次元モデルと画像を統合させたもの――を目指すものです。CGがそれまでの描画から実写画像入力を取り込むことでCVに歩み寄り、一方のCVも、マルチメディアに飛びついた一部のCV研究者がCGの方を向くことになったのです。ただし、既存のCV技術とCG技術を単純に接合したシステムを試作しても、その結果は落胆あるのみでしょう。ロボット技術として研究されてきたCVを、3次元画像メディアの要素技術として用いるには、解決していくべき問題が山積しています。 ●サイバースペースでの臨場感 例えばバーチャルな空間の中で会話をすることを考えたとき、リアリティ、臨場感のようなものをどこまで求めるかが問題になります。1対1の場合では相手の顔が見えるだけでもかなりの臨場感になります。ただ、不特定多数、あるいは人間以外の空間をサイバースペースの中につくり出した場合、臨場感の創造は容易ではありません。3次元画像メディアとしてのCV技術も様々な側面でこの問題に貢献すると思われますが、大切なのは、その空間を利用する際の目的と合致した臨場感の創造であり、技術であると言えます。 例えば先生と生徒という関係で成り立っている「教室」のような空間は、サイバースペース上につくり出す上でも、その関係を臨場感として持たせる必要があります。先生なのか生徒なのか認識できないようでは場が成り立たないわけです。また、テレビ電話だったら、バックグラウンドの空間に対しては「そんなものいらないよ」ということになるかもしれません。バックグラウンドにバーチャル空間を置くという意義をもっとしっかり考える必要があります。 サイバースペースは、必ずしもリアルである必要はないと思うのです。言い方をかえれば、実社会のを模倣した形ではサイバースペース上のリアリティは創り出せないと言うことです。コミュニケーションを目的としたチャットのような場合でも、相手の手足がどう動いているかということよりも、声の調子や表情が際だって表現されていることのほうが望まれるのではないでしょうか。 3次元画像メディアの要素技術としてのCVも、当面はある技術レベルがあった時に、それを生かして使えるようなアプリケーションを探し出して、実際に使ってみる。そのような中で技術レベルを高めつつ、インフラ等の環境を整えないと、ある時点で爆発的に応用が広がるというところまではいかないのかもしれません。CVはまだ技術的に高めていく時期であり、すぐに応用が利くようになるかどうかはわかりません。ただ、技術者とコンテンツ側とが協力して、世の中の役に立つアプリケーションを見つけていく。そういうことの繰り返しが大切だと思います。
●サイバースペースでの臨場感 例えばバーチャルな空間の中で会話をすることを考えたとき、リアリティ、臨場感のようなものをどこまで求めるかが問題になります。1対1の場合では相手の顔が見えるだけでもかなりの臨場感になります。ただ、不特定多数、あるいは人間以外の空間をサイバースペースの中につくり出した場合、臨場感の創造は容易ではありません。3次元画像メディアとしてのCV技術も様々な側面でこの問題に貢献すると思われますが、大切なのは、その空間を利用する際の目的と合致した臨場感の創造であり、技術であると言えます。 例えば先生と生徒という関係で成り立っている「教室」のような空間は、サイバースペース上につくり出す上でも、その関係を臨場感として持たせる必要があります。先生なのか生徒なのか認識できないようでは場が成り立たないわけです。また、テレビ電話だったら、バックグラウンドの空間に対しては「そんなものいらないよ」ということになるかもしれません。バックグラウンドにバーチャル空間を置くという意義をもっとしっかり考える必要があります。 サイバースペースは、必ずしもリアルである必要はないと思うのです。言い方をかえれば、実社会のを模倣した形ではサイバースペース上のリアリティは創り出せないと言うことです。コミュニケーションを目的としたチャットのような場合でも、相手の手足がどう動いているかということよりも、声の調子や表情が際だって表現されていることのほうが望まれるのではないでしょうか。 3次元画像メディアの要素技術としてのCVも、当面はある技術レベルがあった時に、それを生かして使えるようなアプリケーションを探し出して、実際に使ってみる。そのような中で技術レベルを高めつつ、インフラ等の環境を整えないと、ある時点で爆発的に応用が広がるというところまではいかないのかもしれません。CVはまだ技術的に高めていく時期であり、すぐに応用が利くようになるかどうかはわかりません。ただ、技術者とコンテンツ側とが協力して、世の中の役に立つアプリケーションを見つけていく。そういうことの繰り返しが大切だと思います。