| 研究テーマ |
研究組織 |
概要 |
| 胸部CT像の診断プロセスのモデル化と診断シミュレーションモデルの開発 |
○北坂孝幸,森田純哉 |
昨年度の成果である発話データ解析から,医師の診断プロセスに関するデータをある程度収集することができた.今年度は,医師の診断プロセスを予測する認知モデルを構築し,CADへ応用するための研究に取り組む.具体的には,(1)計算機により抽出された特徴量と医師の着目した特徴との相関解析,および,診断ロジックに基づく特徴量選択手法の開発,(2)医師の診断プロセスのモデル化と計算機による診断シミュレーションを行う.そして,未知試料に対するシミュレーション実験を行い,シミュレーション結果と医師の診断プロセスを比較することにより評価を行う. |
| 複数メディアを扱う研究開発のための基盤整備-MIST- |
○高橋友和,出口大輔,伊藤雅紀,西堀研人,曹 暉,T.D. Troung |
記憶装置の大容量化やセンサ類の高精度化に伴いメディア処理コストの増加が問題となっている一方で,計算機の低価格化やマルチプロセッサPCの普及により,並列計算環境がより身近なものとなっている.このようなメディア処理研究を取り巻く環境の変化の中,本年度のプロジェクトではMISTのメディア処理機能の並列化を実現するため,以下のような活動を行った.
- 開発/実験環境として小規模PCクラスタの構築
- 各メディア処理機能の並列化に関する検討
2005年12月1日より正式に一般公開を開始しました.
以下のプロジェクトWEBページにて音声・画像処理ライブラリMISTを
ダウンロードすることができます.
http://mist.suenaga.m.is.nagoya-u.ac.jp
|
| 光線再現型ディスプレイを用いた医用画像の可視化に関する研究 |
○圓道友博,北坂孝幸 |
光線再現型の立体ディスプレイは画像を光線の集合としてとらえ、多方向の光線を再現することによって立体表示を実現する新しい方式であり、運動視差の再現が可能である等の優れた特長を有する。そのため従来の2眼式等の立体表示法や通常の2次元画像に比してより直感的な立体知覚が可能となるため、詳細な立体形状の把握が必要医用画像の表示に適していると考えられる。しかし、その視知覚特性の評価や必要なディスプレイ性能の検討はほとんど行われていない。本研究は、医用画像の可視化用途における光線再現型ディスプレイの有効性を評価し、実用的に用いられるために必要な機能・スペックを明らかにすることを目的とする。 |
| 擬人化表現のための感情表現および個人性を含むマルチモーダルデータベースの構築 |
○米澤朋子(間瀬研究室D1),友部博教(長尾研究室PD) |
本研究では,マルチモーダル表現のうち,音声とジェスチャに1.個人性や,2.表情付けの特性が含まれると仮定し,データを収集し個人特性を分類することを目的とする.音声やジェスチャ(無意識・意識的)を取得するため,対面状況の対の被験者に対し感情的なせりふやジェスチャを表現する課題を与える.従来研究として,音声の個人性はすでに研究されているが,ジェスチャの個人性およびマルチモーダル表現となったときの相乗的な効果についての検討を行う.また,表情付けられた音声の研究は昨今盛んであるが,多彩な感情カテゴリを得るため,課題と自由発話の両方を取得する.将来的なマルチモーダル擬人化表現における再利用を狙い,生の音声やジェスチャとともにそれらの分析データを格納した,個人性と表情付け(感情カテゴリ)のデータベーステーブルを作成する. |
| 研究テーマ |
研究組織 |
概要 |
|
複数メディアを扱う研究開発のための基盤整備
ーMIST開発ー
|
○高橋 友和(村瀬研究室),
出口 大輔(末永研究室),
伊藤 雅紀(大西研究室),
西堀研人(大西研究室) |
昨年度に引き続き,MISTの開発を行った.本年度のプロジェクトでは以下のような活動を行った.
- メディア処理機能の充実・強化
- メディア処理の基本的な機能の実装(ソースコード総量約60,000行)
- ドキュメントの整備
- 使用や配布に関するライセンスの検討
- MISTの利用促進・ユーザの獲得
- IMIセミナー(学内発表会)においてプロジェクトの紹介
- ユーザ講習会(全2回/参加者計13名)
- MISTのダウンロード総数 238
|
画像診断プロセスのモデル化とその計算機支援診断システムへの応用
|
○北坂孝幸(末永研究室),
森田純哉(三輪研究室) |
医用画像の計算機支援診断 (CAD: computer aided diagnosis) システムの開発に関する研究が現在さかんに行なわれている.これまでのCADシステムに関する研究として,医師が着目する特徴の記述や定量化の方法,画像処理・パターン認識の観点からの有効な特徴量の開発に力が入れられてきた.しかし,医師の認知プロセスの分析を背景としたCADシステムはこれまでにほとんど開発されていない.一方,医用画像診断に関する認知科学的な研究として,これまでに,発話思考法に基づく発話プロトコルの分析が行われてきた (診断中の思考過程をオンラインで被験者に発話させる方法).だが,医師の診断に関与する認知プロセスの詳細について,充分に明らかになっていない点が多く存在する.
我々は,より高性能で知的な,医師に信頼されるCADシステムを実現するためには,医師の認知プロセスに沿った支援が重要であり,診断に関与する認知プロセスの詳細を明らかにすることが必要と考えた.このような考えから,これまで,現実の医師の診断作業を観察,記録する読影実験を実施し,そこで得られた発話プロトコルの分析を行ってきた [1].以下に示す検討は,医用画像診断に関与する認知プロセスの特徴をより詳細に検討したものである. |
| 視聴覚障害者向けマルチモーダルメディア利用環境の実現 |
○陳 金姫 |
本研究では,視覚障害者向けコンテンツと聴覚障害者向けコンテンツの作成のため,映像・音声コンテンツからの特徴抽出を行う.映像情報を利用できない視覚障害者には,映像からオブジェクトの情報を抽出し,音声コンテンツとして提供する.また,音声情報を利用できない聴覚障害者には,音声情報をテキストとして画面上に合成し,映像コンテンツとして提供できる.これらの技術を実現するために,映像情報,テキスト情報,音声情報を構造的に管理できるデータベースも構築する. |
| アプリケーションソフト操作学習を対象としたコース作成支援システムの構築 |
○小尻智子(渡邉研究室),
入部百合絵((元)横井・安田研究室,(現)豊橋技術科学大学)
|
ネットワークの普及に伴い,WebCTなどのコースウェア管理システムを通して,特定の教科を教授するためのコースウェアの提供が盛んに行われるようになってきた.教師はコースウェアを通して教えたい教材を順番に提示していくことで.ネットワークを介して学習者に知識を教授する.コースウェアを作成する際,教師は例えば,定義を教えてから例題を解かせる,など,特定のポリシに沿って教材を並べることが多い.このようなポリシはコース全体に対して一貫して見られることが想定される.
教師は毎年講義を行うため,該当する分野に対する複数の教材データを保持することが多い.このように,複数の教材データがデータベース中に管理されている場合,コースウェアを生成するたびに個々のファイルをいちいち指定してコースを生成することは,教師にとって負担である.そのような状況に対し,教師のコースウェア生成ポリシに沿って教師の保持する教材データから動的にコースウェアを作成することは,教師のコースウェア作成の負担を軽減する.もちろん,教師は教材データの内容にしたがって生成されたコースウェアの詳細を変更する必要はあるかもしれないが,コースウェアの大まかな流れが動的に生成されれば,詳細な変更だけをすればよいことになる.
一方,入部らはアプリケーションソフト操作学習支援システムを開発してきた.アプリケーション操作学習支援システムは,教材作成システムとナビゲーションシステムから構成される.教材作成システムでは,教材作成者のアプリケーション操作からマウスやキーボードに対する操作の特徴箇所を抽出することにより,アプリケーション操作のためのナビゲーション教材を自動的に生成する.一方,ナビゲーションシステムでは,教材作成システムで作成されたナビゲーション教材を用いて,テキストだけではなく画像を中心に表示しながら,学習者の操作状況に応じて1ステップずつナビゲーションするシステムである.
本研究課題では,アプリケーションソフト操作学習支援システムを対象とし,コースウェアを自動的に生成する機構を構築する.入部らの提案していたシステムは,個々の操作のナビゲーション教材しか保持しない.しかし,特定の操作全体を体系的に指導するためには,操作の意味や操作の応用を教えたり,練習問題を課すことで操作方法を習得させたりする必要がある.そこで,本研究課題では,まず,アプリケーションソフト操作学習のための教材データベースを設計する.そして,設計された教材構造に基づいて,教師の意図を反映したコースウェアを動的に生成するための機構を構築する.本研究では,一つの知識(アプリケーション操作)を支援の対象とし,教師の記述したコースウェア生成ポリシに従って教材データを選別して適切な順序で提示する. |
| 研究テーマ |
研究組織 |
概要 |
| 医用画像診断プロセスのモデル化とその計算機診断支援システムへの応用 |
○北坂孝幸,森田純哉 |
本研究の目的は,胸部3次元X線CT像の「診断プロセスモデル」を構築し,診断プロセスに基づく「新しいCADシステム」を開発することである.我々の考える診断プロセスモデルとは"画像から得られる所見"と"医師の思考過程"を結合する双方向的なネットワークである.画像の物理的特徴から診断へと至るボトムアッププロセス,特定の疾患に関する仮説からそれに関連する画像特徴を抽出していくトップダウンプロセスの双方を実装し,画像と意思決定者の相互作用を仮定する.我々は,現実の医師の読影プロセスはトップダウンとボトムアップの両者が繰りかえされることで,診断が決定していくものと考える.本研究の第1の目的は画像の探索過程(知覚)と診断へ至る思考過程(解釈)の循環的なモデルを計算機に実装することである.
本研究の第2の目的が診断プロセスモデルを利用したCADシステムの構築である.医師の診断プロセスを正確に反映したモデルを構築できれば,これまでのCADシステムとは異なる機能を実装することができると考える.例えば医師の診断プロセスを計算機がトレースし,プロセスの各段階(画像の知覚過程/画像特徴の解釈課程)において医師が必要とする情報を提示する機能を有したCADシステムの開発,また疾患と所見を結合する構造的知識を利用し,医師の診断プロセスをガイドする機能の開発を行う.
今年度は,本研究の目指す診断プロセスモデルとCADシステムが現実の読影現場において妥当であるのかを検討するために,予備的な実験(現場観察)を行った. |
| 複数メディアを扱う研究開発のための基盤整備-MIST- |
○高橋友和,出口大輔,伊藤雅紀 |
映像や画像,音声などの複数のメディアを扱う研究の効率化を目的として,メディア統合標準ライブラリMIST(Media Integration Standard Toolkit)の実現を検討し,そのプロトタイプを開発した.開発にあたっては,以下の3つの性質の実現を目指した.
- 異なるメディアを統一的に扱うための標準ライブラリ
- 各研究グループのメディア処理ノウハウの収集
- 可能な限りプラットホーム非依存なライブラリ
|
| バイモーダル情報を用いた発話区間検出 |
〇宮島千代美(武田研究室),二宮芳樹(末永研究室),二宮芳樹 |
車内のような雑音環境における音声認識では,音声雑音の影響を受けない唇の映像情報を音声と組合せ,バイモーダルの発話区間検出や音声認識を行うことが有効であると考えられる.本研究では,まず,バイモーダル音声認識の評価用のデータベースとして,室内および実走行車内において約150名の音声と顔映像の収録を行った.室内収録データ対し,0〜20dBのSNRの音声雑音と回線特性を加え,近赤外口唇映像にガンマ値の変動による映像雑音を付加し,バイモーダル音声認識実験を行った結果,音声に映像情報を加えることにより33%の誤り削減率が得られた.また,車内収録データに対する予備実験においても,映像情報を併用することによる認識性能の改善が得られた. |