お茶の水女子大学
理学部情報科学科
藤代 一成
|
1. データ危機
シミュレーション・計測環境の劇的な進歩によって,日常的に扱う数値データの量は飛躍的に増大している.たとえば1つのランにつき,サイズ5123の1バイト長3次元規則格子データ(ボリュームデータ)を1万タイムステップとると仮定しよう.4種類の関連する物理パラメータに対して各々8点だけ代表値をとったとしても,対照実験に必要なデータの総量は64ペタバイトにも達してしまう.
このような大規模時系列データのすべてを可視化して比較することは至難の業である.実際には分野固有の知識を頼って,見るべきランを絞り,さらに時区間を限定してアニメーションを制作するのが現実的な策であろう.しかしボリュームの可視化は曲者である.3次元の詰まった情報をスクリーンに投影するのであるから,所詮何かを犠牲にしなければならない.しかしどこで断面を切ればよいのか?どの標的値で何枚の等値面を抽出すれば十分なのか?どのようなカラーと半透明度への伝達関数(transfer function)を用意すれば,遮蔽効果を極小化してデータの特徴を捉えられるか?どれ一つとってもスナップショットのボリュームでさえ難しい問題なのに,一度決めた規則を守ってアニメーション化してみても,結局何も視覚的に捕捉できていないとわかったら,また最初からやり直しである.挙句の果てに未処理のデータの山を築いてはいないだろうか?
2. 時系列ボリュームのビジュアルデータマイニング
我々の研究グループは,このデータ危機に挑み,大量のデータからも有用な情報を探り出すために,ビジュアルデータマイニング[1]を推進する共同プロジェクトを1999年から継続してきている.そこでは,汎用的なデータ視覚探索環境を実現するため,データの局所的な性質だけでなく,大局的な傾向も同時に把握することができる特長をもつ微分位相幾何学(differential topology)の知見を利用するという一貫した姿勢をとってきた.
図1に,時系列ボリューム(4Dボリューム)に対するビジュアルデータマイニングの枠組み[2, 3]を示す.ここでは最初から対象の時空間をアニメーション化せずに,その代わりT-IS(Topological Index Space)とよばれる帯状の時系列データプロファイルをユーザに提供する.T-ISを生成するには,まず各時刻のスナップショットボリュームから位相骨格情報を取り出す.その表現にはVST (Volume Skeleton Tree)[4]が用いられる.VSTはボリュームデータの特徴を,等値面の生成・消滅・併合・分岐を生じさせている臨界点(critical point)の接続関係で表現したレベルセットグラフの一種である.このVSTを位相索引(topological index)とよばれる特徴量に変換して擬似カラーで符号化し,一列に並べたものがT-ISである.図1では水素原子に陽子を衝突させるシミュレーションにおける電子の電荷密度分布データ(1万ステップ)の時間変化を100分の1にダウンサイズしたT-ISが示されている.明るい箇所ほど位相的に複雑であることを示しているため,ユーザはここから衝突に伴う複雑な現象が生じている時区間を直感的に見つけ,アニメーション作成時の範囲設定の目安に利用することができる.
次にこのT-ISを,位相変化を起こしている特定のスカラ値をトレースできる拡張T-IS (expanded T-IS)に展開する(expanding).ユーザは限定した時区間内で今度は標的とするべきスカラ値の範囲を絞り込み,特に複雑な振舞いをする箇所を強調するように伝達関数を調整することができる.
この時点で,計算環境のメモリスペースに必要なデータフラグメントだけを選択的にローディングすることができ(selective data migration),適正にチューニングされた伝達関数を用いて,情報量の豊富なアニメーションを効率的に制作することができる.ユーザは特に観察したい時刻を特定して,対応するスナップショットのボリュームを抽出済のVSTの情報をもとにプロービング(probing)することもできる.臨界点を含む臨界等値面(critical isosurface)の形状をつぶさに解析し,その値の近傍を強調的に描く伝達関数を用意すれば,微分位相幾何学的に最適化されたボリュームレンダリング像を半自動的に得ることもできる.図1では実際に,衝突後に陽子から水素原子核に迂回して戻ろうとする電荷の特徴的なパターンを伴う電子雲の歪みが得られている.
図1 時系列ボリュームデータマイニングの枠組み
3. ポストをプレに!
こうした一連の流れで得られた情報をベースにすれば,解析すべき時区間を特定して,より細かいタイムステップで,しかも必要ならば関連物理パラメータ値を調整して,再計算を行うことができる.これが適応的ステアリング(adaptive steering)であり,パラメータ空間の強力なナビゲーションツールとしての利用が見込まれている.このフィードバックループこそが,従来のポスト処理としての可視化をプレ処理としても活かす情報ドリルダウン(information drill-down)の中核をなしている.可視化を,セレンディピティ(serendipity)を必然化するツールとして再評価させる契機を与えられるような取り組みを今後も続けていくつもりである.
謝辞
本共同研究プロジェクトのコアメンバである高橋 成雄氏(東京大学),竹島 由里子氏(日本原子力研究所)および歴代の学生諸姉に深謝する.
参考文献
[1] I. Fujishiro, et al.: "Volume data mining using 3D field topology analysis," IEEE CG &A, 20(5):46-51, Sep./Oct. 2000.
[2] I. Fujishiro: "T-map: A topological approach to time series volume data mining," Science & Technology in Japan, 22(86):6-11, July 2003.
[3] 大塚,他:「T-map:位相的特徴解析に基づく時系列ボリュームデータマイニング手法」,画像電子学会誌, 31(4):504-513, 2002年7月
[4] S. Takahashi, et al.: "Volume skeletonization and its application to transfer function design," Graphical Models, 66(1):24-49, Jan. 2004.
|