2011年6月8日水曜日

第4回助教の会


第4回目となる今回の数理助教の会は,数理第4研究室の田中冬彦さんで,「ベイズ予測とその応用」について発表していただきました.田中さんはJSTさきがけ「数学と諸分野の協働によるブレークスルーの探索」の研究員を兼任されており,統計の理論を理論物理学の研究と結びつけていくことも行なっています.

田中さんの主な研究テーマは「予測する」ということです.「予測」とは,n個のデータが観測されたときに,n+1個目のデータの値の分布を推定することです.推定された分布を「予測分布」と呼びます. 予測分布を用いると, 例えば, コンビニが新規オープンして1週間経過したあと, 7日間の売上データから翌日の売上がどのくらいになるか推測できます. 「明日の売上の期待値は100万円」だけでなく「売上が30万円以下になる確率は10%」といった情報も予測分布から得られます.

予測分布を求めるには,実際にはn個のデータがパラメータθによって定まる, ある確率分布から発生しているという確率モデルを立てて行います. さらに未知パラメータθも事前分布に従っていると仮定することで, ベイズの定理を用いて最適な予測分布(ベイズ予測分布)が構成できます. 先のコンビニの例であれば, 同じ地区の別のコンビニでの売上実績でパラメータの事前分布を求めておき, 実際の売上データと合わせることで, 明日の売上をうまく推測できるそうです. ただし, 新しい地区に初めてコンビニをオープンする場合には事前分布を構成できません.

このような場合に, どのような方法で事前分布を決めるかが理論的にも重要で難しい問題だそうです.一般にはJeffreys事前分布を使うのが汎用的なのですが,優調和事前分布が存在すれば,それを用いることで,Jeffreys事前分布よりもよい予測が可能であることが知られています.ここで問題となってくるのは,そのような優調和事前分布が存在するか,そして,存在するならば具体的に構成できるか,です.

田中さんの発表では,
・時系列分析など相関を持つデータに対するベイズ予測手法
・量子情報で扱うミクロの系への応用
という2つの話題に関して,ベイズ予測と事前分布を軸に話をしてもらいました.

一つ目の話は時系列データの解析です.株価・財務情報や気温などの時系列データは, 実際には互いに独立な確率分布から発生しているわけではありません. 上で述べたこれまでの結果では, データに独立性を仮定して予測を行なっていましたが, 田中さんの研究ではそれを相関をもつ場合に拡張しています.

要点は元の時系列データをスペクトルの世界に変換することです. 田中さんは,スペクトル解析の手法を用いて,時系列解析でよく用いられるAR過程において,必ず優調和事前分布が存在し,かつそれを陽に構成できることを証明しています.他の多くの研究では実問題に合わせて事前分布を発見的に決めているのに対し,田中さんの手法では事前分布の情報がない場合でも,理論的に精度が保証されて
いる事前分布を作ることができます.

二つ目の話は量子情報についてです.量子力学で記述されるようなミクロの系では,電子線の干渉やトンネル現象など,マクロではありえないような不思議な現象が起こります.たとえば,粒子の位置と運動量を観測したときに,それらの測定誤差はマクロの系のように同時確率分布に従いません.今回の発表では,粒子を密度行列や波動関数に対応させてそれらを予測する手法を簡単に紹介してもらいました.これらの予測は,通常のマクロの系のようにこれまでのデータの確率を混ぜ合わせるだけでは不十分で,二乗誤差を最小にして陽に計算する必要があります.時間の都合上簡単な紹介のみで終わってしまいましたが,物理の知識を全て忘れてしまった自分にとってはかなり難しそうでした...

このように田中さんの研究では,統計の理論的な枠組みを時系列解析や量子系に応用するために,概念からきちんと整備する所まで含めて取り組んでいます.最近ではQ-statsというグループを作るなど,統計理論と理論物理の研究者の交流が盛んになってきているそうで,これからの盛り上がりがかなり期待される研究分野でした.