3.9.2 巨大地震関連現象の解明に資するデータ同化およびデータ駆動型モデリングの研究開発

(1) 革新的データ同化の創出を目指して

科学研究を進める上において,物理・化学法則等に基づく数値モデルと,観測・実験に基づくデータの比較が重要であることは論を待たない.しかしながら,近年の巨大スパコンの登場や大規模地球観測網・実験設備等の整備に伴い,大規模数値モデルと大容量観測データを突き合わせることすら容易ではなくなってきた.数値モデルと観測データをベイズ統計学の枠組みで統融合するための計算技術であるデータ同化は,時々刻々と入力する観測データに基づいて各時刻における状態の逐次推定を行う「逐次データ同化」と,予め決められた時間窓において観測データと最も整合する状態を探索する「非逐次データ同化」とに大別される.逐次データ同化で行う状態推定においては,アンサンブルカルマンフィルタや粒子フィルタに代表される逐次ベイズフィルタが用いられるが,素朴な実装をしてしまうと,世界最大のスパコンを以てしても計算機資源が全く不足するという事態が簡単に起こる.大規模数値モデルへデータ同化を実装する際には,4次元変分法を始めとする非逐次データ同化を用いるのが常套であり,例えば気象予報は主に4次元変分法に基づいて行われている.実装の手間は逐次ベイズフィルタよりも大きくなるが,必要な計算コストは格段に小さくて済む.

従来の4次元変分法は,事後分布の局所最大を与える状態を推定するのみであり,その不確実性を推定することが原理的に不可能であるという大きな欠点があった.例えば,台風の進路予測においては,中心位置の不確実性を「予報円」によって表現するが,これは従来の4次元変分法は算出することができず,アンサンブル計算によって求められている.すなわち,現在の天気予報では,非逐次/逐次データ同化を恣意的に組み合わせて実施されているのが実情である.我々は,2nd-order adjoint法を採り入れることにより,不確実性評価が可能な4次元変分法を開発することにより,これを解決した(Ito et al., 2017).このようにして得られた不確実性は,観測デザイン最適化のためのフィードバックともなる極めて重要な情報である.

それでもなお,現行の4次元変分法には,初期解に強く依存した局所最適解しか得られないという問題がまだ残されており,固体地球科学の実問題に適用するためには,これを乗り越えるようなアルゴリズム開発が求められる.本年度は,レプリカ交換モンテカルロ法を実装することにより,「革新的4次元変分法」とも言うべき,初期解に依存しない大域的最適解を求めることが可能な4次元変分法のアルゴリズム開発に着手した(後述(2)を参照).さらに,固体地球科学分野で得られる非時系列データへ適用可能なデータ同化法開発にも取り組んだ(後述(3)を参照).元来,データ同化は,時系列データへの適用が前提であったが,この手法が確立することで,より広いクラスのデータへの適用が期待され,データ同化がより効率的な情報抽出を実現する方法論へと昇華する.

(2) 4次元変分法による大規模データ同化に基づく予測不確実性評価法の開発

本センターは,科学技術振興機構(JST) 戦略的創造研究推進事業CRESTの研究領域「計測技術と高度情報処理の融合によるインテリジェント計測・解析手法の開発と応用」において,平成29年度に採択された研究課題「ベイズ推論とスパースモデリングによる計測と情報の融合」に参画し,本学大学院新領域創成科学研究科との協働により,ベイズ推論に基づいて実験計測効率を最大限に高める「ベイズ計測」を実現するための情報数理基盤の開発研究を実施している.非逐次型データ同化法である4次元変分法は,フォワード計算を実施するための数値モデルから「アジョイントモデル」と呼ばれる方程式系を構成する必要があるため,アンサンブルカルマンフィルタや粒子フィルタのような逐次ベイズフィルタを用いたデータ同化手法と比較して,実装は容易ではない.しかしながら,実装さえしてしまえば,必要なメモリ容量と計算時間を数値モデルと同等に抑えることができるため,連続体計算のような自由度の大きい数値モデルを用いるデータ同化を実施する際には,極めて有効である.従来の4次元変分法に基づくデータ同化では,勾配法による最適化を行うため,逐次型データ同化法では自然に得ることができる推定値の不確実性を評価することが不可能であった.これまでに本センターでは,その4次元変分法の弱点を解決する新アルゴリズムを開発し,大自由度系の数値モデルに対する推定値の不確実性の高速かつ高精度な評価を可能にした.さらに,得られた不確実性が系の将来状態へ与える影響を高効率に予測する方法論を構築した.この手法群は,任意の自励系のシミュレーションモデルへの適用が可能であり,浅水方程式などの津波モデルや,断層運動を取り扱う弾性体モデルなど,固体地球科学で用いられる様々な大規模シミュレーションモデルへ応用することにより,得られた不確実性が未来の状態の予測へどの程度影響するかといった客観的評価を与えると同時に,予測の高精度化や観測デザインの最適化への還元が期待できる.本年度は,本手法群をさらに高度化させるため,レプリカ交換モンテカルロ法と4次元変分法を組み合わせる,Metropolis-adjusted Langevin algorithm (MALA)の実装に着手した.MALAは,4次元変分法で用いられる勾配法における状態更新の際に確率的な揺らぎを導入することで,より高速かつ大域的な最適推定値の探索を可能にする手法である.一般に4次元変分法で探索する評価関数は多峰性をもち,通常の4次元変分法の枠組みでは局所解に留まる可能性が非常に高いが,確率的要素を組み込んだMALAにより,評価関数の峰を超えて,大域的な最適推定値を探索することができる.MALAの試行として,岩石組織の成長プロセスを表現する多相フェーズフィールドモデル(PFM)に対して,観測量が不十分で評価関数が大量の局所解をもつ問題に適用した.その結果,MALAは初期解に依存しない大域的推定値を得ることを確認した.今後は,本手法を地震波動モデルに適用することを予定しているが,実際の観測量は地上観測点での波動場のみであるので,この限られた観測量から地下構造や震源位置などを推定する場合,評価関数が複雑な多峰性を持つことが予想される.既存の4次元変分法では,そのような場合には極めて良い初期モデルを与える必要があったが,MALAはある程度ラフな初期モデルから出発しても,地下構造や震源位置などについての安定した推定が可能になると考えられる.さらに,Ito et al. (2017) の不確実性推定法を適用することにより,波動場の不確実性を高速評価が可能になり,観測点の最適配置に向けたフィードバックや推定の高度化などへの応用が期待される.

(3) 非時系列データへのデータ同化の応用

通常のデータ同化は,観測データが時系列であることを前提とする.そのため,非時系列データは,本来はデータ同化の適用範囲外である.しかしながら,岩石組織や地層など,時間発展の情報を持たない非時系列データが固体地球科学分野では多く存在する.このような非時系列データから,系の時間発展に関わる情報を抽出する方法論を構築することは,固体地球科学分野にとって重要な問題であるだけでなく,データ同化をより広い分野と広いクラスの問題へ適用可能な手法へと拡張するという数理科学的な意味においても,挑戦的な課題である.今年度,本センターでは,岩石組織データおよび金属組織写真データから系の時間発展を抽出する問題を課題とし,それを実現する新規データ同化アルゴリズムの開発に取り組んだ.

岩石組織は,過去の圧力・温度履歴を反映した自然の記録媒体と見なすことができる.しかしながら,その写真データからは岩石中の空間的な化学組織がわかるのみであり,既存のデータ同化の枠組みに必要な時系列情報にはなっていない.本センターでは,この非時系列データから,岩石が成長過程で受けた圧力・温度履歴を推定する新規データ同化アルゴリズムを開発した.具体的には,岩石組織データをガウス過程回帰で補間することで空間連続的なデータへと変換し,岩石の平均粒径が従う時間発展方程式と粒子フィルタを組み合わせることにより,圧力・温度履歴を推定する.擬似データを用いた数値実験により本手法を検証したところ,圧力・温度履歴を正しく再現できるのみならず,その不確実性も評価できることを確認した(Kuwatani et al., 2018).今後は,本手法をPFMへ実装し,空間的な圧力・温度履歴推定など,より詳細な情報抽出のための方法論へと高度化させる.

また本センターは,内閣府・JSTによる戦略的イノベーション創造プログラム(SIP)「革新的構造材料」に参画し,特にデータ同化を軸として,複雑かつ限られた材料データから最大限の情報を抽出し,高効率な材料開発を実現するための数理基盤技術の開発研究を実施している.

岩石および金属物質の内部に普遍的に存在する結晶方位の食い違いに起因する特徴的な空間構造(粒構造)は,その物質のマクロな物性に直結するため,数値シミュレーションによって外部からは観測できない粒構造の予測およびその不確実性を評価することは,物性評価およびその時間発展の予測のために極めて重要である.粒構造の時間発展は前節で挙げたPFMで記述されるが,PFMは実験で直接観測不可能な現象論的パラメータを多く含む大自由度モデルであるため,既存の統計学的手法を用いて限られた観測データからシミュレーションに必要なパラメータや場の初期状態を推定・評価することは困難であった.さらに,通常得られる計測データは時間発展の途中の粒構造の静止画像であり,必ずしもPFMの時間発展に寄与するパラメータの情報を含む時系列データが得られるとは限らないため,パラメータ・初期状態推定を効率的に行なうための計測データの設計が必要不可欠となる.鋼の粒構造の写真データをテストデータとして,本研究ではPFMと大自由度モデルデータ同化を用いて粒構造写真データからパラメータや場の初期状態を効率的に推定する方法論を提案した.具体的には,温度履歴の異なる複数の粒構造静止画像データから粒構造の時間発展の特徴を表現する統計量の時系列データを構築し,PFMから計算される理論値と比較することでパラメータの事後分布の評価を行なう.さらにその事後分布を経験ベイズ法に基づいて評価することで,与えられた粒構造の候補からデータを最も再現する最適な初期粒構造の選択を可能にした.この手法により,自由度の大きいPFMを用いた場合でも,現実的な計算機資源・実行時間内でパラメータ推定および不確実性評価や初期粒構造推定,ひいては粒構造の成長予測の効率的な評価が可能になった.