Heidegger: Interpretable Temporal Causal Discovery
イントロ
- なぜ一部の人は歳を取ると認知能力が下がるのか? 何が原因なのか?
- このような因果関係を見つけることは認知の低下を予防するための介入を行う上で役に立つ
- 機械学習技術は因果の探索においては未発展
- ほとんどの手法が単なる相関の分析にフォーカスしている
- ゴールドスタンダードはランダム化比較試験
- コスト, 倫理, 技術の問題がある
- 観測データから因果を見つける手法も提案されている
- 生物学・化学における因果探索においては変数が時間によって大きく変化する
- 時間を考慮した因果探索を行う際は自己相関, 影響の遅れ, 潜在因子の影響, サンプリングの偏り, 一時的な介入, 計算コストを考慮する必要がある
- グレンジャー因果は時系列間の相関を評価するための先駆的な手法
- しかしスパース性, 潜在因子, 非線形性, 多次元の関係性には対処できない
- 最大の欠点は因果の広い捉え方にある (予測に効く変数=因果関係があるとは限らない)
- もう一つのアプローチは構造学習を適用するもの
- 変数の数とともに計算量が増加する
- 既存手法の最大の欠点は因果を限られた意味で使っていること
- ある変数が変化したら出力が変化するか否かのみを学習結果として出す
- 変数が従う時間変化パターンは可視化できない
- 提案手法はグラフベース探索で効率性を, 準実験的研究 (QED)で柔軟性を担保
提案手法
- 因果関係をグラフで表す (エッジ=因果関係)
- 探索空間においてQEDを用いて最適なグラフを探す
- 対照群と処理群を因果プロファイルとコントロールプロファイルに基づいて選ぶ
- 選択した群をブロックに分ける
- ペアごとに検定を行い各群が有意に異なるかどうか判定する
実験
- 因果関係の発見能力の評価にAC交流送電システムのデータを用いた
- ノードの値=電力システムの電圧
- 候補の変数はインダクタンスの電圧, 出力はコンデンサーの電圧
- 図3aからわかる通り提案手法は高精度に因果を発見することができる
- 探索の強さの評価にはcognitive health studyをデータとして用いた
- ライフスタイルの変化が認知の低下に影響するかどうかは明らかになっていない
- 4091人のライフスタイルに関する調査 (10年間, 60歳〜85歳, 実験開始時に認知症を患っていない)
- 図4は候補の変数同士で検定を行なった場合のp値
- 赤い線はBenjamini-Hochbergを用いてFalse Discovery Rateを調整した結果
- p値は均等に分布した長いtailを持つ
- 提案手法は全体の24.8%の仮説のみを検証し最もありえそうな因果を発見することができた
- 運動, スポーツクラブへの加入, 学習クラスへの加入が認知症の予防になるという仮説が見つかった