Deep State-Space Generative Model For Correlated Time-to-Event Predictions
イントロ
- Time-to-event予測はヘルスケアなどのドメインで重要
- 既存手法は柔軟なモデル化手法, 共変量間の非線形な関係を捉えるものなど多数
- ただしそのほとんどは一つのイベントを予測するもので, 複数種類のイベントの相関を考慮できない
- 例えばヘルスケアにおいては単一の臓器の異常だけでなく複数の臓器の異常の組み合わせが死につながるということがある
- ある臓器の機能障害が他の臓器の異常につながる場合もある
- このように死に至るまでの時間は他の種類のイベントの複合的な要因に依る
- 複数種類のイベント間の依存関係を理解することは予測を高精度化するだけでなく適切な介入プランを考える上で役に立つ
- しかし複数種類のイベント間の相関の発見は未だオープンクエスチョン
- 観測から隠れた患者の状態を捉え医療イベント間の相関を見つける
- 深層状態空間生成モデルを提案
- 複数種類のイベントを同時に予測 (例: 死亡リスクと臓器の異常リスク)
提案手法
- 潜在状態の変化を表す変数 \(z_t\)を導入
- 前の時刻の潜在状態と時刻 \(t\)における介入の影響で時刻 tにおける潜在状態が決まりそれに基づいて観測 (血圧などのバイタルサイン) xtが決まる
- ハザードレート \(\lambda\)を潜在状態 \(z_t\)に線形関数, ニューラルネットなどの関数をかませたものでモデル化
- 時刻 tにおける離散ハザードレートを \(S(t)\)と表記
実験
- MIMICデータを使用
- C-indexとAUPRCの二つの指標を用いて評価
- 図5はハザードレートと観測された死亡時刻 (円のマーカー)と打ち切り時刻(クロスマーカー)
- 観測イベントがある場合 (左の3列)はハザードレートが高く, 打ち切りデータ (右の3列)はハザードレートが低く推定されている
- レートは150時間ぐらいでサチっている (新しい入力がないと自然にサチる)
- 図6はハザードレートと各種イベントの発生時刻
- ハザードレートがゆるやかなイベントは遅めの時刻にイベントが発生し, ピーキーなものは早めにイベントが発生する
- また, 死亡率のハザードレートは臓器異常と強く相関していることがわかる
- 表3が各種イベントの予測精度
- 提案手法 (DSSM)は全ての指標で既存手法を上回る精度
- 特に短期予測のAUC-ROCとAPで大きな改善