kyoneco’s blog

教育、数学、統計といったテーマについて考えていきます

不連続回帰デザイン

ランダム化比較試験(RCT)は内的妥当性が最も高い、つまり真の効果に近い効果を引き出せる研究デザインです。しかし、巨額な費用や手間などでそうやすやす行えるものではありません。最近ではいわゆるビックデータの利活用が注目されています。日常生活などに溢れる情報通信機器の普及によってデータはいたるところに蓄積されています。様々な分野でビックデータを利用して新しい知見の発見をという機運が高まってきています。蓄積されたデータというのは研究目的に集められたものではありません。すでに起こったデータをもとに興味のある現象を解析していくというスタイルをとることになります。つまり観察研究としての位置づけとなるわけですが、情報の多様さと多量さを武器に新しい発見をしていきます。これまで、観察研究はRCTと比べると一歩劣る存在としてみられてきましたが、利用の仕方によってはRCTを補うことやRCTでは実現できないことも示すことができます。観察研究でネックとなるのは交絡です。交絡の影響を排除する最も確実な方法はRCTです。一方、観察研究はRCTと異なり、介入の選択がランダムではないため、交絡の影響を避けられません。この交絡因子の制御について近年は様々な統計手法の発達してきています。様々ま手法が開発されてきていますが、興味深いと思った、不連続回帰デザインについて読んだ*ので、まとめてみたいと思います。

*医学論文の難解な統計手法が手に取るようにわかる本 

https://www.kanehara-shuppan.co.jp/books/detail.html?isbn=9784307004879

 

不連続回帰デザイン

1960年、Thistlethwaite and Campbellらが教育心理学の分野で初めて利用した統計手法。ある閾値をもとに特定の処置を行う状況で、その処置の効果を判定できる。処置の割り当てに関わる連続変数を割当変数という。割当変数の閾値近傍の対象者を集め、閾値以上と閾値未満の2群間でアウトカムを比較する。閾値から非常に近い両群の患者を集めてくることが重要。割当変数について、測定時閾値近傍で分けた2群は、処置するかしないかは偶然によりランダムに割り当てられたと考えることができる。その後の両群を追跡し、アウトカムを比較すれば処置の効果を推定できる。この手法の前提として、割当のルールと閾値がわかっている、介入前に割り当て変数を操作できない、閾値付近で介入「以外」の要因はすべて連続的な変化であるというものである。データ解析して得られた結果の一般化可能性は、割当変数の閾値付近の対象者に対してであり、閾値から離れるほど結果の当てはめはできなくなる。割当変数の幅を変えた何通りかの感度分析を行う。

例1:降圧薬の治療効果

収縮期血圧測定時、140mmHg以上で降圧薬開始するというルールと閾値があるとする。139mmHgと140mmHgの血圧の対象者は本質的に差があるわけでないと考えられるため閾値近傍ではランダムに降圧薬が割り当てられたと考えることができる。閾値近傍の2群を比較してアウトカム(脳卒中の発症率など)を比較する。

 

例2:ワクチン接種の医療政策の影響評価

ある年のある月から、あるワクチン接種が国による勧奨接種から個人による任意接種に変更された。ワクチンの対象は小児である。この政策変更によって小児の生年月日によってワクチン接種をうける確率が異なるようになる。政策変更の基準月の前に生まれたか後に生まれたかはランダムである。基準月に近い前後で2群に分けてアウトカム(ある感染症の発症率など)を比較する。この具体的な形式の具体例としてSmith Lmら CMAJ 2015がある。