複数のタイムポイントの測定値と開始点との個別の比較 多重比較の問題

例えば、薬物投与前後で差があるかどうかを調べるために経時変化を追う実験を行ったとします。どの時刻で開始時刻(薬物投与前)と差が出るかを調べるために、複数のデータポイントの各々と測定開始時とをペアワイズに比較することにして、2群間の比較でよく使うt-検定やWilcoxon検定を単純に適用してよいものでしょうか?たまに、そのような解析をした論文をたまに見かけることがありますが、これは非常に初歩的な、統計の誤用だと思われます。

データを入力するだけで統計ソフトが出力を返してくれるので、適用する検定方法が間違っていたとしても、P値だけは簡単に得ることができてしまいます。その結果、有意差がないデータに有意差を見出して論文報告してしまう危険があるので、要注意です。

 

経時データ(反復測定値)の統計学的解析における誤用の多さ

鍼灸研究における統計誤用が多発しているため、この経時測定データの解析法について調べても、ほとんど誤用といってよい経時測定データの解析法 七堂利幸)

多群間の平均値の比較において,その目的に応じた多重比較法を用いることが一般化してきた.しかしながら,経時データのように複数の測定時点がある場合に,時点ごとに多重比較法を繰り返し適用することは,いずれかの時点で有意な差が出やすくなる「時点の多重性の問題」が新たに生じてしまう.(引用元:日薬理誌133,325~331(2009)

比較試験では各被験者について経時的に種々の評価や測定がなされ、経時的な薬効差の検討が行われる。この際の検定に当っては、薬剤群ごとに処置開始時点とそれ以降の評価時点とに対応のある場合の検定を繰返したり、各時点とに2群間での対応のない場合の検定を繰しがちであるが、それでは第1種の過誤の確率の増大する。(引用元:臨床試験の統計解析に関するガイドライン  平成4年3月4日)

 

経時データ(反復測定値)の統計学的解析に関する現状

一般に用量時間反型データに繁用されている統計解析は2種類ある.一っは「輪切り」検定であり,他の一っは2元配置分散分析である.(薬理試験における統計解析のQ&A 反復測定データの解析法への一提案 吉村功、大森崇 日薬理誌110、333~340(1997)

 

経時データ(反復測定値)の推奨される解析方法

13.経時的比較  

比較試験では各被験者について経時的に種々の評価や測定がなされ、経時的な薬効差の検討が行われる。この際の検定に当っては、薬剤群ごとに処置開始時点とそれ以降の評価時点とに対応のある場合の検定を繰返したり、各時点とに2群間での対応のない場合の検定を繰しがちであるが、それでは第1種の過誤の確率の増大する。このようなデータの場合には時点毎の比較ではなく、トレンドやプロフィルを比較するための特別な手法が必要である。

(引用元:臨床試験の統計解析に関するガイドライン  平成4年3月4日  http://home.att.ne.jp/red/akihiro/Old_stat_guideline_Japanese.pdf

  1. 臨床試験のための統計的原則 医薬審 第1047号 平成10年11月30日 各都道府県衛生主管部(局)長 殿 厚生省医薬安全局審査管理課長 本ガイドラインは、本通知の日以降施行し、これに伴い、「臨床試験の統計解析に関するガイドライン(平成4年3月4日薬新薬第20号)」(以下「旧ガイドライン」という。)は廃止する。

慢性疾患のための治療の研究で、経時的に機能の状態を評価する場合も、主要変数の選択に関して別の問題が生じる。可能な対処法としては、観察期間の最初と最後になされた評価の比較全期間を通じたすべての評価から求めた傾きの比較定めた閾値を超える若しくは下回る被験者の割合の比較、又は繰り返し測定データのための方法に基づいた比較といった多くのものがある。(引用元:2.2.2 主要変数と副次変数 臨床試験のための統計的原則 医薬審 第1047号 平成10年11月30日) *太字強調は当サイト

 

下は、なんでもかんでも検定して有意差を出せばよいと思っている人に対する警告。

では両者に共通な問題点は何だろうか.それは実験で知りたいことが反応の時間曲線であり,それが用量によってどうわるかであるのに,それに答えられるはずのない「検定という形式」の統計解析を行っていることである.ここで採用している検定という形式は,「反応が用量によって変わらない」あるいは,「反応が時間によって変わらない」という仮説が,実際に測定したデータから否定できるかどうかを判定するものである.だからそれによって得られる結論は,「反応が用量によって変わるところがあるかどうか」,あるいは「反応が時間によって変わるところがあるかどうか」ということでしかない.(薬理試験における統計解析のQ&A 反復測定データの解析法への一提案 吉村功、大森崇 日薬理誌110、333~340(1997))*太字下線強調は当サイト

 

参考

  1. 薬理試験における統計解析のQ&A 反復測定データの解析法への一提案 吉村功、大森崇 日薬理誌110、333~340(1997)一般に用量時間反型データに繁用されている統計解析は2種類ある.一っは「輪切り定」であり,他の一っは2元配置分散分析である
  2. 改訂増補版:統計検定を理解せずに使っている人のためにIII 池田 郁男 東北大学未来科学技術共同研究センター Published: 2019-10-01 © 2019 公益社団法人日本農芸化学会 ”たとえば,0分と5分後の2点の比較であれば,paired t testを行うことができる.しかし,ここでは4点あるので,paired t testは使えない.分散分析は何らかの変化が起こったことがわかるので,この例では有意差が得られれば,統計的に有意に増加が起こったと判断される.”
  3. 保健・医療研究の進め方入門 —R と EZR を用いて— (保健学共通特講 IV, VIII テキスト Rev. 0.9.9.4) 神戸大学大学院保健学研究科教授:中澤 港 2019 年 7 月 24 日  第 12 章 反復測定データの解析
  4. 薬理学研究における経時データ解析の考え方─血圧降下試験事例による解説─ 高橋 行雄 日薬理誌(Folia Pharmacol. Jpn.)133,325~331(2009)
  5. 経時データの多重比較法 岸本 淳司 (SAS/慶應義塾大学/東京大学)
  6. 反復測定分散分析 Repeated-Measure Analysis of Variance (ANOVA) オーエムエス出版
  7. 多群・経時データの解析と多重比較 医学統計セミナー アドバンスコース 下川 敏雄 和歌⼭県⽴医科⼤学 臨床研究センター(スライドPDF)
  8. 経時的繰り返し測定データの解析 医学統計勉強会 東北大学病院循環器内科・東北大学臨床研究推進センター 共催 東北大学大学院医学系研究科EBM開発学寄附講座 宮田 敏 2013/10/31 第6回
  9. Bretz et al. (2011). Multiple Comparisons Using R.
  10. 基本的な回帰モデル • 混合モデル • 「混合モデル」手法の別例 • 反復測定の例 JMP13.2 オンラインマニュアル
  11. 臨床試験における多重性の諸問題 計量生物学 Vol. 36, Special Issue, S 87–S 98 (2015)   寒水孝司 東京理科大学工学部経営工学科 
  12. 臨床試験における統計的諸問題 明星大学・理工学部 広津 千尋 数理解析研究所講究録 1273 巻 2002 年 78-86 
  13. 経時測定データの解析法ーその文献とソフトの紹介ー 七堂利幸 鍼灸研究における統計御用が多発しているため、この経時測定データの解析法について調べても、ほとんど御用といってよい
  14. 生物医学研究文献の誰でも見つけられる20の統計学的誤り Tom Lang
  15. ウィルコクソンの順位和検定とは?t検定との違いは?(一番優しい、医薬品開発に必要な統計学の教本)
  16. 連載 第 2 回 医学データの統計解析の基本 2 つの平均の比較 朝倉こう子・濱﨑俊光 t検定は日常的に利用されるが、実際のデータ解析 でのt検定の利用について、「観測値数が極端に少ない場合、t検定は適用可能か(観 測値数がどの程度あればt検定が適用可能か)」、「観測値の正規性の検定をしたとこ ろ、正規分布に従わないとの結果が得られたから、t検定の代用としてWilcoxonの 順位和検定(あるいはMann-WhitneyのU検定)を用いたが、この判断に間違いない か」、「統計手法の手順書には、2つの群でデータの分散の大きさが異なる場合には、t 検定の代用としてWelchのt検定を適用すべきとの記載があったが、2つの群の分散 が異ならない場合にもWelchのt検定は適用可能か」といった疑問をよく耳にする。
  17. 毒性試験および生物を扱う研究者のための統計解析 小林 克己