ANOVA (分散分析) がいつになっても良くわからない理由

2群間で平均値に違いがあるかどうかを調べるt検定なら、なんとなくわかった気になっても、3群間での平均値の比較でANOVAを使うだんになると、なんだかもやもやしてしまう。そのもやもやの原因は何でしょうか?もやもやしているのは自分だけ?と思いましたが、そうでもないようです。ANOVAにかかっていた霧がすっきりと晴れるような説明を紹介します。

分散分析は分散を分析する手法、ではない

名は体(たい)を表すと言います。それが染みついていると、「分散分析」は分散を分析する手法だろうと当然思ってしまいます。ところが、分散分析に関しては、名が体を表していないのですから、誰しもこんがらがって当然です。

分散分析ほど、その検定の名前と、何を検定しているのかのギャップが大きいものはないです。だって分散と言いながら、母平均を検定していますからね。(分散分析とは?分散分析表の見方やf値とp値の意味もわかりやすく! いちばんやさしい、医療統計 株式会社データシード)

its name is an acronym for “ANalysis OVAriance”, but it is not used for analyzing Variances. (F and Chi-square tests are used for that.) ANOVA is used for analyzing Means. The internal calculations that it uses to do so involve analyzing Variances — hence the name. (Statistics Tip of the Week: What ANOVA does and does not do Statistics from A to Z)

分散分析は、分散を分析する手法ではなく、分散を使って平均を分析する手法というのは、説明されないとわからないことです。