エビデンス入門(42) 統計検定の選択
関西福祉科学大学 健康福祉学部 福祉栄養学科講師 竹田 竜嗣
有効性を調べる臨床試験を実施したのち、結果の解釈は統計的検定によって、プラセボとの差である群間比較や、摂取前との差である前後比較によって有意差を確認し、事前に有意差が認められれば、有効性を確認したと根拠付けることができる。
検定の種類はアウトカムによっても異なり、各アウトカムの特性に応じて最適な検定の方法を選択することになる。これらの手法の選択は、望ましくは、試験終了後からデータ固定直後など、実際のデータについて変更が無い段階で決めておくことが望ましいとされる。また、臨床試験の計画書の他に統計解析計画書を作成し、検定の選択、データの取り扱い方法などについても定める。
こうすることで、実際のデータを見てから解析することによって、実施者にとって有利な統計的手法の選択による過大評価を防ぐことができる。このように、統計手法の選択は結果の評価を左右することから、厳正な手続きによって定めることが基本である。また、統計手法は新しい手法や考え方が出てきており、古典的統計解析手法であるStudentの検定(t検定)だけでなく、ベイズ統計学と呼ばれる新しい考え方が出てきている。
統計学は確率論なので、「有意である」とする基準を事前に決めて、結果について有意とする基準に達しているかどうかを判定する。本来、有意とする基準は、検定者が勝手に決めても良いはずであるが、5%が標準とされ定着している。この理由は諸説あるが、多くの科学誌において5%の有意差を元に論文が執筆され、さまざまな事象が評価されている。
また、検定にはさまざまなルールがある。代表的な例としては、「多重性」の問題だ。多重性の一例を挙げると、3群(A群、B群、C群)での比較を行う場合、総当たりでStudentの検定のような2群間の検定を繰り返すことは、問題があるという考え方である。同じく、経時測定の試験についても、各時点間で2群間の検定を繰り返すことは、多重性の問題があるという考え方である。この多重性の問題を解決するには、有意差の基準について検定を繰り返す分だけ調整する、あるいは、有意差で算出されるp値の計算方法を検定の回数を考慮して調整するということである。つまり、それだけ有意差の基準を厳しくすることになる。
多重性については賛否両論ある。特定保健用食品(トクホ)の申請に関する有効性の判定は、経時変化の臨床試験の場合、2カ所以上の有意差が必要などの記載に留まっており、検定手法については指定が無い。特に経時変化において多重性を考慮するにあたって、使いやすい検定が少ないこともある。検定手法の選択は計画段階から予め想定しておくことが重要だ。
(つづく)