エビデンス入門(16)臨床試験の解析
関西福祉科学大学 健康福祉学部 福祉栄養学科
講師 竹田 竜嗣 氏
機能性表示食品の届出の論文では、統計的検定を実施して有意差を算出する。統計的検定の実施前に、解析対象者(集団)を決定するが、試験に参加した全被験者の解析では、結果に影響を与えてしまう場合や試験途中で脱落した被験者がいる場合、それらの被験者を除外して解析する。
解析結果はさまざまな検定手法を選択するが、血圧やLDLコレステロールなどの連続量を評価する場合は、Studentのt検定を選択することが多い。t検定は、評価する尺度が繋がった値、つまり値と値の間を無限に取り得る値を評価する際に用いる手法で、パラメトリックな統計的検定と呼ばれる。一般的に正規分布している量を検定する際に用いる手法とされている。
正規分布は、データの分布(ばらつき)のグラフが左右対称の釣鐘状の分布になる。例えば体重を例に取ると、データを無限に集めたと仮定し、その分布をヒストグラム(縦軸に人数、横軸に体重値を書くグラフ)を作ると、おおよそ平均値部分が最もグラフの高さが高くなり、平均値以下、平均値以上が均等に分布し、そのグラフの形が左右対称になると考えて、集団ごとの平均値の違いなどに差があるかどうかを見る。
実際の臨床試験のデータでは、数が少ないので左右対称のグラフにはならないが、無限にデータを集めれば左右対称の釣鐘状になると考えて、統計的検定を実施する手法である。
それに対して、離散値(アンケートの点数のように、1点、2点と値と値の間が連続していない値)は、前述した正規分布にならないことが多いため、ノンパラメトリック検定と呼ばれるWilcoxonの順位和検定などを選択する。
ただし、VASアンケートなどのように、0~10cmの線分上で自由に値が取得できる場合は連続量とみなして、Studentのt検定を用いることもある。検定の種類については、大まかに言えば、評価するものが連続量か離散値かで手法を絞る。
また、よく見る結果の示し方にもいくつかの種類がある。例えば、結果の表では、各群の平均値とともに、データのばらつきの指標である標準偏差や標準誤差を使う。平均値は各群の代表的な値、真ん中の値という意味で、標準偏差や標準誤差はその幅(ばらつき)を表すことで、おおよその群全体の姿を見る。
標準誤差は必ず標準偏差よりも小さくなるため、グラフにした際は見栄えが良い。しかし、表している意味は全く異なる。標準偏差は解析集団のばらつきを示す。一方、標準誤差は真の平均値からのズレと表現される。
もう少しわかりやすく言うと、ある食品をLDLコレステロール値が高い30人に食べてもらって、12週間後のLDLコレステロール値を測定したとする。30人のデータのばらつきを表す場合は、標準偏差を用いる。しかし、この試験を何度も実施し、平均値を求めるという作業を繰り返した場合、平均値は当然変動する。その変動の幅が標準誤差になる。同じ試験を繰り返して平均値を求める作業を繰り返すことは、母平均を求める、つまり真の平均値を求めることを指す。
標準誤差と標準偏差には、このように大きな違いがある。どちらが適切かは、論文の書き手や投稿する雑誌の方針によって変わるため、見る側が注意する必要がある。
(つづく)