エビデンス入門(43) 食品臨床試験のエビデンスの強さ
関西福祉科学大学 健康福祉学部 福祉栄養学科講師 竹田 竜嗣
機能性表示食品に関連する食品研究が増加しており、関連する領域の学術雑誌では、論文掲載件数が増えている。食品を用いた試験であっても、ヒト臨床試験を実施していることから、医学系の研究と比較される。そういった点で、医学系、特に臨床系の研究者から見ると、昨今の一部の食品臨床試験の結果や論文は、研究手法や試験デザインなどで違和感を持つ研究者が存在し、批判や意見を受けることも少なくない。
特定保健用食品(トクホ)や機能性表示食品向けの臨床試験は、医薬品などを用いた臨床試験と異なり、対象となる被験者の条件が細かく定められている。特に生活習慣病関連のヘルスクレームについては、臨床検査値が正常上限値付近であることから、限定された集団における実施ともいえる。ガイドラインで定められているため、実施側の企業などはどうすることもできないが、この点を指摘してエビデンスが限定的であると感じる研究者もいると考えられる。また、統計解析方法について指摘する研究者もいる。例えば、有効性解析における除外の基準が厳格でないこと、除外者が多いなどの指摘を行う研究者もいる。さらに、経時測定を実施している試験などでは、統計手法について、多重性が考慮されていない点を指摘する研究者もいる。
多重性とは、統計的検定を繰り返すことで生じる過大評価を指す。経時測定を実施する場合、時点ごとにt検定を繰り返すことは多重性が生じるといわれる。検定を繰り返す場合、過大評価しないよう、p値を調整できる統計手法で検定を実施するというのが一般的な考え方となっている。
しかし、統計手法については、昨今、多重性を考慮しすぎることで過小評価するという意見も存在する。つまり、検定を行う回数を厳密に考慮すると、有意差が極めて出にくくなるという考え方である。どちらが正しいとは言い切れないが、経時測定試験で多重性を避けるための考え方の1つとして、エンドポイントを1点決めておき、その時点で単純t検定を実施して有意でなければ、試験自体の有効性は言えないとする。
また、そのほかの時点での検定も実施するが参考データとする考え方である。統計手法については、色々な考え方があり、絶対的な正解は存在しない。そのため、科学論文では、複数の専門家による査読制度が設けられている。査読を受けることで一定の科学根拠の質を担保するという考え方である。機能性表示食品やトクホの根拠論文は、査読が十分専門的に実施されているかも問われることがある。医学系の専門家から見た食品臨床試験の論文は、解析手法などが異なり、エビデンスとしては十分でないと感じるのかもしれない。しかしながら、正しい倫理的手順と厳格な解析により見出された結果は、被験者が限定的条件の可能性はあるが1つのエビデンスとなる。
食品の臨床研究は、さまざまな専門家から指摘を受けつつも、複数の試験結果を重ねることが必要になってきている。複数の試験結果は、再現性も満たし、より強固なエビデンスに成長する。原料を供給する会社も、最終製品を開発する会社も、1つのエビデンスだけでなく、複数のエビデンスを積み重ねる必要が出てきている。
(つづく)