Business Athlete Club

Metric	中立値 / 閾値	読み方
HR / RR / OR	1.0	1.0未満→リスク低下、1.0超→リスク増加
95% CI	1.0をまたぐ	またいだら有意差なし
p値	0.05	未満で「差がある」（万能ではない）
n数	—	千〜数十万、サブグループでは激減
追跡期間	10年+	mortality は10年以上が望ましい
NNT / NNH	—	1人を救うのに何人を治療するか

TBL.01 · 主要数値の早見表

「HR 0.60」=「40%リスク減」。

ハザード比は1.0からの乖離で読み替える。 0.60 なら40%減、1.30 なら30%増。CI が 1.0 をまたいでいれば「有意差なし」。

p値は万能ではない。

サンプルが大きいと臨床的に無意味な差でも有意になる。 p値は HR/CI とセットで判断する。

§05.5

数字に騙される、6つの罠。

統計の知識が浅いままだと、論文を読んでも逆方向に解釈してしまうことがある。読み手として最も警戒すべき6つの誤読パターン。

Pitfall 01

「p < 0.05 だから本物」

Realityサンプルが大きいと臨床的に無意味な差でも有意になる。逆に小サンプルでは本当の効果も見逃される。p値は HR/CI とセット、効果量で判断。

Pitfall 02

「メタ解析だから絶対」

Realityメタ解析は元のRCTの質を超えない。「ガベージ・イン、ガベージ・アウト」。出版バイアス、ファネルプロット、I²ヘテロ指数を確認。

Pitfall 03

「n=10万だから信頼できる」

Realityサンプルサイズと代表性は別物。n=10万でも特定の集団に偏っていれば一般化できない。「誰を対象にしたか」を Methods で確認。

Pitfall 04

「新しい論文ほど正しい」

Reality再現性危機の時代、最初の研究は誇張されやすい。「単発の派手な論文」より「複数の独立した追試」を信じる。最新 ≠ 最強。

Pitfall 05

「Conclusion だけ読めば分かる」

RealityResults の数字と Conclusion の言い方が乖離していることが多い（特に産業funded研究）。Results の数字 → Conclusion の表現、の順で照合する。

Pitfall 06

「相関がある = 因果がある」

Reality観察研究では「健康な人ほど健康行動を取る」逆因果や残余交絡が常につく。RCT、メンデル無作為化、自然実験で初めて因果が見える。

論文を読むとは、書いてある通りに信じることではない。書いてある通りに「読めるか」を疑うこと。

Case · コーヒーと死亡率

2018年、ニュースが一斉に報じた。「コーヒーを飲む人は死亡率が15%低い」と。あなたはコーヒーを増やすか?

元データは約40万人、16年追跡の大規模コホート研究。報告されたのは HR 0.85 (95% CI 0.82–0.88)。統計的には文句のない数字だ。

HR 0.85

Relative Risk Reduction

コーヒー多飲者は非飲者に比べ、死亡ハザードが15%低い。これが「15%減」の正体。

95% CI

0.82 – 0.88

信頼区間が1.0をまたいでいない。統計的には頑強に見える。ただし「観察研究の95% CI」であることに注意。

ここに2つの罠が潜んでいる。

一つ目は「相対リスク vs 絶対リスク」の問題。 15%減と聞けば大きく感じる。しかし40歳の健康な非飲者の年間死亡率がたとえば0.5%なら、コーヒーで0.075%減る計算になる。1000人が1年飲み続けても0.75人分の差だ。

二つ目は「観察研究の交絡」だ。コーヒーを楽しむ人は、仕事が充実していて、社会的つながりがあって、運動習慣もある傾向がある。死亡率を下げているのは、本当にコーヒーか。それとも「コーヒーを飲む生活スタイル」か。観察研究では分離できない。

Spiegelhalter が "The Art of Statistics" で繰り返すのはこの点だ。「大きな数字は感情を動かすが、文脈なしの数字は噓をつく」。 HR 0.85 は事実だが、「コーヒーを飲めば長生きできる」は過剰解釈になる。

Ref: Loftfield E et al., NEJM 2015;374:1–11 · Spiegelhalter D, The Art of Statistics, Pelican Books, 2019, Ch.2

NNT · Number Needed to Treat

「スタチンで心筋梗塞リスクが36%低下」。これも相対リスクだ。

WOSCOPS試験（低リスク一次予防）のデータで絶対値を計算すると、プラセボ群の5年間の心筋梗塞発生率が約7.9%、スタチン群が5.5%。絶対リスク減少（ARR）は2.4ポイントほどだ。 NNT = 100 / ARR = 約42。

NNT ≈ 42

5年間スタチンを飲んだ42人のうち、心筋梗塞を1件防げる計算になる。残り41人は「飲んでも飲まなくても結果は変わらなかった」人だ。

NNT は「薬の効果の大きさ」を患者に伝えるときに最も誠実な数字だ。「36%リスク減」より「42人に1人に効く」のほうが、本人が「飲むかどうか」を決める根拠になる。絶対リスク減少（ARR）を論文から計算してNNTに変換する習慣は、どんな介入研究を読む時にも役立つ。

Ref: Shepherd J et al. (WOSCOPS), NEJM 1995;333:1301–1307 · Greenhalgh T, How to Read a Paper, 6th ed., Wiley-Blackwell, 2019, Ch.6

10 Questions · 統計的主張に出会ったとき

Spiegelhalter が "The Art of Statistics" 巻末で提示する問いを元に、論文の数字を見たとき自分に問うべき10のチェック。

01
相対リスクか、絶対リスクか
「30%減」は相対値の可能性が高い。元の発生率と ARR を計算する。
02
NNT はいくつか
1000人を1年間治療して何件防げるか。直感に落ちやすい単位に変換する。
03
対象は誰か
年齢・性別・基礎疾患・地域。自分が目の前にしている人と似ているか。
04
追跡期間はどれくらいか
8週間の研究の結果を20年間当てはめるのは推論の飛躍になる。
05
観察研究か介入研究か
観察研究で「因果」を語るには強い追加根拠が必要。相関から始める。
06
誰が資金を出しているか
産業 funded 研究は肯定的結論が出やすいことが系統的に示されている。
07
信頼区間はどこまで広がっているか
CI が広いほど不確実性が高い。「有意」でも CI が広ければ効果量が不明瞭だ。
08
この結果は独立して再現されているか
単発の派手な論文より、複数の独立した研究の一貫性を信じる。
09
未発表の試験が隠れていないか
出版バイアス。否定的結果は出版されにくい。Funnel plot の歪みを確認する。
10
この主張は覆る可能性があるか
HRT、β-カロテン、ビタミンEなど。Medical Reversal の歴史を忘れない。

Ref: Spiegelhalter D, The Art of Statistics, Pelican Books, 2019, Appendix · Prasad V & Cifu AS, Ending Medical Reversal, Johns Hopkins UP, 2015

Level 3 · checkpoint

ここまで読み終えると、
こんな視点が手に入る。

ハザード比・95%信頼区間・p値の役割を区別できる

「相対リスク減少」と「絶対リスク減少」を見分けられる

数値で人を騙す6つの罠を警戒できる

数字は、敵じゃない。

論文は、答えではない。判定の道具だ。

HR・95%CI・p値、最低限。

数字に騙される、6つの罠。

論文は、答えではない。
判定の道具だ。