ポアソン分布とRule of Three(統計学ワード)

私的背景

薬剤の副作用について Rule of Threeという法則がある。関連するポアソン分布についても調べたのでまとめておく。

結果

Rule of Threeとは

「薬剤市販後調査で確認できるような重篤かつ稀な事象の生起に関する法則」である。

生起確率が 100(1-α)% 片側信頼区間の上限のときの期待度数を下表に示す。

n \ α 0.1 0.05 0.025 0.01
10 2.056718 2.588656 3.084971 3.690427
100 2.276278
2.951305
3.621669 4.500741
1,000 2.299936
2.991250
3.682084 4.594583
10,000 2.302320
2.995284
3.688199 4.604110
100,000 2.302559
2.995728
3.688811 4.605064
1,000,000 2.302582
2.995728
3.688873 4.605160
Poisson 2.302585
2.995732
3.688879 4.605170

n=number、例数  α=alpha、危険率

表1. 参考文献1より作成

 

Senn(文献2)とUchiyama(文献3)は、Rule of Three(rule of three for zero events)を absence of evidence is not evidence of absence と表現し、次のような形で説明している。

 

Ro(Rule of Three)とは、人調べて 1度も事象が観測されなくても、他の n 人中の 3人に事象が観測される可能性がある。

 

また文献1の著者は、新たなルールとして R’oを提案している。これによると、

n 人調べて 1度も観測されなかった事象が別の n 人で 4人以上に観測された場合には事象の発生確率が増えた

と判断するようです。

ポアソン分布とは

「ある期間に平均 λ回起こる現象が、ある期間に X回起きる確率の分布」のようで、各発生回数における生起確率を算出できるようです。またランダムに起きる事象との相性が良く、逆を言えばランダムに起きず、何かの因子に強く影響を受けるようなアウトカムの算出においては、使い方に気をつける必要がある。

結論

Rule of Threeとは、例えば 100万人調べて 1度も事象が観測されなくても、他の 100万人中の 3人に事象が観測される可能性があるとする法則である。

つまり、ある新薬の臨床試験で重篤な副作用が観察されなかったからといって安心はできない。市販後調査でやっと検出できるような副作用もあるためである。

また Rule of Threeは α=0.05のとき、そして n=100以上のときによく近似し、例数 100万でも近似していた。これは Poisson分布からも導出でき、よく近似していた。従って zero eventsであっても Poisson分析によりリスクを推定できる。

新しかろう良かろう、新しいから使ってみようという思考について、再認識と再考を求める法則ではなかろうか。

参考文献

  1. Iwasaki M et al. Statistical Inference for the Occurrence Probability of Rare Events – Rule of Three and Related Topics – 計量生物学; 26 巻 2 号: p.53-63. 2015
  2. Senn S. Statistical Issues in Drug Development. Chichester; John Wiley & Sons: 1997
  3. Uchiyama A. Management of safety information from clinical trials. DIA Tutorial “CIOMS Initiative for Safety Information” February 18 2005

 

 

-Evidence never tells you what to do-




 

95%信頼区間とは何ですか?(統計学ワード)

⌘ 背景

今更ながら “95%信頼区間” という言葉の定義を自分なりに理解したい。

⌘ 結論

95%信頼区間とは、95%の確率で母集団の平均を含む区間である。

 

 しかし、より正確には、仮に同じ臨床試験を 100回施行した場合、そのうち 5回くらいの結果は真の値を含まない平均値(点推定)を示す、ということである。

⌘ 解説

薬の効果と副作用を検討する際、世界中の全人類が臨床試験に参加することは不可能である。年齢や既往歴等の特徴で参加対象を絞ったとしても、その特徴を有す全員が参加することもまた現実的ではない。

 

 ではどうするのか?その問いの一つとして区間推定があげられる(以下のイメージ図を参照)。

 

 

f:id:noir-van13:20171109001735p:plain

(点推定と 95%信頼区間のイメージ図)

 

 

 ある薬剤Aについて、評価項目(アウトカム)の発生数(イベント数)を計算しサンプルサイズ(標本数)を予め設定することで、全体(母集団)の平均値を推定しようとする試みである。サンプルサイズは過去の類似研究の結果を基に算出することが多い。

 

 臨床試験の結果は、ハザード比やリスク比、オッズ比 etc. で示される。

 

 例えば、ある臨床試験のアウトカムにおけるハザード比 =1.21 が点推定値であり、その 95%信頼区間 0.78-1.62が区間推定値である。

 

 つまり、ある臨床試験に参加した集団(標本)の平均値は 1.20であり、母集団(全人類)の平均値、つまり真の値を含んでいそうな区間が 0.78-1.62の範囲内に 95%の確率で存在している、ということである。

 

 より正しくは真の値に対して重きを置くので、100回施行したうちの 5%は真の値を含まない、という表現の方が良いのかもしれない。

 

 上記の解説はややこしいので「ある試験を 100回やったら 95回は同じ結果になるよ」で何ら問題ないと個人的には思う。

⌘ 参考資料

1. いまさら誰にも聞けない医学統計の基礎のキソ 第1巻 まずは統計アレルギーを克服しよう! ISBN-10: 4904307240、ISBN-13: 978-4904307243(発売日: 2010/4/10)