シンプソンのパラドックス(2)
今回は統計の見方についての話です。
(1)新型コロナウイルス感染症で重症となり入院している患者のうち、およそ6割はワクチンの接種済みであった。
これはイスラエルにおける2021年8月15日時点のデータです。重症例が515件、うちワクチン未接種が214人、接種済みが301人でした。重症例のうち約6割は接種済みの人です。
このデータを見ると、「ワクチンはあまり有効ではない?」と感じるかもしれません。
イスラエルでは世界でもトップレベルでワクチン接種が進んでいる国で、国民のおよそ8割が接種済みとのことです。未接種が1,302,912人、接種済みが5,624,634人とのこと。そうすると、次のように計算できます。
- 未接種:1,302,912人のうちの214人が重症→人口10万人あたり16.43人
- 接種済:5,624,634人のうちの301人が重症→人口10万人あたり5.351人
「未接種なら16.43人が重症化するが、接種済みなら5.351人」ということは、ワクチンの有効性は67.4%となります。(16.43 − 5.351) ÷ 16.43 ≒ 67.4%であり、「接種によって重症例を67.4%減らすことができている」とみなすことができるからです。
(2)ワクチン接種によって、全年齢では重症例を67.4%減らすことができる。
ところで、これを年齢ごとに見るとどうなるでしょうか。ワクチンの接種率が高いのは高齢者で、未接種が多いのは若年層です。一方、重症化しやすいのは高齢者です。
データによると、年齢ごとの接種状況と重症例は次のようになっています。
年齢 | 人口数 | 重症例 | ||
---|---|---|---|---|
未接種 | 接種済 | 未接種 | 接種済 | |
全年齢 | 1,302,912 | 5,634,634 | 214 | 301 |
うち50歳未満 | 1,116,834 | 3,501,118 | 43 | 11 |
うち50歳以上 | 186,078 | 2,133,516 | 171 | 290 |
50歳未満については、次のように計算できます。
- 未接種:1,116,834人のうちの43人が重症→人口10万人あたり3.85人
- 接種済:3,501,118人のうちの11人が重症→人口10万人あたり0.314人
「未接種なら3.85人が重症化するが、接種済みなら0.314人」ということは、ワクチンの有効性は91.8%となります。(3.85 − 0.314) ÷ 3.85 ≒ 91.8%であり、「接種によって重症例を91.8%減らすことができている」とみなすことができるからです。
50歳以上については、次のように計算できます。
- 未接種:186,078人のうちの171人が重症→人口10万人あたり91.90人
- 接種済:2,133,516人のうちの290人が重症→人口10万人あたり13.59人
「未接種なら91.90人が重症化するが、接種済みなら13.59人」ということは、ワクチンの有効性は85.2%となります。(91.90 − 13.59) ÷ 91.90 ≒ 85.2%であり、「接種によって重症例を85.2%減らすことができている」とみなすことができるからです。
(3)ワクチン接種によって、50歳未満では重症例を91.8%減らすことができる。ワクチン接種によって、50歳以上では重症例を85.2%減らすことができる。
一見すると、(2)と(3)は矛盾しているように感じるかもしれません。しかし、計算は間違っていません。これはシンプソンのパラドックスです。シンプソンのパラドックスについては数学コラム【第1回】シンプソンのパラドックス(1)で取り上げました。ぜひ読み直しましょう。
(1)〜(3)のどの情報を目にするかによって、ワクチンの有効性について異なった印象を抱いてしまうかもしれません。しかし、(1)〜(3)はどれも、数字としては間違ってはおらず、「同じ統計」から導かれる「正しい」データです。データの見せ方に騙されないように、統計データの扱いについては文系・理系を問わずしっかり学んでいくことが大切だと思います。
なお、今回の記事は、Covid-19 Data Scienceに投稿された下記の記事(英文)をもとに書いています。これくらいの英語は読めるようになりましょう。