データにだまされるな(4) パーセント

この頃、テレビのCMや情報番組などで「○○をすると△△のリスクが××パーセント減少する」という話題を頻繁に目にします。
例えば、「1日に30分以上歩いている人は、心疾患・糖尿病・がんを発症するリスクが30パーセント低下する」というような内容です。こんなことを聞くと、「自分も始めてみようかな..」と考える人も多いのではないでしょうか?

でもちょっと考えてください。「発症するリスクが30パーセント低下する」とは、どういうことでしょうか?
これは一般的に、数万人規模の対象者を一定期間追跡調査した結果、日常的に1日30分以上 [歩いている人] と [歩いていない人] を比較した時の “発症率の比率” です。
例えば、それぞれ10,000人を追跡調査した結果、 [歩いている人の中で発症した人が700人] 、[歩いていない人の中で発症した人が1,000人] だった場合です。発症率にすると、[歩いている人:7%] 、[歩いていない人:10%] です。結果、[歩いている人の発症率] は [歩いていない人の発症率] の30パーセント減です。これが《発症リスクが30パーセント低下》の意味です。これでも、1日30分歩こうと思いますか? 発症率を10%から7%に下げるために、普段の行動(歩く習慣)を変えようと思いますか?
発症率を100%から70%に下げるためなら頑張れるかもしれません。ですが、10%を7%に下げるために頑張れるかと問われると微妙ですね。まぁ、人それぞれですが。
では、発症率1.0%を0.7%に下げる場合はどうでしょうか? これも「発症するリスクが30パーセント低下」です

もっと極端な例を示します
今、ドリームジャンボ宝くじが発売中なので、それを例にします。
ドリームジャンボ宝くじを1セット(10枚、3,000円)購入するとします。連番とバラのどちらを買いますか?
1等は1ユニット(1,000万枚:100万セット)に1枚です。ですので、前後賞合わせて5億円を狙うなら連番一択であり、その当選確率は100万分の1です。バラは1等と前後賞が両方当たることはないので5億円が当たる確率はゼロです。
では、1000万円以上を狙う場合はどうでしょうか? ドリームジャンボの場合、1ユニット(1,000万枚:100万セット)に1等(3億円)が1本、前後賞(1億円)が2本、2等(1,000万円)が2本、計5本の当り券があります。連番の場合、1等と前後賞は必ず同じ組にあるので、連番の場合の当たる確率は [100万セット当たり3パターン] で【100万分の3】です。バラの場合は、1枚当たりの当選確率が [5枚/1ユニット…1,000万枚]で、1セットが10枚なので [5/1,000万×10] = 【100万分の5】です。よって、もし1,000万円以上を狙うなら、バラで買った方が連番で買うよりも 1.666…倍、当たる確率が高いと言えます。
世間では、2.5倍とか3倍とかと言っている人がいるようですが、確率の値が本記事の主旨ではありません(1.67だろうが2.5だろうがどうでもいいです)。問題は、「宝くじを買う時、当たる確率で買いますか?」ということです。1.67倍をパーセントで表すと『67%増加』です。2.5倍なら『150%増加』です。「当たる確率が67%(又は150%)も高まるのだから絶対にバラで買うべきだ」と思いますか? 確率が0.000003 から 0.000005(または0.0000075)になるだけです。その違いなど、あってないようなもの(当たるわけがない)ですよね。そんな値の違いによって、宝くじの買い方を変えるでしょうか?
(ちなみに、私は昔からバラ買い派です。確率で選んでいるわけではありません。当選しているか調べている時のワクワクしている時間が10倍だからです)

このように「●●パーセント増」とか「●●パーセント減」という “増減のパーセント表現” を見たら、その値の大きさに一喜一憂する前に、元々の値(実測値)の変化を見てみましょう。特に、比率の値の増減をパーセントで示している場合は要注意です。
例えば、「売上10%アップ」と「売上増加率10%アップ」はまるで違います。売上増加率が10%から1%に低下しても、売上は減っておらず増えています。錯覚(※)に陥らないでください
※ 他にも、データに関する錯覚はたくさんあります。一部、記事『デジタルとは? デジタル表示の錯覚』に載せてあります。


もう一つ、パーセント表示について注意が必要なことを述べます。
先ほどの話題は「データの錯覚」に関するものでしたが、今度は「データの印象操作(※)」についてです。 ※ 印象操作については、記事『データにだまされるな(2) 印象操作』を参照。

最近、海外のクルーズ船でのハンタウィルス感染が話題になっています。「北米・南米型のハンタウィルスは致死率が30%~50%で非常に高い」と報道機関がしきりに危機感を煽っています。
一方、医学の進歩によってガンの治療技術が進み、早期であれば胃ガンの5年生存率は90%を越えると言われています。
ここで疑問です。「致死率(死亡率)」と「生存率」の関係は [ 生存率 = 1 - 死亡率 ] であり、生存率と死亡率のどちらでも表現することができます。それなのに、ウィルス感染は「致死率(死亡率)」を報道し、ガン治療では「生存率」を話題にします。この違いは何でしょうか?

その理由の一つは、《誰に対してアピールするか?》の違いです。
ウィルス感染の場合は、社会全体に対する警告です。「感染すれば10人に3~5人は死ぬ」と危機感を煽るためです。もしこれを「感染しても5~7人は助かる」と報道すれば緊張感が少し小さくなって警戒感が薄まります。
一方、ガンの場合は、患者や家族に対する安心感です。「ガンになっても多くは5年以上生きる」と安心感を与えているのです。もしこれが「ガンになると早期でも10人に1人は5年以内に死ぬ」と言われれば不安でいたたまれなくなりますね。

このように、”割合のパーセント表現” は、表現方法によって受け手が受けるイメージが変わることがあります。いわゆる “印象操作” です。ですので、そのような表現を見たら、その反対も考える(裏返して視る)ことが必要です。それまでとは違う見方をすることで、総合的な判断につながります。

例えば、次の2つの文は、同じ意味ですが表現の違いによって感じ方が違いませんか?
 ①第一志望の合格率:40%、第二志望の合格率:60%
 ②第一志望の不合格率:60%、第二志望の不合格率:40%
①では「第一志望にチャレンジしたい」と思う一方で、②では第二志望の方に心が揺れませんか? 人間は本能的に、喜びを掴むことよりも危機を避ける方を求める傾向があります。

例をもう一つ挙げます。難病の治療法についての例です。
 ③治療法Aの5年後生存率:96%、治療法Bの5年後生存率:92%
 ④治療法Aの5年後死亡率: 4%、治療法Bの5年後死亡率: 8%
③では「どちらも大して変わらない」と思うかも知れませんが、④を見ると「治療法Bは避けたい」と思うのではないでしょうか。


パーセント表現は、値の変化や割合を感覚的に理解できるのでとても便利です。ですが、”便利であるが故の落とし穴” があります。その罠に陥らないために、日頃からパーセント表現に気をつけ、数値を多角的に考える習慣を身に付けましょう

コメント