2010年9月3日金曜日

「確率1400万分の1」は、「1400万回試せば必ず○○する」とは限らない

gigazineの記事
途上国の飛行機は先進国の13倍落ちやすい
(http://gigazine.net/index.php?/news/comments/20100903_fatal_flight/)
の文中にちょっと気になる確率の話を見かけたのでコメント。といっても、確率の基礎を勉強ずみの人にとっては単に「ありがちな誤解の指摘」でしか無いのでそのつもりで。

まず当該部分を抜き出し。

Barnett教授の計算によると、2000~2007年の旅客機(ジェット機とプロペラ機を含む)の1便あたりの死亡リスクは、アメリカや日本、アイルランドなどの先進国では1400万分の1(0.000007%)だったとのこと。これはつまり「人は1400万回旅客機に乗ればほぼ確実に死ぬ」という数字ですが、1日1回旅客機を利用する人でも1400万便に乗るには3万8000年もかかるので、旅客機はかなり安全な乗り物と言っていいようです。


こちらで追加した太字部分が気になる点。これは、1400万本のうち1本の当たりが「確実に」入っているようなくじを、「1回引いたくじは戻さずに」引き続けるような状況を前提とした話になっている(いわゆる非復元抽出という考え方)。この場合は1400万本引き続ければ、そのうちどこかで当たりに出会う(=死ぬ)ことになる。

しかし実際に飛行機に乗る場合、1回飛行機に乗って死ななかったからといって、その後の死亡リスクが大きくなるわけでも、小さくなるわけでも無いと考えるのが普通だろう。これは事象の独立という概念で、上記のくじの例で言えば復元抽出(くじを引いたら元に戻すので、何度引いても当たりを引く確率は1400万分の1)という考え方に相当する。

独立性を仮定した場合、1400万回飛行機に乗って死ぬ確率はどう計算できるか。1回乗って「死なない」確率は (1-1/14000000)であり、したがって1400万回乗って死なない確率は
(1-1/14000000)^14000000 ≒ 1/e = 0.36787944...

である(上記の近似は自然対数の定義を使った)。結局、1400万回のうち1回以上死亡事故レベルの墜落に出くわす確率は0.63程度であり、まだまだ「ほぼ確実」とは言えない。

ところで、3万8千年(38000年×365日=1387万日≒1400万回)という数値はgigazine記事の元ネタになっているScienceDaily記事や、さらには本家本元INFORMS Onlineの記事にも載っているのだが、こちらの記事には誤りは無い。というのも、これらの記事では "on average" (平均で)という表現を用いているからである。恐らくgigazineはこの意味を誤解したか読み飛ばしたのではないかと思われる。

当選確率1400万分の1のくじを(復元抽出で)引き続けるとき、初めて当たりくじを引くまでの回数は幾何分布と呼ばれる確率法則に従う。このとき、回数の平均値は1400万回になる。ただし平均はあくまで平均であって、それより早く当たりくじを引く場合もあれば、もっとかかる場合もある。先ほどの計算では、この平均回数以前に当たりくじを引く確率は63%程度だ、ということになる。ちなみに、「ほぼ確実」といえるレベルは人によって違うだろうが、上記の3倍すなわち4200万回をこなせば、そこまでの間のどこかで当たりくじを引く確率は約95%になる。

(追記)
このエントリーのURLを添えてgigazineのメールフォームからコメントを送ったところ、早速修正しましたという返信が送られてきたのだけど、「ほぼ確実」が「大抵の人は」に変わっただけ。63%(だいたい3人に2人)だと大抵とは言えないように思うのだけど…このエントリーもちゃんと読んでもらっていないのか、それともこっちの書き方が悪いのか。

0 件のコメント:

コメントを投稿

英語配列のノートPCで日本語配列設定にしちゃった時に、アンダースコアを入力するTips

US配列のLG gram SuperSlimを購入した。で、Windowsの初期セットアップを始めたところ、最初に選択できるキー配列はMicrosoft IME(まあ要するに日本語配列)だけ。で、その後に「追加のキー配列」を選択できるのだが、後でやればいいやと思ってスルーしてしま...