2009年7月5日日曜日

プログラミングのための確率統計(仮)

最近は参加をするのを止めているのだけど、ちょっと前までWebで公開されている(http://www10.plala.or.jp/xyzt/pscs/)資料を使った勉強会に出席していました。

この資料、章ごとの冒頭部分が凄く楽しいんですね。
2章の冒頭を例に挙げてみます。

A:私の調査によると、ゲーム機所持者の犯罪率は50%以上です。何らかの規制をすべきでしょう。
B:何そのやたら高い数字?
A:最近の少年犯罪では、犯人の半数以上がゲーム機を所持していました。
B:ええと、つっこみ所がありすぎて困るんだけど。とりあえず犯罪関係なしで最近の少年のゲーム機所持率から調べ直してくれない?

これ、条件付確率と同時確率、周辺確率の話をする前のコラムなんですけど、面白いです。
Aさんは条件付確率 P(犯罪者|ゲーム機所持者) のつもりで話をしているわけですけど、実際にはそうはなっていないんですね。

で、Aさんが最初に言っている数字が実は何を表しているのかというと、それはP(ゲーム機所持者|犯罪者)。
とりあえず世界には少年が100人しかいないとして適当に次みたいな表を作ってみます。

| ゲーム機持ってる | ゲーム機持ってない
---------+------------------------+---------------------------
犯罪者 | 10 | 10
善良 | 40 | 40

P(犯罪者,ゲーム機所持者) = 1/10
P(善良,ゲーム機所持者) = 2/5
P(犯罪者, ゲーム機持ってない人) = 1/10
P(善良, ゲーム機持ってない人) = 2/5

さてこの例だと、ゲーム機を持っているという条件が与えられた時の条件付確率P(犯罪者|ゲーム機所持者)は、
P(犯罪者|ゲーム機所持者) = 1/5
です。

Aさんはどういうことをしたのかな、というと・・・この世界から善良な少年をなくしちゃったんですね。
つまり、条件付確率P(ゲーム機所持者|犯罪者)を求めてます。
さて、この世界で確率を計算するときに、善良な少年の存在を無視すると、少年は世界で20人しかいなくなります。
その上で、ゲーム機所持者の割合を調べてみると 1/2 、つまり50%になります。

あらら、P(犯罪者|ゲーム機所持者)が50%以上といってゲーム機を規制しようと言っていたのに、P(ゲーム機所持者|犯罪者)を求めちゃってたよ。
ということでした。

まぁ、こんな話は著者がジョークで書いただけだろうと思っていたら、現実でもあるみたい。

・ 公明新聞 http://www.komei.or.jp/news/2008/0219/10816.html
昨今流行の児ポ法問題の奴ですね。
[一部抜粋]
性犯罪者の4割は、子どもの写真やアニメを収集していたという調査もある。
(中略)
アニメなどを児童ポルノの対象とすることには、「実在する被害者がいない」「表現の自由を保障すべき」との理由から反対論が多いが、犯罪誘発防止の観点から、アニメ大国の責任において積極的に議論する必要がある。

上記の例でいうと、Aさんが公明党になりますね。

公明党: 子供の写真やアニメを収集している人の性犯罪率は4割です。子供の写真やアニメを規制しましょう。
B: 何そのやたら高い数字?
公明党: 性犯罪者の4割は、子どもの写真やアニメを収集していました。
B: ええと、つっこみ所がありすぎて困るんだけど。とりあえず性犯罪関係なしで子どもの写真やアニメの所持率から調べ直してくれない?

確率は分かりにくい概念ですけど、一応今の国会で議席過半数を占める連立与党の一党なんだし、さらに実施されるとやり直しとか難しそうなんだから、もう少しまともに調査とか出来る人も議論に参加してもらったらどうなんだろう。

0 件のコメント: