2022年12月5日月曜日

確率の基本

 今回は確率の基本を見直してみたいと思います。


確率とは偶然起こる現象に対する頻度(起こりやすさの指標)のこと。

数学における確率について語る際には「試行」や「事象」といった言葉が欠かせません。

試行とは、同じ条件で繰り返すことができ、その結果が偶然によって決まる実験や観察のこと。

例えば、サイコロを転がしてどの目が出るか実験してみること。

事象とは、試行によって起こり得る結果の集合です。

サイコロを転がした場合、起こり得る結果は各目が出る6種類ですが、

事象としては「1または2が出る」なども考えられます。

「偶数の目が出る」のは「2または4または6が出る」と同じ意味ですので、

これも事象と考えることができます。

一つだけの結果からなる事象を根源事象といいます。

サイコロを転がす場合、

1が出る、2が出る、3が出る、4が出る、5が出る、6が出るの6個と考えられます。

結果全体の集合を標本空間とか全事象といいます。

標本空間の要素は根元事象であり、標本空間の部分集合が事象ということです。


根元事象が同様に確からしいとき、各根元事象が起こる確率は等しいものとします。

同様に確からしいとは、どれが起こることも同じ程度に期待できるということ。

例えば、均質でゆがみのないコインを投げるときは、

表が出やすいとか裏が出やすいとかは普通は考えられません。

なので表と裏のどちらが出るかは同程度に期待できます。

サイコロを転がす場合、普通はどの目も同じ頻度で出ると期待されます。

確率を求める問題には大抵、同様に確からしいものとすると書かれています。

根元事象が同様に確からしい場合、

任意の事象の起こる確率を次のように定義します。

事象Aの起こる確率=事象Aの要素数/標本空間の要素数

要素というのは根元事象のことであり一つ一つの結果でした。

つまり、事象Aに含まれる結果の数をすべての結果の数で割るということです。

今後は特に断りのない限り、根源事象は同様に確からしいものとします。

根元事象の総数をNとすると、各根元事象の起こる確率は1/N。

一つの事象に含まれる根元事象の数は0以上N以下ですので、

確率は0以上1以下の値しかとりません。

事象Aに含まれる根元事象の数+事象Aに含まれない根元事象の数=N ですので、

事象Aに含まれる根元事象の数/N+事象Aに含まれない根元事象の数/N=1

事象Aが起こる確率+事象Aが起こらない確率=1

です。



例えば、サイコロを転がして偶数の目が出る確率を計算してみましょう。

根元事象は1が出る、2が出る、3が出る、4が出る、5が出る、6が出るの6個。

偶数の目が出るという事象は2が出る、4が出る、6が出るの3個の集合。

よって、求める確率は3/6=1/2。


サイコロを2個転がしたとき、目の合計が4になる確率を求めてみましょう。

2つのサイコロをサイコロ1とサイコロ2と名前をつけます。

根元事象は「サイコロ1で4が出てサイコロ2で1が出る」のように、

二つのサイコロの目の組み合わせになりますので、全部で36個。

そのうち合計が4になるのは、

・サイコロ1で1が出てサイコロ2で3が出る

・サイコロ1で2が出てサイコロ2で2が出る

・サイコロ1で3が出てサイコロ2で1が出る

の3個です。

従って求める確率は3/36=1/12



ある試行において事象Aが起こる確率をP(A)、Aの要素数を#Aと書くことにします。

二つの事象AとBが同時に起こらないとき、AとBは排反であると言います。

事象Aと事象Bが排反のとき、事象AとBには共通の要素はありません。

和集合A∪Bの要素数は#A+#Bです。

根元事象の総数をNとすると、

P(A)=#A/N、P(B)=#B/N、P(A∪B)=(#A+#B)/N ですので、

P(A∪B)= P(A)+P(B) が成り立ちます。

事象AとBが排反の場合は、事象AまたはBが起こる確率はそれぞれの起こる確率の和です。

AとBが排反でない場合は、AとBの積集合A∩Bは空集合ではありません。

P(A∪B)= (#A+#B-#(A∩B))/N=#A/N+#B/N-#(A∩B)/N=P(A)+P(B)-P(A∩B)

この式はAとBが排反の場合にも正しいです。

つまり、任意の二つの事象A,Bについて、

P(A∪B)=P(A)+P(B)-P(A∩B)

が成立します。


二つの試行T1とT2があって、お互いの結果に影響を与えないものとします。

このとき、試行T1とT2は独立であるといいます。

試行T1において事象Aが起こる確率をP(A)、

試行T2において事象Bが起こる確率をP(B)とします。

試行T1と試行T2を続けて行う試行をTとします。

試行Tにおいて、事象Aと事象Bの両方が起こる確率をP(A∧B)とすると、

P(A∧B)=P(A)×P(B)

が成り立つことを示したいと思います。


試行Tの根元事象は、

試行T1の根源事象と試行T2の根元事象を組み合わせたもの。

{(α,β)|αは試行T1の根元事象、βは試行T2の根元事象}

という集合の要素と考えられます。

試行T1の根源事象の数をN1、試行T2の根源事象の数をN2、

試行Tの根源事象の数をNとすると、N=N1×N2

試行T1において事象Aに含まれる根元事象の数をaとすると、P(A)=a/N1

試行T2において事象Bに含まれる根元事象の数をbとすると、P(B)=b/N2

試行Tにおいて事象Aと事象Bの両方に含まれる根元事象の数は、

集合{(α,β)|α∈A、β∈B}の要素数に等しいのでab。

よって、P(A∧B)=ab/N=ab/(N1×N2)=a/N1×b/N2=P(A)×P(B)

例えば、試行T1としてサイコロを転がす、事象Aとして1の目が出る、

試行T2としてコインを投げる、事象Bとして表になる、とすると、

P(A)=1/6、P(B)=1/2

試行Tとしてサイコロを転がしコインを投げると考えると、

サイコロの1の目が出てコインが表になる確率は、

P(A)×P(B)=1/6*1/2=1/12

と計算できます。

独立した試行を3回以上行う場合も、各試行における確率の積で計算できます。



これまでは根元事象が同様に確からしいものとして考察してきました。

実際には根元事象が同様に確からしいとは限りません。

例えば、あるコインを投げたときに表が出る確率は2/6で裏が出る確率は4/6だと

分かっているものとします。

この場合、サイコロを転がして、

1,2が出た時はコインの表、それ以外が出たときはコインの裏と同一視すれば、

同様に確からしい根元事象に分解できます。

つまり、このコインを投げて表が出る確率は、

サイコロを転がして1または2が出る確率と等しい。

よって、これまで考察してきた式が使えます。

確率が有理数m/nであった場合は、n面のダイスを考えればよいです。

ダイスでは無理があると思うなら、断面が正n面体の鉛筆を転がすと考えればよいです。

それを転がしてm以下が出るのと同一視すればよいです。

任意の実数は有理数で近似でき、好きなだけ精度を高めることができますので、

確率が実数値の場合にも成り立つと考えてよいでしょう。


試行が独立の場合については先程述べましたが、

試行が独立でない場合はどう考えたらよいのでしょうか。

1回目の結果によって2回目の結果に影響があるということは、

1回目の結果が異なる場合に、異なる条件で2回目の試行を行うことがある

ということですね。

これは同じ試行とは言えない気がしますので、別の試行と考えるべきですね。

極端な話、1回目の結果に応じてそれぞれ別の試行を行うと考えれば、

1回目の試行と2回目の試行は独立です。

2回目の結果に応じてそれぞれ別の3回目の試行を行う。

3回目の結果に応じて、・・・

と続けて行けば、任意の試行は独立な試行が木(ツリー)構造をなしているものと

考えることができます。

試行Tにおける事象Jが、

1回目は試行T1において事象J1が起こり、

2回目は試行T2において事象J2が起こり、

・・・

n回目は試行Tnにおいて事象Jnが起こる

というものだとします。

試行T1,T2,...,Tnを連続して行うという試行をT0とします。

これはTとは大きく異なる試行です。

試行T0のおいて事象Jが起こる確率をP0(J)とし、

各試行においてJ1,J2、・・・が起こる確率をP(J1),P(J2),・・・とすると、

P0(J)=P(J1)×P(J2)×・・・×P(Jn)

です。

試行Tにおいて事象Jが起こる確率をP(J)とすると、

P(J)=P0(J)

であることを示します。


試行Tにおける結果の事象が起こる確率がすべて有理数になっていると仮定して、

分母の最大公約数をNとします。

試行Tにおける任意の結果が起こる確率はある整数mを使って、m/Nと書けます。

N個の同様に確からしい根元事象をもつ試行を考え、

試行Tにおいてm/Nの確率で起こる結果に対してm個の根元事象を割り当てて行きます。

すると、この試行と試行Tは確率上は同じものになります。

試行TをN個の根元事象を持つものと考えてよいです。

試行T0は試行Tの分岐の一部をまとめた構造になっていますので、

試行Tの根元事象は試行T0でも根元事象であり、同様に確からしいです。

つまり、この根元事象の数により試行Tにおける確率を計算することができます。

どちらの試行においても根元事象の総数は等しく、

事象Jに含まれる根元事象の数も等しくなります。

よって、どちらの試行においても事象Jが起こる確率は同じであり、P(J)=P0(J)です。


例えば、コインを投げて表が出たらサイコロを2個転がし、裏が出たらサイコロを3個転がす

という試行において、サイコロの目の最大値が6になる確率を計算してみましょう。

コインの表が出る確率は1/2。

サイコロを2個転がして目の最大値が6になる確率は11/36。

よって、コインの表が出て、サイコロの目の最大値が6になる確率は11/72。

サイコロを3個転がして目の最大値が6になる確率は91/216。

よって、コインの裏が出て、サイコロの目の最大値が6になる確率は91/432。

サイコロの目の最大値が6になる確率は11/72+91/432=157/432。

サイコロ3個を転がして最大値が6になる確率を求めるのは、

1度も6が出ない確率を計算して1から引くのが簡単です。

サイコロ1個を転がして6がでない確率は5/6。

3回転がして6が1度も出ない確率は(5/6)^3=125/216。

6を含む確率は 1-125/216=91/216です。


期待値という言葉もよくでてきます。

期待値とは、確率変数のすべての値に確率の重みをつけた加重平均だそうです。

サイコロ1個を転がしたときに出る目の大きさの期待値は、

1/6×1+1/6×2+1/6×3+1/6×4+1/6×5+1/6×6=21/6=3.5

サイコロを1回転がしたとき1の目が出る回数の期待値は、

5/6×0+1/6×1=1/6

サイコロを6回転がしたとき1の目が出る回数の期待値は、

1が1回出る確率×1+1が2回出る確率×2+1が3回出る確率×3+

1が4回出る確率×4+1が5回出る確率×5+1が6回出る確率×6

で計算できるはずですが、まともに計算するのは面倒ですね。

各目が出る場合は同様に確からしいので、回数の期待値も各目等しいはずです。

6回転がすと1~6の目が6回出ますので、各目の期待値の合計は6。

よって、1の目が出る回数の期待値は1。

同様に考えると、サイコロをn回転がしたときに1が出る回数の期待値はn/6。

N個の同様に確からしい根元事象をもつ試行において、

ある事象が起こる確率がm/Nの場合、

n回の試行を行ったときにその事象が起こる回数の期待値はmn/N。

その事象が起こる確率に試行回数をかけたものになります。

逆に言えば、回数の期待値を試行回数で割ったものがその事象が起こる確率。

つまり、試行を何度も繰り返すと、事象の発生頻度が発生確率に等しくなることが期待できます。

このような考えを頻度主義といいます。



最後に条件付き確率です。

事象Aが起こったという条件の下での、事象Bが起こる確率を

AにおけるBの条件付き確率などと言い、P(B|A)などと書きます。

(事象Aが起こる確率は0ではないものとします)

などと説明されているんですが、いまいちしっくりこないんですよねー。

条件付き確率の例としては、

サイコロを転がして偶数の目が出たと分かった場合、出た目が2であった確率

などが考えられます。

この場合、事象Aは「偶数の目が出る」、事象Bは「2の目が出る」。

事象Aが起きた時点で事象Bが起きたか起きていないかは決まっていますから、

事象Bが起こる確率なんて考えようがないわけで。

事象Bが起こった確率ですよね。

「2であった確率」ともか書かれていますし。

かと言って、

事象Aが起こったという条件の下での、事象Bが起こった確率

とするのも変な感じです。

これまでに考えてきたのはすべて、試行を行った時に結果がどうなるかという未来の話。

これは過去の話ですから、確率の基本から外れているように見えます。

コインを投げました。表が出た確率は?

と言われたら、コインを投げて表が出る確率と同じとしか思えませんので、

過去の出来事についての確率も考えられないではないですね。

事象Aが起こったという条件の下での、事象Bが起こる確率は、

事象Aに含まれる事象以外は存在しないものとして、事象Bが起こる確率ということですね。

つまり、事象Aを標本空間と考えて確率を計算すればよいと。

サイコロの例で言うと、根源事象が

・2の目が出る

・4の目が出る

・6の目が出る

の3つだけしかない試行において、2の目が出る確率です。

実際にはこんな試行はあり得ないですが、

こういう試行が存在すると仮定して、それに基く確率を計算すればよいです。

条件付き確率はこのような仮想の試行を行った場合の確率と考えられます。


このとき根源事象の総数は#A、事象Bの要素数は#(A∩B)になりますので、

P(B|A)= #(A∩B)/#A=(#(A∩B)/N)/(#A/N)=P(A∩B)/P(A)

同様にして、

P(A|B)= #(A∩B)/#B=P(A∩B)/P(B)

これらの式から、

P(A|B)=P(B|A)×P(A)/P(B)

が導けます。

これがベイズの定理です。


ベイズの定理を使う例を挙げてみましょう。

とある病気が流行しており、その病気に罹患している割合は0.1%と分かっているとします。

S君がその病気にかかっているかどうか検査を受けたところ、

陽性と判定されました。

S君が実際にこの病気にかかっている確率を求めて下さい。

罹患した人がその検査を受けた場合、99%の確率で陽性と判定されます。

罹患していない人がその検査を受けた場合、98%の確率で陰性と判定されます。


まずはどういう試行なのか考えないといけませんね。

最初は検査を受ける人を無作為に選ぶという試行としてみましょう。

選んだ人が罹患している確率が0.1%ということにします。

陽性判定でちょっと疑問なのは、

・陽性になるか陰性になるかは検査を受ける度に確率的に決まる

・一度陽性か陰性か判定されたら、以後何度検査を受けても同じ結果になる

のどちらなのかよく分からないことですね。

前者だとは思うんですが、特殊な体質の人は陽性判定されることはないとか

そういう理由で誤判定されるのであれば後者になりますよね。

特殊な体質の人は罹患する確率も異なるのではないかとか余計なことを考えたくなりますので

前者ということにしておきましょう。


事象A:罹患している

事象B:陽性と判定される

としたときの、P(A|B)=P(B|A)×P(A)/P(B)を計算すればよいです。

罹患している割合が0.1%なので、P(A)=1/1000

罹患しているときに陽性と判定される確率は99/100なので、P(B|A)=99/100

P(B)=1/1000×99/100+999/1000×2/100=2097/100000

よってP(A|B)=99/100×1/1000×100000/2097=99/2097

約1/21です。

陽性判定が出ても実際に病気にかかっている確率はそんなに高くないですね。


ベイズの定理を使わなくても計算はできます。

罹患しており陽性だと判定される確率は、

P(A∩B)=1/1000×99/100=99/100000

P(B)=2097/100000

P(A|B)=P(A∩B)/P(B)=99/2097

こっちの方が簡単な気がします(笑)。


1回の試行に応じて結果が確率的にだけ決まるという構造になっていれば

こういった計算ができるというわけです。

そういう構造になっていない場合はそういう計算ができる保証はありません。

眠り姫問題ではそういう構造になっていないのに条件付き確率などの計算をしているのが

間違いの原因だと思います。

次回は眠り姫問題について再考してみたいと思います。

0 件のコメント:

コメントを投稿