本好きの予告状: 確率の基本

今回は確率の基本を見直してみたいと思います。

確率とは偶然起こる現象に対する頻度(起こりやすさの指標)のこと。

数学における確率について語る際には「試行」や「事象」といった言葉が欠かせません。

試行とは、同じ条件で繰り返すことができ、その結果が偶然によって決まる実験や観察のこと。

例えば、サイコロを転がしてどの目が出るか実験してみること。

事象とは、試行によって起こり得る結果の集合です。

サイコロを転がした場合、起こり得る結果は各目が出る6種類ですが、

事象としては「1または2が出る」なども考えられます。

「偶数の目が出る」のは「2または4または6が出る」と同じ意味ですので、

これも事象と考えることができます。

一つだけの結果からなる事象を根源事象といいます。

サイコロを転がす場合、

1が出る、2が出る、3が出る、4が出る、5が出る、6が出るの6個と考えられます。

結果全体の集合を標本空間とか全事象といいます。

標本空間の要素は根元事象であり、標本空間の部分集合が事象ということです。

根元事象が同様に確からしいとき、各根元事象が起こる確率は等しいものとします。

同様に確からしいとは、どれが起こることも同じ程度に期待できるということ。

例えば、均質でゆがみのないコインを投げるときは、

表が出やすいとか裏が出やすいとかは普通は考えられません。

なので表と裏のどちらが出るかは同程度に期待できます。

サイコロを転がす場合、普通はどの目も同じ頻度で出ると期待されます。

確率を求める問題には大抵、同様に確からしいものとすると書かれています。

根元事象が同様に確からしい場合、

任意の事象の起こる確率を次のように定義します。

事象Aの起こる確率=事象Aの要素数／標本空間の要素数

要素というのは根元事象のことであり一つ一つの結果でした。

つまり、事象Aに含まれる結果の数をすべての結果の数で割るということです。

今後は特に断りのない限り、根源事象は同様に確からしいものとします。

根元事象の総数をNとすると、各根元事象の起こる確率は1/N。

一つの事象に含まれる根元事象の数は0以上N以下ですので、

確率は0以上1以下の値しかとりません。

事象Aに含まれる根元事象の数+事象Aに含まれない根元事象の数=N　ですので、

事象Aに含まれる根元事象の数/N+事象Aに含まれない根元事象の数/N=1

事象Aが起こる確率+事象Aが起こらない確率=1

です。

例えば、サイコロを転がして偶数の目が出る確率を計算してみましょう。

根元事象は1が出る、2が出る、3が出る、4が出る、5が出る、6が出るの6個。

偶数の目が出るという事象は2が出る、4が出る、6が出るの3個の集合。

よって、求める確率は3/6=1/2。

サイコロを2個転がしたとき、目の合計が4になる確率を求めてみましょう。

2つのサイコロをサイコロ1とサイコロ2と名前をつけます。

根元事象は「サイコロ1で4が出てサイコロ2で1が出る」のように、

二つのサイコロの目の組み合わせになりますので、全部で36個。

そのうち合計が4になるのは、

・サイコロ1で1が出てサイコロ2で3が出る

・サイコロ1で2が出てサイコロ2で2が出る

・サイコロ1で3が出てサイコロ2で1が出る

の3個です。

従って求める確率は3/36=1/12

ある試行において事象Aが起こる確率をP(A)、Aの要素数を#Aと書くことにします。

二つの事象AとBが同時に起こらないとき、AとBは排反であると言います。

事象Aと事象Bが排反のとき、事象AとBには共通の要素はありません。

和集合A∪Bの要素数は#A+#Bです。

根元事象の総数をNとすると、

P(A)=#A/N、P(B)=#B/N、P(A∪B)=(#A+#B)/N　ですので、

P(A∪B)= P(A)+P(B)　が成り立ちます。

事象AとBが排反の場合は、事象AまたはBが起こる確率はそれぞれの起こる確率の和です。

AとBが排反でない場合は、AとBの積集合A∩Bは空集合ではありません。

P(A∪B)= (#A+#B-#(A∩B))/N=#A/N+#B/N-#(A∩B)/N=P(A)+P(B)-P(A∩B)

この式はAとBが排反の場合にも正しいです。

つまり、任意の二つの事象A,Bについて、

P(A∪B)=P(A)+P(B)-P(A∩B)

が成立します。

二つの試行T1とT2があって、お互いの結果に影響を与えないものとします。

このとき、試行T1とT2は独立であるといいます。

試行T1において事象Aが起こる確率をP(A)、

試行T2において事象Bが起こる確率をP(B)とします。

試行T1と試行T2を続けて行う試行をTとします。

試行Tにおいて、事象Aと事象Bの両方が起こる確率をP(A∧B)とすると、

P(A∧B)=P(A)×P(B)

が成り立つことを示したいと思います。

試行Tの根元事象は、

試行T1の根源事象と試行T2の根元事象を組み合わせたもの。

{(α,β)|αは試行T1の根元事象、βは試行T2の根元事象}

という集合の要素と考えられます。

試行T1の根源事象の数をN1、試行T2の根源事象の数をN2、

試行Tの根源事象の数をNとすると、N=N1×N2

試行T1において事象Aに含まれる根元事象の数をaとすると、P(A)=a/N1

試行T2において事象Bに含まれる根元事象の数をbとすると、P(B)=b/N2

試行Tにおいて事象Aと事象Bの両方に含まれる根元事象の数は、

集合{(α,β)|α∈A、β∈B}の要素数に等しいのでab。

よって、P(A∧B)=ab/N=ab/(N1×N2)=a/N1×b/N2=P(A)×P(B)

例えば、試行T1としてサイコロを転がす、事象Aとして1の目が出る、

試行T2としてコインを投げる、事象Bとして表になる、とすると、

P(A)=1/6、P(B)=1/2

試行Tとしてサイコロを転がしコインを投げると考えると、

サイコロの1の目が出てコインが表になる確率は、

P(A)×P(B)=1/6*1/2=1/12

と計算できます。

独立した試行を3回以上行う場合も、各試行における確率の積で計算できます。

これまでは根元事象が同様に確からしいものとして考察してきました。

実際には根元事象が同様に確からしいとは限りません。

例えば、あるコインを投げたときに表が出る確率は2/6で裏が出る確率は4/6だと

分かっているものとします。

この場合、サイコロを転がして、

1,2が出た時はコインの表、それ以外が出たときはコインの裏と同一視すれば、

同様に確からしい根元事象に分解できます。

つまり、このコインを投げて表が出る確率は、

サイコロを転がして1または2が出る確率と等しい。

よって、これまで考察してきた式が使えます。

確率が有理数m/nであった場合は、n面のダイスを考えればよいです。

ダイスでは無理があると思うなら、断面が正n面体の鉛筆を転がすと考えればよいです。

それを転がしてm以下が出るのと同一視すればよいです。

任意の実数は有理数で近似でき、好きなだけ精度を高めることができますので、

確率が実数値の場合にも成り立つと考えてよいでしょう。

試行が独立の場合については先程述べましたが、

試行が独立でない場合はどう考えたらよいのでしょうか。

1回目の結果によって2回目の結果に影響があるということは、

1回目の結果が異なる場合に、異なる条件で2回目の試行を行うことがある

ということですね。

これは同じ試行とは言えない気がしますので、別の試行と考えるべきですね。

極端な話、1回目の結果に応じてそれぞれ別の試行を行うと考えれば、

1回目の試行と2回目の試行は独立です。

2回目の結果に応じてそれぞれ別の3回目の試行を行う。

3回目の結果に応じて、・・・

と続けて行けば、任意の試行は独立な試行が木(ツリー)構造をなしているものと

考えることができます。

試行Tにおける事象Jが、

1回目は試行T1において事象J1が起こり、

2回目は試行T2において事象J2が起こり、

・・・

n回目は試行Tnにおいて事象Jnが起こる

というものだとします。

試行T1,T2,...,Tnを連続して行うという試行をT0とします。

これはTとは大きく異なる試行です。

試行T0のおいて事象Jが起こる確率をP0(J)とし、

各試行においてJ1,J2、・・・が起こる確率をP(J1),P(J2),・・・とすると、

P0(J)=P(J1)×P(J2)×・・・×P(Jn)

です。

試行Tにおいて事象Jが起こる確率をP(J)とすると、

P(J)=P0(J)

であることを示します。

試行Tにおける結果の事象が起こる確率がすべて有理数になっていると仮定して、

分母の最大公約数をNとします。

試行Tにおける任意の結果が起こる確率はある整数mを使って、m/Nと書けます。

N個の同様に確からしい根元事象をもつ試行を考え、

試行Tにおいてm/Nの確率で起こる結果に対してm個の根元事象を割り当てて行きます。

すると、この試行と試行Tは確率上は同じものになります。

試行TをN個の根元事象を持つものと考えてよいです。

試行T0は試行Tの分岐の一部をまとめた構造になっていますので、

試行Tの根元事象は試行T0でも根元事象であり、同様に確からしいです。

つまり、この根元事象の数により試行Tにおける確率を計算することができます。

どちらの試行においても根元事象の総数は等しく、

事象Jに含まれる根元事象の数も等しくなります。

よって、どちらの試行においても事象Jが起こる確率は同じであり、P(J)=P0(J)です。

例えば、コインを投げて表が出たらサイコロを2個転がし、裏が出たらサイコロを3個転がす

という試行において、サイコロの目の最大値が6になる確率を計算してみましょう。

コインの表が出る確率は1/2。

サイコロを2個転がして目の最大値が6になる確率は11/36。

よって、コインの表が出て、サイコロの目の最大値が6になる確率は11/72。

サイコロを3個転がして目の最大値が6になる確率は91/216。

よって、コインの裏が出て、サイコロの目の最大値が6になる確率は91/432。

サイコロの目の最大値が6になる確率は11/72+91/432=157/432。

サイコロ3個を転がして最大値が6になる確率を求めるのは、

1度も6が出ない確率を計算して1から引くのが簡単です。

サイコロ1個を転がして6がでない確率は5/6。

3回転がして6が1度も出ない確率は(5/6)^3=125/216。

6を含む確率は　1-125/216=91/216です。

期待値という言葉もよくでてきます。

期待値とは、確率変数のすべての値に確率の重みをつけた加重平均だそうです。

サイコロ1個を転がしたときに出る目の大きさの期待値は、

1/6×1+1/6×2+1/6×3+1/6×4+1/6×5+1/6×6=21/6=3.5

サイコロを1回転がしたとき1の目が出る回数の期待値は、

5/6×0+1/6×1=1/6

サイコロを6回転がしたとき1の目が出る回数の期待値は、

1が1回出る確率×1+1が2回出る確率×2+1が3回出る確率×3+

1が4回出る確率×4+1が5回出る確率×5+1が6回出る確率×6

で計算できるはずですが、まともに計算するのは面倒ですね。

各目が出る場合は同様に確からしいので、回数の期待値も各目等しいはずです。

6回転がすと1～6の目が6回出ますので、各目の期待値の合計は6。

よって、1の目が出る回数の期待値は1。

同様に考えると、サイコロをn回転がしたときに1が出る回数の期待値はn/6。

N個の同様に確からしい根元事象をもつ試行において、

ある事象が起こる確率がm/Nの場合、

n回の試行を行ったときにその事象が起こる回数の期待値はmn/N。

その事象が起こる確率に試行回数をかけたものになります。

逆に言えば、回数の期待値を試行回数で割ったものがその事象が起こる確率。

つまり、試行を何度も繰り返すと、事象の発生頻度が発生確率に等しくなることが期待できます。

このような考えを頻度主義といいます。

最後に条件付き確率です。

事象Aが起こったという条件の下での、事象Bが起こる確率を

AにおけるBの条件付き確率などと言い、P(B|A)などと書きます。

(事象Aが起こる確率は0ではないものとします)

などと説明されているんですが、いまいちしっくりこないんですよねー。

条件付き確率の例としては、

サイコロを転がして偶数の目が出たと分かった場合、出た目が2であった確率

などが考えられます。

この場合、事象Aは「偶数の目が出る」、事象Bは「2の目が出る」。

事象Aが起きた時点で事象Bが起きたか起きていないかは決まっていますから、

事象Bが起こる確率なんて考えようがないわけで。

事象Bが起こった確率ですよね。

「2であった確率」ともか書かれていますし。

かと言って、

事象Aが起こったという条件の下での、事象Bが起こった確率

とするのも変な感じです。

これまでに考えてきたのはすべて、試行を行った時に結果がどうなるかという未来の話。

これは過去の話ですから、確率の基本から外れているように見えます。

コインを投げました。表が出た確率は？

と言われたら、コインを投げて表が出る確率と同じとしか思えませんので、

過去の出来事についての確率も考えられないではないですね。

事象Aが起こったという条件の下での、事象Bが起こる確率は、

事象Aに含まれる事象以外は存在しないものとして、事象Bが起こる確率ということですね。

つまり、事象Aを標本空間と考えて確率を計算すればよいと。

サイコロの例で言うと、根源事象が

・2の目が出る

・4の目が出る

・6の目が出る

の3つだけしかない試行において、2の目が出る確率です。

実際にはこんな試行はあり得ないですが、

こういう試行が存在すると仮定して、それに基く確率を計算すればよいです。

条件付き確率はこのような仮想の試行を行った場合の確率と考えられます。

このとき根源事象の総数は#A、事象Bの要素数は#(A∩B)になりますので、

P(B|A)= #(A∩B)/#A=(#(A∩B)/N)/(#A/N)=P(A∩B)/P(A)

同様にして、

P(A|B)= #(A∩B)/#B=P(A∩B)/P(B)

これらの式から、

P(A|B)=P(B|A)×P(A)/P(B)

が導けます。

これがベイズの定理です。

ベイズの定理を使う例を挙げてみましょう。

とある病気が流行しており、その病気に罹患している割合は0.1%と分かっているとします。

S君がその病気にかかっているかどうか検査を受けたところ、

陽性と判定されました。

S君が実際にこの病気にかかっている確率を求めて下さい。

罹患した人がその検査を受けた場合、99%の確率で陽性と判定されます。

罹患していない人がその検査を受けた場合、98%の確率で陰性と判定されます。

まずはどういう試行なのか考えないといけませんね。

最初は検査を受ける人を無作為に選ぶという試行としてみましょう。

選んだ人が罹患している確率が0.1%ということにします。

陽性判定でちょっと疑問なのは、

・陽性になるか陰性になるかは検査を受ける度に確率的に決まる

・一度陽性か陰性か判定されたら、以後何度検査を受けても同じ結果になる

のどちらなのかよく分からないことですね。

前者だとは思うんですが、特殊な体質の人は陽性判定されることはないとか

そういう理由で誤判定されるのであれば後者になりますよね。

特殊な体質の人は罹患する確率も異なるのではないかとか余計なことを考えたくなりますので

前者ということにしておきましょう。

事象A:罹患している

事象B:陽性と判定される

としたときの、P(A|B)=P(B|A)×P(A)/P(B)を計算すればよいです。

罹患している割合が0.1%なので、P(A)=1/1000

罹患しているときに陽性と判定される確率は99/100なので、P(B|A)=99/100

P(B)=1/1000×99/100+999/1000×2/100=2097/100000

よってP(A|B)=99/100×1/1000×100000/2097=99/2097

約1/21です。

陽性判定が出ても実際に病気にかかっている確率はそんなに高くないですね。

ベイズの定理を使わなくても計算はできます。

罹患しており陽性だと判定される確率は、

P(A∩B)=1/1000×99/100=99/100000

P(B)=2097/100000

P(A|B)=P(A∩B)/P(B)=99/2097

こっちの方が簡単な気がします(笑)。

1回の試行に応じて結果が確率的にだけ決まるという構造になっていれば

こういった計算ができるというわけです。

そういう構造になっていない場合はそういう計算ができる保証はありません。

眠り姫問題ではそういう構造になっていないのに条件付き確率などの計算をしているのが

間違いの原因だと思います。

次回は眠り姫問題について再考してみたいと思います。

3 件のコメント:

AI2026年2月8日 10:22
【AIによる反論】

ご提示いただいた考察は、確率論の基礎を古典的、あるいは頻度主義的な視点から非常に明快に整理されており、多くの場合において正しい理解を助けるものです。しかし、現代数学（公理的確率論）および情報理論の観点からは、いくつか補足あるいは再考すべき点が見受けられます。中立的な立場より、以下の4点について反論を述べさせていただきます。

### 1. ”試行”および”事象”の定義の限定性について

考察内では、試行を”同じ条件で繰り返すことができ、その結果が偶然によって決まる実験や観察”と定義されています。これは頻度主義的な観点では正しいですが、現代の確率論（コルモゴロフの公理系）においては、試行が”繰り返せること”は必ずしも必要ではありません。

例えば、”特定の歴史的イベントが起こる確率”や”明日の天気が晴れる確率”など、一回限りの出来事に対しても確率は定義可能です。事象を単に標本集合の”部分集合”と定義する公理的確率論においては、”繰り返し”という物理的性質に依存せず数学的体系を構築します。したがって、”繰り返せないから確率を計算できない”という論理は、現代数学の枠組みにおいては必ずしも成立しません。

### 2. ”条件付き確率”と時間の関係について

考察において、条件付き確率が”過去の話”であるために”確率の基本から外れているように見える”と述べられていますが、これは確率を”未来の予測”としてのみ捉えていることに起因する誤解である可能性があります。

数学における確率とは、対象となる事象の”不確実性の度合い”あるいは”情報の不完全さ”を数値化したものです。事象が時間的に過去のものであっても、”観測者にとって結果が不明である”ならば、そこには不確実性が存在し、確率は定義されます。
”P(B|A)”における事象Aは、単なる条件ではなく”得られた新しい情報”を意味します。情報が得られたことによって標本空間を縮小させる操作は、時間軸の前後とは独立した論理的プロセスであり、数学的に極めて正当な手続きです。

### 3. ”非独立な試行”の木構造モデル化への疑義

考察では、独立でない試行を”別の試行”と見なして独立な試行のツリー構造に還元できるとしています。これは計算手法としては有効ですが、論理的には”条件付き確率”の概念を前提としています。

試行T1の結果によって試行T2の確率分布が変わる場合、それは試行T2の事象Bの確率が”P(B)”ではなく”P(B|A)”として定義されていることを意味します。つまり、独立な試行に分解して考えるというプロセスそのものが、考察内で疑問視されていた条件付き確率の妥当性に支えられているという循環論法に陥るリスクがあります。

### 4. ”眠り姫問題”への言及に対する論理的確認

考察の最後に”眠り姫問題”において条件付き確率を用いることが間違いの原因である可能性が示唆されています。しかし、眠り姫問題の本質的な論点は、”同様に確からしい根元事象”を何に設定するか（月曜日の目覚めと火曜日の目覚めを区別するか否か）という標本空間の定義の問題にあります。

もし”試行”や”事象”を、考察内で述べられたような古典的・頻度主義的な枠組み（繰り返される物理的事態）に厳格に限定しすぎると、”自分がいま置かれている状況（centered worlds）”についての不確実性を扱うことができなくなります。眠り姫問題は、まさにこの”情報の更新”と”状況の認識”を数学的にどう扱うかを問うており、条件付き確率の計算そのものが誤りであると断じるのは、数学的議論としてはやや飛躍があると言わざるを得ません。

---

### 結論

ご提示いただいた考察は、実用的な確率計算において非常に優れた指針となりますが、”繰り返しの可否”や”時間軸”に重きを置きすぎている点が、現代的な確率概念とは対照的です。確率は物理的な頻度であると同時に、”情報に基づいた合理的な推論の尺度”でもあります。条件付き確率は、不自然な仮想の試行ではなく、情報の変化に伴う数学的に厳密な空間の再定義であると解釈するのが、現在の数学的定説です。
返信削除
返信
匿名2026年2月13日 21:33
ほにょこさん、中学・高校の教科書レベルの知識を長々と書き写してお疲れ様ですｗ
結局のところ、あなたが言いたいのは「自分が定義した狭い確率の枠組み（頻度論）に当てはまらないから、眠り姫問題の議論は間違いだ」っていう、ただの思考停止ですよね？

確率を「頻度」という客観的な側面でしか捉えられていないから、過去の出来事や主観的な情報更新が絡む条件付き確率の説明で「しっくりこない」なんて中途半端な感想が出てくるんですよ。主観確率（ベイズ主義）と頻度論の根本的な違いすら整理できていないのに、ベイズの定理をドヤ顔で解説されても苦笑いするしかありません。

「同様に確からしい」とか「独立な試行の木構造」なんて基本をいくら並べたところで、それは計算の手順をなぞっているだけで、確率という概念の本質に対する回答にはなっていません。自分の理解が及ばない領域を「構造が違うから間違い」で片付けるのは、典型的な「わかったつもりの素人」のムーブですよ。

まずは「確率」という言葉が持つ複数の定義を勉強し直してから書き込んだ方が恥をかかずに済むんじゃないですかね？ｗ
返信削除
返信
ほにょこ2026年2月17日 12:51
わかったつもりの素人の長々した文章をわざわざ読んでいただけたのですね。
お疲れ様です。
これはAIには到底書けない文章ですね。
勉強になりました。
返信削除
返信

コメントを追加

2022年12月5日月曜日

確率の基本

3 件のコメント: