統計力学の準備として、確率と期待値について確認していきます。
まず、偶然に支配され起こる現象が、どの程度の頻度で起きるのかを表した指標のことを確率と呼びます。数学的には、確率は次のように表されます。
そして、期待値とはある試行を行ったときに平均的に出現すると思われる確率変数のことを言います。具体的には、期待値は次のように定義されます。
まずは、確率という言葉の再確認から行っていきましょう。
確率とは?
コイントスの結果やサイコロの出目、工学的な例では、公差の範囲内での寸法のばらつきなど、偶然に支配されて起こる事象のことを確率と呼びます。
確率を計算可能な形に持ち込む準備として、確率に登場するいくつかの用語を確認しておきます。
これらの用語を使うと、確率を次のように定式化できます。また、式から確率は $0$ 以上 $1$ 以下の値となることが分かります。
例えば、区別可能な $2$ 枚のコインを使ったコイントスを試行とすれば、全事象は、裏表の組み合わせの $4$ 通りとなります。このとき、両方とも表となる事象は $1$ 通りのみです。したがって、$2$ 枚とも表となる確率は $\DL{\ff{1}{4}}$ と言えます。
“同様に確からしい”とは?
確率では、どの事象も起こりうる程度が同じであることを前提としています。上の例で言えば、コインの重心が厳密に円板の中心にあり、コインは真円であることを前提としているということです。
このように、どの事象も同程度に起こると期待できることを、同様に確からしいと言います。
余事象とは?
確率の定義から分かるように各事象の確率の総和は $1$ となります。裏を返せば、ある事象 $A$ 以外が起きる確率 $P(\bar{A})$ は、
\begin{split}
P(\bar{A})=1-P(A)=1-\ff{a}{N}
\end{split}
と表せます。 このように、『ある事象以外の事象』のことを余事象と呼び、$\bar{A}$ あるいは $A^{c}$ と表します。
確率分布とは?
統計力学への準備として、気体分子の分布と確率の関係について考えてみます。
具体的には、$5$ 個の気体分子を閉じ込めた断熱容器があり、容器の左右それぞれに存在する気体分子の個数をカウントする実験を行うとします。
このとき、考えられる気体分子の配置パターンは下図のように $6$ つとなります。
各パータンが実現される確率を求めてみましょう。
ここでは、気体分子は区別可能であると仮定します。各分子は左右どちらかに配置されるので、気体分子の配置方法は合計で $2^5=32$ 通りとなります。
まず、パターン $0$ が実現される確率ですが、これは全ての気体分子を右側に配置する場合にのみ実現されるので、この確率は $P(0)=\DL{\ff{1}{32}}$ となります。
次に、パターン $1$ が実現される確率についてですが、左側に一個の気体分子を配置する方法が $5$ 通りあることより、$P(1)=\DL{\ff{5}{32}}$ となります。
パターン $2$ が実現される確率について考えます。左側に $2$ 個の気体分子を配置する方法は、$5$ 個の気体分子から $2$ 個を選ぶ方法と言い換えられるので、${}_5\RM{C}_2=10$ となります。よって、$P(2)=\DL{\ff{10}{32}}$ となります。
同様にして他のパターンの確率を計算し、それをグラフ化すると下図のようになります。
図のように、各事象に対応した確率をプロットしたブラフのことを確率分布と呼びます。また、グラフの水平軸に付与した数字がありますが、これを確率変数と呼びます。今回の場合は、左半分に存在する分子の個数が確率変数に相当します。
期待値とは?
ところで、ある試行を行ったとき、だいたいこれが現れるだろうと期待できるような事象などはあるでしょうか?これが分かれば、試行結果の予測や賭け事で有利に立ち回れそうです。
確率統計の世界では、平均的に現れるであろうと期待される確率変数のことを期待値と呼びます。天下り的になりますが、期待値は数学的には次のように定義されます。
期待値の概念はエルゴート仮説(統計力学の基礎概念)を理解する上での基本事項でもあります。
さて、定義に従って前述の気体分子分布の期待値を計算すると、次のように求められます。
\begin{split}
E&=\ff{1}{36}\left(0\times1+1\times5+2\times10+3\times10+4\times5+5\times1\right)\EE
&=\ff{80}{36}=2.5
\end{split}
この例での期待値は、左半分の領域に何個の分子があることが期待できるのかを示しています。そして、確率分布上では期待値を下図のように表すことができます。
今回の場合、期待値は確率変数の平均値となることも分かります。一般の場合は、期待値は母集団の平均値と一致します。