どすえのブログ

ソフトウェア開発ブログ

確率の期待値から掴むルベーグ積分

論文を読んでいると測度とルベーグ積分というものに出会った。これを機に、入門してみることにした。個人的には、馴染み深い「確率の期待値」を測度・ルベーグ積分の視点から捉え直すと、理解がスムーズだった。

個人的な理解をメモとして残す。

本記事の結論は、期待値とは確率変数のルベーグ積分である。

以下、ルベーグ積分、確率変数、期待値について順を追って見ていく。

測度とルベーグ積分

ルベーグ積分のアイデアを掴むために、実数の閉区間上で定義された連続関数を例にとる。 リーマン積分では関数で決まる曲線とx軸との間に挟まれた図形の「面積」がもとまる。ルベーグ積分についてもそれは同じである。

リーマン積分では図1のように関数を短冊上に等分に縦切りし、各長方形の面積を足し合わせて全体の面積を近似する。

図1:リーマン積分

一方、ルベーグ積分では、図2のように値域の方を横切りで分割する。

図2:値域の分割

すると、この場合も図3のように短冊を構成できることがわかる。

図3:横切りによる短冊

このときx軸に注目すると、図4のようにいくつかの領域  B_1 \sim B_6 に分割されている。

図4:横切りの結果分割された定義域

各領域にはそれぞれ線分の長さを持っているはずである。この線分長を  \mu(B_i) と表現しよう。実は、ここででてきた \muこそが測度である。測度は、ある集合に対する、長さ、面積、体積のような概念を抽象化したものである。したがって測度は非負である。

図5

定義域 Sにおけるルベーグ積分は、測度 \muを用いて

 
\int_S f(x)\mu(dx)

と記述される。 するとこの積分は、各短冊の面積の合計から

 
\int_S f(x)\mu(dx) \simeq \sum_{j=1}^n a_j \mu(B_j)

と近似的に求めることができる。これがルベーグ積分のイメージである。

図6:ルベーグ積分

ポイントは値域方向から切る(横切りする)ことにより、定義域がいくつかの領域に分割された点である。これによって分割された定義域の各領域に測度という形で、線分長を導入することが必要になった。

なお、今回のような実数軸を分割するケースでは、分割された線分長は自明なため、わざわざ「領域  B_i」と「領域の線分長  \mu(B_i)」と分けて考えたのは遠回りに思えるかもしれない。しかし、ある「集合」と「集合の大きさ」を分けて考えることの利点が、確率変数の期待値の計算の際に確認できる。

関数としての確率変数

数学的には、確率変数とは確率空間上の可測関数であるとされる。確率空間と可測関数の定義はここでは割愛して、確率変数が関数であるという点を確認する。

具体例として、1回のサイコロ投げの問題を考える。事象として「4以上の目が出る。」というものを考える。このような事象は、標本空間として \Omega = \lbrace  1,2,3,4,5,6 \rbrace をとり、 \lbrace \omega \in \Omega : \omega \ge 4 \rbrace と記述される。

しかし、この記述方法は標本空間に具体的すぎる構造を持ち込んでいる。上の例では、自然数1から6を標本空間の元としてとっており、サイコロの目に期待される性質を標本空間自体に仮定している。

そこで、標本空間とサイコロの目に期待される性質の間に、確率変数を介在させる。 \Omega = \lbrace \omega_1,\omega_2,\cdots,\omega_6 \rbrace とし、 X(\omega_1)=1, X(\omega_2)=2,\cdots,X(\omega_6)=6 という関数  X:\Omega \rightarrow \mathbb{R} を考える。この関数によって「選択肢が6つのランダムネス」と「サイコロの目」が分離された。例えば、ランダムな選択の結果  \omega_2 が現れたとして、それがサイコロの目の何に対応するかは、この時点では決まっていない。サイコロの目は事象  \omega_2 を関数  X に与えて初めてわかることである。

 X によって、「4以上の目が出る」という事象は  \lbrace \omega \in \Omega : X(\omega) \ge 4 \rbrace のように記述される。

このように、標本空間  \Omega で確率概念を導入し、具体的な問題は関数である確率変数  X で記述するというように分離することで見通しが良くなる。

期待値 -確率変数のルベーグ積分-

期待値とは確率測度による確率変数のルベーグ積分である。この期待値の定義を数式で書くと

 
E[X] = \int_{\Omega} X(\omega) P(d\omega)

となる。ここで  P は確率測度と呼ばれる測度であり、必ず0以上1以下の値をとる。

サイコロの出目の期待値を例にとって上式を解釈する。サイコロの目の確率変数として、前節と同様に標本空間  \Omega = \lbrace \omega_1,\omega_2,\cdots,\omega_6 \rbrace に対して  X(\omega_1)=1, X(\omega_2)=2,\cdots,X(\omega_6)=6 をとる。このとき期待値のルベーグ積分は

 
E[X] = \int_{\Omega} X(\omega) P(d\omega) = \sum_{i=1}^6 i P(\omega:X=i) = \sum_{i=1}^6 i P(X(\omega_i))

と記述される。

サイコロの出目が同様に確からしいとすると、

 
P(X(\omega_1)) + P(X(\omega_2)) + \cdots + P(X(\omega_6)) = 1

かつ

 
P(X(\omega_1)) = \cdots = P(X(\omega_6)) = \frac{1}{6}

を満たす。このときの期待値は図7に示される長方形の面積の合計となる。

図7:同様に確からしいサイコロの目の期待値

あるいは偏ったサイコロで

 
P(X(\omega_1)) = P(X(\omega_2)) = P(X(\omega_3)) = \frac{1}{9} \\
P(X(\omega_4)) = P(X(\omega_4)) = P(X(\omega_6)) = \frac{2}{9}

であるような場合は図8に示される長方形の面積の合計となる。

図8:偏りのあるサイコロの目の期待値

これらからも分かる通り、サイコロの出目の期待値とは、確率変数  X(\omega_i) に対して測度  \mu(d\omega) = P(X(\omega_i)) で重みづけを行い総和(積分)をとったものである。

まとめ

測度とは集合に対する大きさ、重みのような非負値を与える関数である。また、定義域の各点に測度で重みづけして積分を実行することがルベーグ積分である。

確率変数の期待値とは、標本空間の各元に対して確率測度で重みづけを行い総和をとるという操作であり、ルベーグ積分の具体例のひとつであった。

ざっくりとした理解はこんなところかしら。

参考文献