10 ポアソン分布と指数分布 | |
f-denshi.com 最終更新日:11/09/05 (仮) | |
サイト検索 | |
目次へ |
[1] 「長時間平均だとτ時間に1回起こる事象(言い換えると単位時間に平均 1/τ=λ回起きる事象)を,t (>0)時間観測したときに k 回発生する確率」はポアッソン分布と呼ばれる次の確率(密度)関数(1)で与えられる。
ポアッソン分布の確率密度関数
もしくは,1/τ=λ,t=1 とおいて,
ただし,平均値=<k>=λ,分散=λを満たす。 |
なお,(2)は「単位時間中に事象が起きる平均回数がλ(= 1/τ)であるとき、単位時間中(t=1)にその事象がk回起きる確率」と解釈しなおす必要がある。
例えば,1年間に平均3つのコップを割ってしまうジロー君が,1年間で2つ以下しかコップを割らないで済ませる確率は,
P(X=0)+P(X=1)+P(X=2)= | 30 | ・e-3+ | 31 | ・e-3+ | 32 | ・e-3≒ 0.423 |
0! | 1! | 2! |
と計算される。
[2] さて,最初に,ポアソン分布が2項分布からの極限操作によって得られる分布であることを示しておく。
時間 t を十分大きなnで等分に分割すれば,一つひとつの時間区間では事象が1回起こるかまったく起こらないかの2通りでしかないようにすることができる (これは仮定であってポアソン分布の成立条件)。そこで,一つの区間で事象の起こる確率を p,起こらない確率を q (=1−p) とすると,n個の区間 (=時間 t の間) で k回現象が起こる確率は次の2項分布,
Pn(k)=nCk pkqn-k [2項分布の確率密度関数]
で与えられ,その期待値 <k> はすでに求めたように,
<k> = np ( = t/τ) ∴ p =<k>/n
となる[#]。ポアソン分布はここで,分割数 n→∞ の極限,
P(k)≡ Pn(k)
を計算したものとなっているのだが,それを示すには確率母関数[#]を利用する。すなわち,
φ(x) = P(k)xk = Pn(k)xk
= nCk pkqn-kxk= nCk (xp)kqn-k
= (xp+q)n = (1+p(x−1))n
↓ p =<k>/n
= 1+ <k>(x−1) n n
=e<k>(x-1) ← 極限を用いた指数関数の定義より
=e-<k>e<k>x ↓ <k>=λ,テーラー展開
=e-λ λk xk k!
[3] これを再び確率母関数の定義:φ(x)= | P(k)xk と比較すれば, |
P(k) = e-λ λk , ただし,λ=t/τ k!
である(=ポアソン分布である)ことがわかる。以上がポアソン分布の導出である。
[4] 次にポアソン分布の平均値,分散を計算する。確率母関数:φ(x)=eλ(x-1) を微分してx=1とおき,
φ'(1)= dφ x=1 =λ =<k> dx
二度,微分してx=1とおき,
φ"(1)= d2φ x=1 =λ2 (=<k>2=<k2>−<k>) dx2
これより,分散は[#],
φ"(1)+φ'(1)−{φ'(1)}2= λ =<k>
いま,単位時間当たりについて起きる事象の回数として考えるならば,t=1 として,
<k>=1/τ=λ [平均値=分散]
である。
[5] なお,別解として,積率母関数[#],
M(t)=E(etX)= etk λk e-λ k! =exp(-λ(1−et))
=e-λ (λet)k =exp(-λ)・exp(λet) k!
から平均値,分散を求めることもできるが,これは演習とする。
[2] ポアソン分布が,二項分布で,n>>1>>p の場合であることに着目した例題を与えておく。
例
あるスーパーで買い物をした人 (レジで清算ごと) 1000人に1人の確率で,そのときの買い物がタダになるセールをしている。セール期間中に5回買い物をしたときに0,及び1回,2回タダとなる確率を求めよ。
答え
λ=p×n=0.001×5=0.005
なので,
P(X=0) = exp(-0.005)×(0.005)0 = 0.995012 0!
P(X=1) = exp(-0.005)×(0.005)1 = 0.004975 1!
P(X=2) = exp(-0.005)×(0.005)2 = 0.000012 2!
SUSTAINABLE TOKIWADAIGAK SINCE 2002
[1] ポアソン分布は決まった時間内に事象の起きる確率(分布)であるが,一方,事象の起きる時間間隔の分布を考えることもできる。
もし,時刻 0から t の間に 0回事象が起こる確率は,ポアソン分布(1)において,1/τ=λ,k=0とおいて,
f(0,t)=e-λt 生存確率 (λは単位時間中に事象が起きる平均回数)
で与えられる。また,これは「生存している確率」を表すと考えることができ,t を連続確率変数とする累積分布関数とみなすことができる。すると,起点 0から t 時間後まで事象が起こらず,時間 t で初めて事象が起きる分布関数は,上の余事象として,
F(t)=1−e-λt (死んだ!確率,もしくは故障した確率)
となる。初めてというのは,「人は二度死ねない」ので強調してこう書いた。つまり,ポアソン分布の元々の意味を離れて,1度しか起こらない現象をこれから考えていくのである。さらにこの分布の確率密度関数を t で微分して求めれば,
(3) f(t)=λe-λt 指数分布 (の確率密度関数)
となるが,このタイプの確率密度関数を持つ分布を指数分布と呼び,e(λ) と書く。たとえば,「平均1年間でコップを3つ割ってしまうジロー君」が,t 年後に初めてコップを一つ割ることを表す確率密度関数は,
f(t)=3e-3t ←ここでは t の関数と見るべき
コップを主語にすれば,平均寿命4か月のコップたちの実際の寿命の分布を与える確率密度関数ということである。
[2] これを用いると,t年後にジロー君のコップが割れてない確率は,これを t から +∞まで積分して,
S(t)= 3e-3tdt = e-3t (無事である確率)
で表される。つまり,コップの寿命が t 以上∞までである確率が,t年後にコップが無事である確率,すなわち,コップの生存確率ということになる。一方,0 から t まで(3)を積分した,
F(t)= 3e-3tdt = 1−e-3t (割れている確率)
は,時間 0-t の間にコップが割れる確率であることを確認できる。
[3] なお,指数分布の平均,分散は,
平均 1/λ
分散 1/λ2
となる。これは簡単なので各自でチェックせよ。
[4] 最後に指数分布の重要な特徴を一つ紹介しておく。
問題:
「ジロー君支配下のコップの平均寿命は1/3年である。ジロー君に尋ねたところ,最後にコップを割ったのは今から s年前ということだ。では,ジロー君が今から次にコップを割るまでの時間 Tの確率分布はどのようになるか?」
答えは,
「条件付確率:s年前にコップが生存している事象の中で,s年前を起点に t 年後にコップが割れてる確率」を計算すればよく,それが累積分布関数となる。
F(t)=P(T≦s+t|T>s)=P(s<T≦s+t)/P(T>s)
= 時刻 s と s+t との間で割れる確率 時刻 s まで無事である確率
= (1−e-λ(s+t))−(1−e-λs) =1−e-λt e-λs
つまり,今からいつジロー君がコップを割るのかは,以前,ジロー君の犯した過失には依存しない。ジロー君の不偏の性格を表すパラメーターλ=3 だけで決まるのだ! これを指数分布の無記憶性という。もちろん,ジロー君が反省して,λが2,1と変化すれば,コップの割れる頻度は少なくなるのだが。
問題
1年平均で3個のコップを割るジロー君が,4カ月 (1/3年) 以内にコップを割る確率はいくらか?
答え
F(t)= 3e-3tdt = 1−e-3t (割れている確率)
を用いて,t=1/3 として,
F(1/3)=1−e-3/3 = 0.632121