卜瓦松分布- 維基百科,自由的百科全書

文章推薦指數: 80 %
投票人數:10人

卜瓦松分布適合於描述單位時間內隨機事件發生的次數的機率分布。

如某一服務設施在一定時間內受到的服務請求的次數,電話交換機接到呼叫的次數、汽車站台的候客人數 ... 卜瓦松分布 維基百科,自由的百科全書 跳至導覽 跳至搜尋 卜瓦松分布 機率質量函數橫軸是索引k,發生次數。

該函數只定義在k為整數的時候。

連接線是只為了指導視覺。

累積分布函數橫軸是索引k,發生次數。

CDF在整數k處不連續,且在其他任何地方都是水平的,因為服從卜瓦松分布的變數只針對整數值。

母數 λ>0(實數)值域 k ∈ { 0 , 1 , 2 , 3 , ⋯ } {\displaystylek\in\{0,1,2,3,\cdots\}} 機率質量函數 λ k k ! e − λ {\displaystyle{\frac{\lambda^{k}}{k!}}e^{-\lambda}} 累積分布函數 Γ ( ⌊ k + 1 ⌋ , λ ) ⌊ k ⌋ ! {\displaystyle{\frac{\Gamma(\lfloork+1\rfloor,\lambda)}{\lfloork\rfloor!}}} ,或 e − λ ∑ i = 0 ⌊ k ⌋ λ i i !   {\displaystylee^{-\lambda}\sum_{i=0}^{\lfloork\rfloor}{\frac{\lambda^{i}}{i!}}\} ,或 Q ( ⌊ k + 1 ⌋ , λ ) {\displaystyleQ(\lfloork+1\rfloor,\lambda)} (對於 k ≥ 0 {\displaystylek\geq0} ,其中 Γ ( x , y ) {\displaystyle\Gamma(x,y)} 是不完全Γ函數, ⌊ k ⌋ {\displaystyle\lfloork\rfloor} 是高斯符號,Q是規則化Γ函數)期望值 λ {\displaystyle\lambda} 中位數 ≈ ⌊ λ + 1 / 3 − 0.02 / λ ⌋ {\displaystyle\approx\lfloor\lambda+1/3-0.02/\lambda\rfloor} 眾數 ⌈ λ ⌉ − 1 , ⌊ λ ⌋ {\displaystyle\lceil\lambda\rceil-1,\lfloor\lambda\rfloor} 變異數 λ {\displaystyle\lambda} 偏度 λ − 1 / 2 {\displaystyle\lambda^{-1/2}} 峰度 λ − 1 {\displaystyle\lambda^{-1}} 熵 λ [ 1 − log ⁡ ( λ ) ] + e − λ ∑ k = 0 ∞ λ k log ⁡ ( k ! ) k ! {\displaystyle\lambda[1-\log(\lambda)]+e^{-\lambda}\sum_{k=0}^{\infty}{\frac{\lambda^{k}\log(k!)}{k!}}} (假設 λ {\displaystyle\lambda} 較大) 1 2 log ⁡ ( 2 π e λ ) − 1 12 λ − 1 24 λ 2 − {\displaystyle{\frac{1}{2}}\log(2\pie\lambda)-{\frac{1}{12\lambda}}-{\frac{1}{24\lambda^{2}}}-} 19 360 λ 3 + O ( 1 λ 4 ) {\displaystyle\qquad{\frac{19}{360\lambda^{3}}}+O\left({\frac{1}{\lambda^{4}}}\right)} 動差母函數 exp ⁡ ( λ ( e t − 1 ) ) {\displaystyle\exp(\lambda(e^{t}-1))} 特徵函數 exp ⁡ ( λ ( e i t − 1 ) ) {\displaystyle\exp(\lambda(e^{it}-1))} 機率母函數 exp ⁡ ( λ ( z − 1 ) ) {\displaystyle\exp(\lambda(z-1))} 卜瓦松分布(法語:loidePoisson;英語:Poissondistribution)又稱Poisson分布、泊松分布、布瓦松分布、布阿松分布、普阿松分布、波以松分布、卜氏分布、帕松小數法則(Poissonlawofsmallnumbers),是一種統計與機率學裡常見到的離散機率分布,由法國數學家西莫恩·德尼·卜瓦松在1838年時發表。

卜瓦松分布適合於描述單位時間內隨機事件發生的次數的機率分布。

如某一服務設施在一定時間內受到的服務請求的次數,電話交換機接到呼叫的次數、汽車站台的候客人數、機器出現的故障數、自然災害發生的次數、DNA序列的變異數、放射性原子核的衰變數、雷射的光子數分布等等。

卜瓦松分布的機率質量函數為: P ( X = k ) = e − λ λ k k ! {\displaystyleP(X=k)={\frac{e^{-\lambda}\lambda^{k}}{k!}}} 卜瓦松分布的母數λ是隨機事件發生次數的數學期望值。

目次 1記號 2性質 3推導 4泊松分布的來源(泊松小數定律) 5最大似然估計(MLE) 6例子 7生成泊松分布的隨機變量 8參見 9參考文獻 9.1引用 9.2來源 記號[編輯] 若 X {\displaystyleX} 服從母數為 λ {\displaystyle\lambda} 的卜瓦松分布,記為 X ∼ π ( λ ) {\displaystyleX\sim\pi(\lambda)} ,或記為 X ∼ P o i s ( λ ) {\displaystyleX\simPois(\lambda)} . 性質[編輯] 1、服從卜瓦松分布的隨機變數,其數學期望與變異數相等,同為母數 λ {\displaystyle\lambda}  : E ( X ) = V ( X ) = λ {\displaystyleE(X)=V(X)=\lambda} 2、兩個獨立且服從卜瓦松分布的隨機變數,其和仍然服從卜瓦松分布。

更精確地說,若 X ∼ P o i s s o n ( λ 1 ) {\displaystyleX\simPoisson(\lambda_{1})} 且 Y ∼ P o i s s o n ( λ 2 ) {\displaystyleY\simPoisson(\lambda_{2})} ,則 X + Y ∼ P o i s s o n ( λ 1 + λ 2 ) {\displaystyleX+Y\simPoisson(\lambda_{1}+\lambda_{2})} 。

3、其動差母函數為: M X ( t ) = E [ e t X ] = ∑ x = 0 ∞ e t x e − λ λ x x ! = e − λ ∑ x = 0 ∞ ( e t λ ) x x ! = e λ ( e t − 1 ) {\displaystyleM_{X}(t)=E[e^{tX}]=\sum_{x=0}^{\infty}e^{tx}{\frac{e^{-\lambda}\lambda^{x}}{x!}}=e^{-\lambda}\sum_{x=0}^{\infty}{\frac{({e^{t}}\lambda)^{x}}{x!}}=e^{{\lambda}(e^{t}-1)}} 推導[編輯] 期望值:(倒數第三至第二是使用泰勒展開式) E ( X ) = ∑ i = 0 ∞ i P ( X = i ) = ∑ i = 1 ∞ i e − λ λ i i ! = λ e − λ ∑ i = 1 ∞ λ i − 1 ( i − 1 ) ! = λ e − λ ∑ i = 0 ∞ λ i i ! = λ e − λ e λ = λ {\displaystyle{\begin{aligned}\mathrm{E}(X)&=\sum_{i=0}^{\infty}\displaystyleiP(X=i)\\&=\sum_{i=1}^{\infty}\displaystylei{e^{-\lambda}\lambda^{i}\overi!}\\&=\lambdae^{-\lambda}\sum_{i=1}^{\infty}\displaystyle{\lambda^{i-1}\over(i-1)!}\\&=\lambdae^{-\lambda}\sum_{i=0}^{\infty}\displaystyle{\lambda^{i}\overi!}\\&=\lambdae^{-\lambda}e^{\lambda}\\&=\lambda\end{aligned}}} E ( X 2 ) = ∑ i = 0 ∞ i 2 P ( X = i ) = ∑ i = 1 ∞ i 2 e − λ λ i i ! = λ e − λ ∑ i = 1 ∞ i λ i − 1 ( i − 1 ) ! = λ e − λ ∑ i = 1 ∞ 1 ( i − 1 ) ! d d λ ( λ i ) = λ e − λ d d λ [ ∑ i = 1 ∞ λ i ( i − 1 ) ! ] = λ e − λ d d λ [ λ ∑ i = 1 ∞ λ i − 1 ( i − 1 ) ! ] = λ e − λ d d λ ( λ e λ ) = λ e − λ ( e λ + λ e λ ) = λ + λ 2 {\displaystyle{\begin{aligned}\mathrm{E}(X^{2})&=\sum_{i=0}^{\infty}\displaystylei^{2}P(X=i)\\&=\sum_{i=1}^{\infty}\displaystylei^{2}{e^{-\lambda}\lambda^{i}\overi!}\\&=\lambdae^{-\lambda}\sum_{i=1}^{\infty}\displaystyle{i\lambda^{i-1}\over(i-1)!}\\&=\lambdae^{-\lambda}\sum_{i=1}^{\infty}\displaystyle{1\over(i-1)!}{d\overd\lambda}(\lambda^{i})\\&=\lambdae^{-\lambda}{d\overd\lambda}\left[\sum_{i=1}^{\infty}\displaystyle{\lambda^{i}\over(i-1)!}\right]\\&=\lambdae^{-\lambda}{d\overd\lambda}\left[\lambda\sum_{i=1}^{\infty}\displaystyle{\lambda^{i-1}\over(i-1)!}\right]\\&=\lambdae^{-\lambda}{d\overd\lambda}(\lambdae^{\lambda})=\lambdae^{-\lambda}(e^{\lambda}+\lambdae^{\lambda})=\lambda+\lambda^{2}\end{aligned}}} 我們可以得到: V a r ( X ) = ( λ + λ 2 ) − λ 2 = λ {\displaystyleVar(X)=(\lambda+\lambda^{2})-\lambda^{2}=\lambda} 如同性質: E ( X ) = V a r ( X ) = λ {\displaystyleE(X)=Var(X)=\lambda} 、 σ X = λ {\displaystyle\sigma_{X}={\sqrt{\lambda}}} 卜瓦松分布的來源(卜瓦松小數定律)[編輯] 在二項分布的伯努利試驗中,如果試驗次數n很大,二項分布的機率p很小,且乘積λ=np比較適中,則事件出現的次數的機率可以用卜瓦松分布來逼近。

事實上,二項分布可以看作卜瓦松分布在離散時間上的對應物。

證明如下。

首先,回顧e的定義: lim n → ∞ ( 1 − λ n ) n = e − λ , {\displaystyle\lim_{n\to\infty}\left(1-{\lambda\overn}\right)^{n}=e^{-\lambda},} 二項分布的定義: P ( X = k ) = ( n k ) p k ( 1 − p ) n − k {\displaystyleP(X=k)={n\choosek}p^{k}(1-p)^{n-k}} 。

如果令 p = λ / n {\displaystylep=\lambda/n} , n {\displaystylen} 趨於無窮時 P {\displaystyleP} 的極限: lim n → ∞ P ( X = k ) = lim n → ∞ ( n k ) p k ( 1 − p ) n − k = lim n → ∞ n ! ( n − k ) ! k ! ( λ n ) k ( 1 − λ n ) n − k = lim n → ∞ [ n ! n k ( n − k ) ! ] ⏟ F ( λ k k ! ) ( 1 − λ n ) n ⏟ → exp ⁡ ( − λ ) ( 1 − λ n ) − k ⏟ → 1 = lim n → ∞ [ ( 1 − 1 n ) ( 1 − 2 n ) … ( 1 − k − 1 n ) ] ⏟ → 1 ( λ k k ! ) ( 1 − λ n ) n ⏟ → exp ⁡ ( − λ ) ( 1 − λ n ) − k ⏟ → 1 = ( λ k k ! ) exp ⁡ ( − λ ) {\displaystyle{\begin{aligned}\lim_{n\to\infty}P(X=k)&=\lim_{n\to\infty}{n\choosek}p^{k}(1-p)^{n-k}\\&=\lim_{n\to\infty}{n!\over(n-k)!k!}\left({\lambda\overn}\right)^{k}\left(1-{\lambda\overn}\right)^{n-k}\\&=\lim_{n\to\infty}\underbrace{\left[{\frac{n!}{n^{k}\left(n-k\right)!}}\right]}_{F}\left({\frac{\lambda^{k}}{k!}}\right)\underbrace{\left(1-{\frac{\lambda}{n}}\right)^{n}}_{\to\exp\left(-\lambda\right)}\underbrace{\left(1-{\frac{\lambda}{n}}\right)^{-k}}_{\to1}\\&=\lim_{n\to\infty}\underbrace{\left[\left(1-{\frac{1}{n}}\right)\left(1-{\frac{2}{n}}\right)\ldots\left(1-{\frac{k-1}{n}}\right)\right]}_{\to1}\left({\frac{\lambda^{k}}{k!}}\right)\underbrace{\left(1-{\frac{\lambda}{n}}\right)^{n}}_{\to\exp\left(-\lambda\right)}\underbrace{\left(1-{\frac{\lambda}{n}}\right)^{-k}}_{\to1}\\&=\left({\frac{\lambda^{k}}{k!}}\right)\exp\left(-\lambda\right)\end{aligned}}} 最大概似估計(MLE)[編輯] 給定n個樣本值ki,希望得到從中推測出母體的卜瓦松分布母數λ的估計。

為計算最大概似估計值,列出對數概似函數: L ( λ ) = ln ⁡ ∏ i = 1 n f ( k i ∣ λ ) = ∑ i = 1 n ln ( e − λ λ k i k i ! ) = − n λ + ( ∑ i = 1 n k i ) ln ⁡ ( λ ) − ∑ i = 1 n ln ⁡ ( k i ! ) . {\displaystyle{\begin{aligned}L(\lambda)&=\ln\prod_{i=1}^{n}f(k_{i}\mid\lambda)\\&=\sum_{i=1}^{n}\ln\!\left({\frac{e^{-\lambda}\lambda^{k_{i}}}{k_{i}!}}\right)\\&=-n\lambda+\left(\sum_{i=1}^{n}k_{i}\right)\ln(\lambda)-\sum_{i=1}^{n}\ln(k_{i}!).\end{aligned}}} d d λ L ( λ ) = 0 ⟺ − n + ( ∑ i = 1 n k i ) 1 λ = 0. {\displaystyle{\frac{\mathrm{d}}{\mathrm{d}\lambda}}L(\lambda)=0\iff-n+\left(\sum_{i=1}^{n}k_{i}\right){\frac{1}{\lambda}}=0.\!} 解得λ從而得到一個駐點(stationarypoint): λ ^ M L E = 1 n ∑ i = 1 n k i . {\displaystyle{\widehat{\lambda}}_{\mathrm{MLE}}={\frac{1}{n}}\sum_{i=1}^{n}k_{i}.\!} 檢查函數L的二階導數,發現對所有的λ與ki大於零的情況二階導數都為負。

因此求得的駐點是對數概似函數L的極大值點: ∂ 2 L ∂ λ 2 = ∑ i = 1 n − λ − 2 k i {\displaystyle{\frac{\partial^{2}L}{\partial\lambda^{2}}}=\sum_{i=1}^{n}-\lambda^{-2}k_{i}} 例子[編輯] 對某公共汽車站的客流做調查,統計了某天上午10:30到11:47來到候車的乘客情況。

假定來到候車的乘客各批(每批可以是1人也可以是多人)是互相獨立發生的。

觀察每20秒區間來到候車的乘客批次,共觀察77分鐘*3=231次,共得到230個觀察記錄。

其中來到0批、1批、2批、3批、4批及4批以上的觀察記錄分別是100次、81次、34次、9次、6次。

使用極大似真估計(MLE),得到 λ {\displaystyle\lambda} 的估計為(81*1+34*2+9*3+6*4)/230≈0.87。

生成卜瓦松分布的隨機變數[編輯] 一個用來生成隨機卜瓦松分布的數字(偽隨機數抽樣)的簡單算法,已經由高德納給出(見下文參考): algorithmpoissonrandomnumber(Knuth): init: LetL←e−λ,k←0andp←1. do: k←k+1. Generateuniformrandomnumberuin[0,1]andletp←p×u. whilep>L. returnk−1. 儘管簡單,但複雜度是線性的,在返回的值k,平均是λ。

還有許多其他算法來克服這一點。

有些人由Ahrens和Dieter給出,請參閱下面的參考資料。

同樣,對於較大的λ值,e-λ可能導致數值穩定性問題。

對於較大λ值的一種解決方案是拒絕採樣,另一種是採用卜瓦松分布的高斯近似。

對於很小的λ值,逆轉換取樣簡單而且高效,每個樣本只需要一個均勻隨機數u。

直到有超過u的樣本,才需要檢查累積機率。

algorithmPoissongeneratorbasedupontheinversionbysequentialsearch:[1] init: Letx←0,p←e−λ,s←p. Generateuniformrandomnumberuin[0,1]. do: x←x+1. p←p*λ/x. s←s+p. whileu>s. returnx. 參見[編輯] 卜瓦松過程 機率論 卜瓦松迴歸 機率分布 參考文獻[編輯] 引用[編輯] ^LucDevroye,Non-UniformRandomVariateGeneration(Springer-Verlag,NewYork,1986),chapter10,page505http://luc.devroye.org/rnbookindex.html(頁面存檔備份,存於網際網路檔案館) 來源[編輯] GuerrieroV.PowerLawDistribution:MethodofMulti-scaleInferentialStatistics.JournalofModernMathematicsFrontier(JMMF).2012,1:21–28[2017-10-30].(原始內容存檔於2018-02-21).  JoachimH.Ahrens,UlrichDieter.ComputerMethodsforSamplingfromGamma,Beta,PoissonandBinomialDistributions.Computing.1974,12(3):223–246.doi:10.1007/BF02293108.  JoachimH.Ahrens,UlrichDieter.ComputerGenerationofPoissonDeviates.ACMTransactionsonMathematicalSoftware.1982,8(2):163–179.doi:10.1145/355993.355997.  RonaldJ.Evans,J.Boersma,N.M.Blachman,A.A.Jagers.TheEntropyofaPoissonDistribution:Problem87-6.SIAMReview.1988,30(2):314–317.doi:10.1137/1030059.  DonaldE.Knuth.SeminumericalAlgorithms.TheArtofComputerProgramming.Volume2.AddisonWesley.1969.  閱論編常見一元(英語:Univariatedistribution)機率分布連續 Β 柯西 χ² 指數 F Γ 拉普拉斯 對數常態 常態 柏拉圖 學生t 均勻 韋伯 離散 伯努利 二項 離散均勻 幾何 超幾何 負二項 卜瓦松 機率分布列表(英語:Listofprobabilitydistributions) 閱論編機率分布列表(英語:Listofprobabilitydistributions)有限支集離散單變數 本福德 伯努利 β-二項式 二項 分類(英語:Categoricaldistribution) 超幾何 卜瓦松二項(英語:Poissonbinomialdistribution) 拉德馬赫(英語:Rademacherdistribution) 離散均勻 齊夫 齊夫-曼德爾布羅特(英語:Zipf–Mandelbrotlaw) 無限支集離散單變數 β-負二項(英語:Betanegativebinomialdistribution) 鮑萊耳(英語:Boreldistribution) 康威-麥克斯韋-卜瓦松(英語:Conway–Maxwell–Poissondistribution) 離散相型(英語:Discretephase-typedistribution) 德拉波特(英語:Delaportedistribution) 擴展負二項 高斯-庫茲明 幾何 對數 負二項 拋物線碎形 卜瓦松 Skellam 尤爾-西蒙 ζ 緊支集連續單變數 反正弦 ARGUS 巴爾丁-尼科爾斯 貝茨 Β Β動差形 歐文-霍爾 庫馬拉斯瓦米 分對數常態 非中心β 升餘弦 倒數 三角形 U-二次型 連續均勻 維格納半圓 半無限區間支集連續單變數 貝尼尼 第一類本克坦德 第二類本克坦德 Β' 伯爾 χ² χ Dagum 戴維斯 指數-對數 愛爾朗 指數 F 摺疊常態 弗洛里-舒爾茨(英語:Flory–Schulzdistribution) 弗雷謝 Γ Γ/岡珀茨 廣義逆高斯 岡珀茨 半邏輯 半常態 霍特林T-方 超愛爾朗 超指數 次指數 逆χ² 縮放逆χ² 逆高斯 逆Γ 科摩哥洛夫 列維 對數柯西 對數拉普拉斯 對數邏輯 對數常態 動差陣指數 麥克斯韋-玻耳茲曼 麥克斯韋-於特納 米塔格-萊弗勒 中上 非中心χ² 柏拉圖 相型 保利-韋伯 瑞利 相對布萊特-維格納分布 萊斯 移位岡珀茨 截斷常態 第二類岡貝爾 韋伯 離散韋伯 威爾克斯λ 無限區間支集連續單變數 柯西 指數冪 費雪z 高斯q 廣義常態 廣義雙曲 幾何穩定 岡貝爾 赫魯茲馬克 雙曲正割 詹森SU 朗道 拉普拉斯 非對稱拉普拉斯 邏輯 非中心t 常態(高斯) 常態逆高斯 偏斜常態 斜線 穩定 學生t 第一類岡貝爾 特雷西-威登 變異數-γ 福格特 可變類型支集連續單變數 廣義極值 廣義柏拉圖 圖基λ Q-高斯 Q-指數 Q-韋伯 移位對數邏輯 混合連續離散單變數 調整高斯 多元(聯合) 離散 尤恩斯 多項 狄利克雷多項 負多項 連續 狄利克雷 廣義狄利克雷 多元常態 多元穩定 多元t 常態縮放逆γ 常態γ 動差陣 逆動差陣γ 逆威沙特 動差陣常態 動差陣t 動差陣γ 常態逆威沙特 常態威沙特 威沙特 定向(英語:Directionalstatistics) 一元(圓形) 圓形均勻 一元馮·米塞斯 環繞常態 環繞柯西 環繞指數 環繞非對稱拉普拉斯 環繞列維 二元(球形) 肯特 二元(環形) 二元馮·米澤斯 多元 馮·米澤斯-費雪 賓漢姆 退化和奇異(英語:Singulardistribution) 退化 狄拉克δ 奇異 康托爾 族 圓形 複合卜瓦松 橢圓 指數 自然指數 位置尺度 最大熵 混合 皮爾森 特威迪 環繞 取自「https://zh.wikipedia.org/w/index.php?title=卜瓦松分布&oldid=71069360」 分類:​離散分布階乘與二項式主題隱藏分類:​使用過時圖像語法的頁面含有法語的條目含有英語的條目 導覽選單 個人工具 沒有登入討論貢獻建立帳號登入 命名空間 條目討論 臺灣正體 不转换简体繁體大陆简体香港繁體澳門繁體大马简体新加坡简体臺灣正體 查看 閱讀編輯檢視歷史 更多 搜尋 導航 首頁分類索引特色內容新聞動態近期變更隨機條目資助維基百科 說明 說明維基社群方針與指引互助客棧知識問答字詞轉換IRC即時聊天聯絡我們關於維基百科 工具 連結至此的頁面相關變更上傳檔案特殊頁面靜態連結頁面資訊引用此頁面維基數據項目 列印/匯出 下載為PDF可列印版 其他專案 維基共享資源 其他語言 العربيةAsturianuتۆرکجهБеларускаяБългарскиবাংলাCatalàČeštinaDanskDeutschΕλληνικάEnglishEspañolEestiEuskaraفارسیSuomiFrançaisGalegoעבריתMagyarՀայերենBahasaIndonesiaÍslenskaItaliano日本語ქართული한국어LietuviųМакедонскиBahasaMelayuNederlandsNorskbokmålPolskiPortuguêsРусскийSimpleEnglishSlovenčinaSlovenščinaСрпски/srpskiSundaSvenskaTürkçeТатарча/tatarçaУкраїнськаاردوTiếngViệt吴语粵語 編輯連結



請為這篇文章評分?