二項式分布- 維基百科,自由的百科全書

文章推薦指數: 80 %
投票人數:10人

在機率論和統計學中,二項式分布(英語:Binomial distribution)是n個獨立的是/非試驗中成功的次數的離散機率分布,其中每次試驗的成功機率為p。

這樣的單次成功/失敗 ... 二項式分布 維基百科,自由的百科全書 跳至導覽 跳至搜尋 二項式分布 機率質量函數 累積分布函數記號 B(n, p)母數 n ≥ 0 {\displaystylen\geq0} 試驗次數(整數) 0 ≤ p ≤ 1 {\displaystyle0\leqp\leq1} 成功機率(實數)值域 k ∈ { 0 , … , n } {\displaystylek\in\{0,\dots,n\}\!} 機率質量函數 ( n k ) p k ( 1 − p ) n − k {\displaystyle{n\choosek}p^{k}(1-p)^{n-k}\!} 累積分布函數 I 1 − p ( n − ⌊ k ⌋ , 1 + ⌊ k ⌋ ) {\displaystyleI_{1-p}(n-\lfloork\rfloor,1+\lfloork\rfloor)\!} 期望值 n p {\displaystylen\,p\!} 中位數 { ⌊ n p ⌋ , ⌈ ( n + 1 ) p ⌉ } {\displaystyle\{\lfloornp\rfloor,\lceil(n+1)p\rceil\}} 之一眾數 ⌊ ( n + 1 ) p ⌋ {\displaystyle\lfloor(n+1)\,p\rfloor\!} 或 ⌊ ( n + 1 ) p ⌋ − 1 {\displaystyle\lfloor(n+1)\,p\rfloor\!-1} 變異數 n p ( 1 − p ) {\displaystylen\,p\,(1-p)\!} 偏度 1 − 2 p n p ( 1 − p ) {\displaystyle{\frac{1-2\,p}{\sqrt{n\,p\,(1-p)}}}\!} 峰度 1 − 6 p ( 1 − p ) n p ( 1 − p ) {\displaystyle{\frac{1-6\,p\,(1-p)}{n\,p\,(1-p)}}\!} 熵 1 2 ln ⁡ ( 2 π n e p ( 1 − p ) ) + O ( 1 n ) {\displaystyle{\frac{1}{2}}\ln\left(2\pinep(1-p)\right)+O\left({\frac{1}{n}}\right)\!} 動差母函數 ( 1 − p + p e t ) n {\displaystyle(1-p+p\,e^{t})^{n}\!} 特徵函數 ( 1 − p + p e i t ) n {\displaystyle(1-p+p\,e^{i\,t})^{n}\!} 在機率論和統計學中,二項式分布(英語:Binomialdistribution)是n個獨立的是/非試驗中成功的次數的離散機率分布,其中每次試驗的成功機率為p。

這樣的單次成功/失敗試驗又稱為伯努利試驗。

實際上,當n=1時,二項式分布就是伯努利分布。

二項式分布是顯著性差異的二項試驗的基礎。

目次 1詳述 1.1概率質量函數 1.2累積分布函數(概率分布函數) 2期望和方差 3眾數和中位數 4兩個二項分布的協方差 5與其他分布的關係 5.1二項分布的和 5.2伯努利分布 5.3泊松二項分布 5.4正態近似 5.5泊松近似 6極限 7例子 8參見 9參考文獻 詳述[編輯] 機率質量函數[編輯] 一般地,如果隨機變數 X {\displaystyle{\mathit{X}}} 服從母數為 n {\displaystyle{\mathit{n}}} 和 p {\displaystyle{\mathit{p}}} 的二項式分布,我們記 X ∼ b ( n , p ) {\displaystyleX\simb(n,p)} 或 X ∼ B ( n , p ) {\displaystyleX\simB(n,p)} 。

n次試驗中正好得到k次成功的機率由機率質量函數給出: f ( k , n , p ) = Pr ( X = k ) = ( n k ) p k ( 1 − p ) n − k {\displaystylef(k,n,p)=\Pr(X=k)={n\choosek}p^{k}(1-p)^{n-k}} 對於k=0,1,2,...,n,其中 ( n k ) = n ! k ! ( n − k ) ! {\displaystyle{n\choosek}={\frac{n!}{k!(n-k)!}}} 是二項式係數(這就是二項式分布的名稱的由來),又記為C(n,k),nCk,或nCk。

該公式可以用以下方法理解:我們希望有k次成功(pk)和n−k次失敗(1−p)n−k。

然而,k次成功可以在n次試驗的任何地方出現,而把k次成功分布在n次試驗中共有C(n,k)個不同的方法。

在製造二項式分布機率的參考表格時,通常表格中只填上n/2個值。

這是因為k>n/2時的機率可以從它的補集計算出: f ( k ; n , p ) = f ( n − k ; n , 1 − p ) {\displaystylef(k;n,p)=f(n-k;n,1-p)\,} 因此,我們要看另外一個k和另外一個p(二項式分布一般不是對稱的)。

然而,它的表現不是任意的。

總存在一個整數M,滿足: ( n + 1 ) p − 1 < M ≤ ( n + 1 ) p {\displaystyle(n+1)p-1M時單調遞減,只有當(n+1)p是整數時例外。

在這時,有兩個值使ƒ達到最大:(n+1)p和(n+1)p−1。

M是伯努利試驗的最可能的結果,稱為眾數。

注意它發生的機率可以很小。

累積分布函數(機率分布函數)[編輯] 累積分布函數可以表示為: F ( x ; n , p ) = Pr ( X ≤ x ) = ∑ i = 0 ⌊ x ⌋ ( n i ) p i ( 1 − p ) n − i {\displaystyleF(x;n,p)=\Pr(X\leqx)=\sum_{i=0}^{\lfloorx\rfloor}{n\choosei}p^{i}(1-p)^{n-i}} 其中 ⌊ x ⌋ {\displaystyle\scriptstyle\lfloorx\rfloor\,} 是小於或等於x的最大整數。

它也可以用正則化不完全貝塔函數來表示: F ( k ; n , p ) = Pr ( X ≤ k ) = I 1 − p ( n − k , k + 1 ) = ( n − k ) ( n k ) ∫ 0 1 − p t n − k − 1 ( 1 − t ) k d t {\displaystyle{\begin{aligned}F(k;n,p)&=\Pr(X\leqk)=I_{1-p}(n-k,k+1)\\&=(n-k){n\choosek}\int_{0}^{1-p}t^{n-k-1}(1-t)^{k}\,dt\end{aligned}}} 期望和變異數[編輯] 如果X~B(n,p)(也就是說,X是服從二項式分布的隨機變數),那麼X的期望值為 E ⁡ [ X ] = n p {\displaystyle\operatorname{E}[X]=np} 變異數為 Var ⁡ [ X ] = n p ( 1 − p ) . {\displaystyle\operatorname{Var}[X]=np(1-p).} 這個事實很容易證明。

首先假設有一個伯努利試驗。

試驗有兩個可能的結果:1和0,前者發生的機率為p,後者的機率為1−p。

該試驗的期望值等於μ=1 · p+0 · (1−p)=p。

該試驗的變異數也可以類似地計算:σ2=(1−p)2·p+(0−p)2·(1−p)=p(1 − p). 一般的二項式分布是n次獨立的伯努利試驗的和。

它的期望值和變異數分別等於每次單獨試驗的期望值和變異數的和: μ n = ∑ k = 1 n μ = n p , σ n 2 = ∑ k = 1 n σ 2 = n p ( 1 − p ) . {\displaystyle\mu_{n}=\sum_{k=1}^{n}\mu=np,\qquad\sigma_{n}^{2}=\sum_{k=1}^{n}\sigma^{2}=np(1-p).} 眾數和中位數[編輯] 通常二項式分布B(n, p)的眾數等於⌊(n+1)p⌋,其中 ⌊ ⋅ ⌋ {\displaystyle\lfloor\cdot\rfloor} 是取整函數。

然而,當(n+1)p是整數且p不等於0或1時,分布有兩個眾數:(n+1)p和(n+1)p−1。

當p等於0或1時,眾數相應地等於0或n。

這些情況可以綜述如下: mode = { ⌊ ( n + 1 ) p ⌋ 若  ( n + 1 ) p  是0或非整数  , ( n + 1 ) p    和    ( n + 1 ) p − 1 若  ( n + 1 ) p ∈ { 1 , … , n } , n 若  ( n + 1 ) p = n + 1. {\displaystyle{\text{mode}}={\begin{cases}\lfloor(n+1)\,p\rfloor&{\text{若}}(n+1)p{\text{是0或非整数}},\\(n+1)\,p\{\text{和}}\(n+1)\,p-1&{\text{若}}(n+1)p\in\{1,\dots,n\},\\n&{\text{若}}(n+1)p=n+1.\end{cases}}} 一般地,沒有一個單一的公式可以求出二項式分布的中位數,甚至中位數可能是不唯一的。

然而有幾個特殊的結果: 如果np是整數,那麼平均數、中位數和眾數相等,都等於np。

[1][2] 任何中位數m都位於區間⌊np⌋≤m≤⌈np⌉內。

[3] 中位數m不能離平均數太遠:|m−np|≤min{ ln2,max{p,1−p} }。

[4] 如果p≤1−ln2,或p≥ln2,或|m−np|≤min{p,1−p}(除了p=½、n是奇數的情況以外),那麼中位數是唯一的,且等於m=round(np)。

[3][4] 如果p=1/2,且n是奇數,那麼區間½(n−1)≤m≤½(n+1)中的任何數m都是二項式分布的中位數。

如果p=1/2且n是偶數,那麼m=n/2是唯一的中位數。

兩個二項式分布的共變異數[編輯] 如果有兩個服從二項式分布的隨機變數X和Y,我們可以求它們的共變異數。

利用共變異數的定義,當n=1時我們有 Cov ⁡ ( X , Y ) = E ⁡ ( X Y ) − μ X μ Y . {\displaystyle\operatorname{Cov}(X,Y)=\operatorname{E}(XY)-\mu_{X}\mu_{Y}.} 第一項唯若X和Y都等於1時非零,而μX和μY分別為X=1和Y=1的機率。

定義pB為X和Y都等於1的機率,便得到 Cov ⁡ ( X , Y ) = p B − p X p Y , {\displaystyle\operatorname{Cov}(X,Y)=p_{B}-p_{X}p_{Y},\,} 對於n次獨立的試驗,我們便有 Cov ⁡ ( X , Y ) n = n ( p B − p X p Y ) . {\displaystyle\operatorname{Cov}(X,Y)_{n}=n(p_{B}-p_{X}p_{Y}).\,} 如果X和Y是相同的變數,便化為上面的變異數公式。

與其他分布的關係[編輯] 二項式分布的和[編輯] 如果X~B(n,p)和Y~B(m,p),且X和Y相互獨立,那麼X+Y也服從二項式分布;它的分布為 X + Y ∼ B ( n + m , p ) . {\displaystyleX+Y\simB(n+m,p).\,} 伯努利分布[編輯] 伯努利分布是二項式分布在n=1時的特殊情況。

X~B(1,p)與X~Bern(p)的意思是相同的。

相反,任何二項式分布B(n,p)都是n次獨立伯努利試驗的和,每次試驗成功的機率為p。

卜瓦松二項式分布[編輯] 二項式分布是卜瓦松二項式分布的一個特殊情況。

卜瓦松二項式分布是n次獨立、不相同的伯努利試驗(pi)的和。

如果X服從卜瓦松二項式分布,且p1=…=pn=p,那麼X~B(n,p)。

常態近似[編輯] n=6、p=0.5時的二項式分布以及常態近似 如果n足夠大,那麼分布的偏度就比較小。

在這種情況下,如果使用適當的連續性校正,那麼B(n,p)的一個很好的近似是常態分布: N ( n p , n p ( 1 − p ) ) {\displaystyle{\mathcal{N}}(np,\,np(1-p))} V a r ( x ) = n p ( 1 − p ) {\displaystyle{\mathcal{Var}}(x)=np(1-p)} n越大(至少30),近似越好,當p不接近0或1時更好。

[5]不同的經驗法則可以用來決定n是否足夠大,以及p是否距離0或1足夠遠: 一個規則是np和n(1−p)都必須大於5。

卜瓦松近似[編輯] 當試驗的次數趨於無窮大,而乘積np固定時,二項式分布收斂於卜瓦松分布。

因此母數為λ=np的卜瓦松分布可以作為二項式分布B(n,p)的近似,如果n足夠大,而p足夠小。

[6] 極限[編輯] 當n趨於∞,p趨於0,而np固定於λ>0,或至少np趨於λ>0時,二項式分布B(n,p)趨於期望值為λ的卜瓦松分布。

當n趨於∞而p固定時, X − n p n p ( 1 − p )   {\displaystyle{X-np\over{\sqrt{np(1-p)\}}}} 的分布趨於期望值為0、變異數為1的常態分布。

這個結果是中央極限定理的一個特殊情況。

例子[編輯] 一個簡單的例子如下:擲一枚骰子十次,那麼擲得4的次數就服從n=10、p=1/6的二項式分布。

參見[編輯] 機率論 機率分布 卜瓦松分布 負二項式分布 參考文獻[編輯] ^Neumann,P.ÜberdenMedianderBinomial-andPoissonverteilung.WissenschaftlicheZeitschriftderTechnischenUniversitätDresden.1966,19:29–33(德語).  ^Lord,Nick.(July2010)."Binomialaverageswhenthemeanisaninteger",TheMathematicalGazette94,331-332. ^3.03.1Kaas,R.;Buhrman,J.M.Mean,MedianandModeinBinomialDistributions.StatisticaNeerlandica.1980,34(1):13–18.doi:10.1111/j.1467-9574.1980.tb00681.x.  ^4.04.1KaisHamza.ThesmallestuniformupperboundonthedistancebetweenthemeanandthemedianofthebinomialandPoissondistributions.Statistics&ProbabilityLetters:21–25.[2018-04-02].doi:10.1016/0167-7152(94)00090-u.(原始內容存檔於2020-12-15).  ^Box,HunterandHunter.Statisticsforexperimenters.Wiley.1978:130.  ^NIST/SEMATECH,"6.3.3.1.CountsControlCharts"(頁面存檔備份,存於網際網路檔案館),e-HandbookofStatisticalMethods. 閱論編機率分布列表(英語:Listofprobabilitydistributions)有限支集離散單變數 本福德 伯努利 β-二項式 二項 分類(英語:Categoricaldistribution) 超幾何 卜瓦松二項(英語:Poissonbinomialdistribution) 拉德馬赫(英語:Rademacherdistribution) 離散均勻 齊夫 齊夫-曼德爾布羅特(英語:Zipf–Mandelbrotlaw) 無限支集離散單變數 β-負二項(英語:Betanegativebinomialdistribution) 鮑萊耳(英語:Boreldistribution) 康威-麥克斯韋-卜瓦松(英語:Conway–Maxwell–Poissondistribution) 離散相型(英語:Discretephase-typedistribution) 德拉波特(英語:Delaportedistribution) 擴展負二項 高斯-庫茲明 幾何 對數 負二項 拋物線碎形 卜瓦松 Skellam 尤爾-西蒙 ζ 緊支集連續單變數 反正弦 ARGUS 巴爾丁-尼科爾斯 貝茨 Β Β動差形 歐文-霍爾 庫馬拉斯瓦米 分對數常態 非中心β 升餘弦 倒數 三角形 U-二次型 連續均勻 維格納半圓 半無限區間支集連續單變數 貝尼尼 第一類本克坦德 第二類本克坦德 Β' 伯爾 χ² χ Dagum 戴維斯 指數-對數 愛爾朗 指數 F 摺疊常態 弗洛里-舒爾茨(英語:Flory–Schulzdistribution) 弗雷謝 Γ Γ/岡珀茨 廣義逆高斯 岡珀茨 半邏輯 半常態 霍特林T-方 超愛爾朗 超指數 次指數 逆χ² 縮放逆χ² 逆高斯 逆Γ 科摩哥洛夫 列維 對數柯西 對數拉普拉斯 對數邏輯 對數常態 動差陣指數 麥克斯韋-玻耳茲曼 麥克斯韋-於特納 米塔格-萊弗勒 中上 非中心χ² 柏拉圖 相型 保利-韋伯 瑞利 相對布萊特-維格納分布 萊斯 移位岡珀茨 截斷常態 第二類岡貝爾 韋伯 離散韋伯 威爾克斯λ 無限區間支集連續單變數 柯西 指數冪 費雪z 高斯q 廣義常態 廣義雙曲 幾何穩定 岡貝爾 赫魯茲馬克 雙曲正割 詹森SU 朗道 拉普拉斯 非對稱拉普拉斯 邏輯 非中心t 常態(高斯) 常態逆高斯 偏斜常態 斜線 穩定 學生t 第一類岡貝爾 特雷西-威登 變異數-γ 福格特 可變類型支集連續單變數 廣義極值 廣義柏拉圖 圖基λ Q-高斯 Q-指數 Q-韋伯 移位對數邏輯 混合連續離散單變數 調整高斯 多元(聯合) 離散 尤恩斯 多項 狄利克雷多項 負多項 連續 狄利克雷 廣義狄利克雷 多元常態 多元穩定 多元t 常態縮放逆γ 常態γ 動差陣 逆動差陣γ 逆威沙特 動差陣常態 動差陣t 動差陣γ 常態逆威沙特 常態威沙特 威沙特 定向(英語:Directionalstatistics) 一元(圓形) 圓形均勻 一元馮·米塞斯 環繞常態 環繞柯西 環繞指數 環繞非對稱拉普拉斯 環繞列維 二元(球形) 肯特 二元(環形) 二元馮·米澤斯 多元 馮·米澤斯-費雪 賓漢姆 退化和奇異(英語:Singulardistribution) 退化 狄拉克δ 奇異 康托爾 族 圓形 複合卜瓦松 橢圓 指數 自然指數 位置尺度 最大熵 混合 皮爾森 特威迪 環繞 取自「https://zh.wikipedia.org/w/index.php?title=二項式分布&oldid=71265776」 分類:​離散分布階乘與二項式主題隱藏分類:​CS1德語來源(de)使用過時圖像語法的頁面含有英語的條目 導覽選單 個人工具 沒有登入討論貢獻建立帳號登入 命名空間 條目討論 臺灣正體 不转换简体繁體大陆简体香港繁體澳門繁體大马简体新加坡简体臺灣正體 查看 閱讀編輯檢視歷史 更多 搜尋 導航 首頁分類索引特色內容新聞動態近期變更隨機條目資助維基百科 說明 說明維基社群方針與指引互助客棧知識問答字詞轉換IRC即時聊天聯絡我們關於維基百科 工具 連結至此的頁面相關變更上傳檔案特殊頁面靜態連結頁面資訊引用此頁面維基數據項目 列印/匯出 下載為PDF可列印版 其他專案 維基共享資源 其他語言 العربيةAsturianuবাংলাCatalàČeštinaDanskDeutschΕλληνικάEnglishEspañolEestiEuskaraفارسیSuomiFrançaisGalegoעבריתहिन्दीMagyarBahasaIndonesiaItaliano日本語Қазақша한국어LietuviųМакедонскиBahasaMelayuNederlandsNorsknynorskNorskbokmålPolskiPortuguêsRomânăРусскийSimpleEnglishSlovenčinaSlovenščinaСрпски/srpskiSundaSvenskaதமிழ்ไทยTagalogTürkçeУкраїнськаاردوOʻzbekcha/ўзбекчаTiếngViệt粵語 編輯連結



請為這篇文章評分?