統雄-統計神掌機率論與機率分配篇/ Statistics Canon - 吳統雄
文章推薦指數: 80 %
而機率分配的狹義定義,就是描述這個集合的函數,又分為2類:機率密度函數(probability density function, PDF),累積分佈函數(cumulative distribution function, CDF ...
行為研究
English
吳統雄
國際研究團隊
知識光譜
第1類知識
第2類知識
第3類知識
取用行為模式
研究目錄
教學課程頁
研究方法
統計多變項分析
參考延伸文獻
討論區目錄
站務與協助
☰
社群地圖
社群新聞
│吳統雄
履歷
研究
教學
服務
榮譽
│社科
第1類知識
第2類知識
第3類知識
研究方法
統計/多變項分析
投票行為與選舉預測
53237選民結構
人類取用行為新典範
取用行為國際研究團隊
│資管
管理學‧經濟學
資訊系統開發
電子商務
網路教育
數位電視
產學合作
就業進修‧甄選必勝
│文創
數位美學/數位文創導論
數位出版/電子書
視覺設計
優化網站
數位視訊/微電影
數位文創管理
大學青年‧網路雜誌
│電音
統雄數位音樂作品選
我,被禁唱的民歌手
數位音樂創作教學
統雄的音樂知識美學
歡迎聽歌.點歌.下載樂譜
│人文
公共評論
法律評論
社會評論
教育文化傳媒評論
科技科普評論
美語樂學
文學創作
萬象現代(NBA)
資訊社會
幽默人生
統雄-統計神掌機率與分配
StatisticsProbabilityandDistribution
神掌打通任督二脈‧易筋經以簡馭繁
符號意義:統雄快訣
延伸閱讀
進階議題
警示訊息
統計精華
機率與機率論
機率分配
二項分配
常態分配
常態分配的來源
Gamma分配
機率分配與中央極限定理
無母數統計/非機率分配統計
機率悖論
統計與理論建構篇
統計方法SPSS應用篇
推論的基礎觀念基於常態分配,其為機率分配的一種。
機率與機率論
機率就是碰運氣會發生某種事件的現象,典型的機率現象有扔硬幣、擲骰子、抽撲克牌以及輪盤遊戲等。
機率論就是從隨機變項、隨機程序、與發生事件3方面,研究機率現象。
機率的估計值必須在「大數法則」下,才會實現;同時在「大數」時,觀察樣本會呈現「中央極限」現象,這是我們下一步解釋推論統計的基礎。
機率現象是推論統計的基礎,而機率論已形成數學中的一個支流,並發展出許多有趣的悖論個案,而其中心旨意即:隨機現象與人類許多直覺並不相同。
機率論博大精深、還有無限發展可能。
統雄老師的「接龍實驗」,也是試圖提出另一種機率預測的思想方法。
Probabilitytheoryisthebranchofmathematicsconcernedwithprobability,the
analysisofrandomphenomena.Thecentralobjectsofprobabilitytheory
arerandomvariables,random(stochastic)processes,andevents:mathematical
abstractionsofnon-deterministiceventsormeasuredquantitiesthatmay
eitherbesingleoccurrencesorevolveovertimeinanapparentlyrandom
fashion.Ifanindividualcointossortherollofdiceisconsideredtobe
arandomevent,thenifrepeatedmanytimesthesequenceofrandomevents
willexhibitcertainpatterns,whichcanbestudiedandpredicted.Two
representativemathematicalresultsdescribingsuchpatternsarethelawof
largenumbersandthecentrallimittheorem.
機率分配
機率分配的傳統定義因為區別廣義(定義原理)、狹義(定義函數),以及各種應用時機,各個文獻的敘述通常很瑣碎、也很難懂。
統雄老師嘗試以白話說明:機率分配是某種樣本的集合,集合裡包括樣本會產生的統計量,以及各統計量所佔的樣本數。
而機率分配的狹義定義,就是描述這個集合的函數,又分為2類:機率密度函數(probabilitydensityfunction,
PDF),累積分佈函數(cumulativedistributionfunction,CDF)。
機率密度函數(probabilitydensityfunction,PDF)
從微積分的觀念來理解:這個函數的Y值,就是觀察特徵值X值對應的樣本數,其函數曲線所覆蓋的面積,就是總樣本數。
(參見以下常態分配圖形)
這就是統雄老師教統計,要先教微積分的理由之一。
與其累積分佈函數(cumulativedistributionfunction,CDF)
從微積分的觀念來理解:就是以上函數的積分函數。
機率分配因各種時機不同,有數百種之多,當然其中有些是獨立存在的母分配,也有些是某種母分配下的特例子分配。
不過,還是以二項分配、常態分配、t分配,以及卡方分配、F分配(後2項是Gamma
分配的特殊情形),應用最廣泛。
機率分配與機率空間
所謂廣義的機率分配定義,就是以機率空間(Probabilityspace)為基礎定義。
(Ω,F,P):機率空間(Probabilityspace),是1個3元素(triplet)、基於集合論的數學構念。
Ω:是一個非空集合,稱作「樣本空間(samplespace)」。
F:是一個非空集合,集合元素稱為事件(event)。
P:機率(probability),隨機實驗時,某事件可能發生的百分比,同時P(Ω)=1。
即機率在0~1之間。
對屬於相同任意事件的2樣本,其出現機率相同,此現象即為機率分配,亦即其機率的積分現象。
樣本空間
假設有1付撲克牌,則其樣本空間為:
Ω﹦{桃A~桃K,心A~心K,方A~方K,梅A~梅K}
計有52個樣本點(samplepoint)的樣本空間。
事件
樣本空間的任一子集,稱為一個「事件」。
在一個試驗裡,若我們關心某件事情會不會發生,則稱該件事情為「事件」,通常以大寫英文字母來表示一事件。
一個事件包含一個或多個樣本點。
事件有兩種:一種是簡單事件(simpleevent)。
另一種是複合事件(compositeevent)。
簡單事件
事件只包含一個樣本點者,稱為簡單事件。
令A事件為桃4,則表為 A={桃4},此為簡單事件。
複合事件
事件包含二個或二個以上之樣本點者,稱為複合事件。
如令B事件為4,則表為B={桃4,心4,方4,梅4},此為複合事件。
機率
出現A事件的機率為:1/52
出現B事件的機率為:1/13
傳統機率論之事件類型
統雄老師以下將提出機率運算之新挑戰,故將當前之機率論,特稱為「傳統機率論」。
事件類型包括:空事件'、和事件、積事件、餘事件(complementevent),和互斥事件(mutuallyexclusiveevents)。
TX機率論之接龍實驗事件類型
隨機實驗的方法,就是「取出」,且每一樣本點彼此相同。
但接龍實驗的方法,更要「排序」,且每一樣本點之間有大小、優先、是否可排之條件。
同時,隨機實驗的執行,與實驗者是否具備何種能力無關;譬如,任何人要在一付牌中抽出{桃4},機率都是相同的。
對這種事件的解釋與預測,就是「機率知識」。
但人類行為許多都是非等機率的,譬如接龍實驗,與實驗者排序的知識與技術能力有關,每個人移動牌的機率,其實是主觀的、非等機率的。
以傳統機率知識,面對接龍實驗,要預測暗牌以完成排序,是無成功方案的。
過去已經有了一些非等機率的分析方法,譬如單向卡方分析
One-wayChi-squareAnalysis、貝氏定理、馬可夫鍊等,不過,也不足以解決接龍實驗這樣的複雜排序問題。
TX機率論:4元素非等機率空間論
統雄老師以解決「接龍問題」為例,特提出新4
元素非等機率空間論(TXprobabilityquadrupletspace):
(Ω,Se,Su,P)
Se:勢也,已知少數樣本組合,未知多數樣本組合事件。
Su:術也,在已知範圍內,實驗者可移動樣本排序的能力。
而每次開啟未知樣本,均為成本支出。
Su範圍在0~1。
P:以最少成本,成功預測、並完成未知樣本組合之排序機率。
故當Su=1時,便可經由模擬等低成本實驗,預測未知樣本組合之排序機率,而完成非等機率問題,如接龍實驗等的任務。
線上排列組合計算器
基礎的機率計算,多是排列組合問題,當樣本空間(samplespace)、事件(event)大時,用手算也太複雜,所以練習可採用以上線上排列組合計算器。
其中:
C:組合。
!:排列。
P:部分排列Partialpermutation,當前中文有譯為「置換」的趨勢。
H:重複組合,有些元素可重複出現。
n:總元素數
k:可重複出現元素數
複雜的機率計算,則牽涉離散數學(Discretemathematics)或稱組合數學(Combinatorics)的問題。
線上排列組合計算器實作
可在「統雄-統計神掌機率悖論專題篇」中,找一些例題應用實作。
二項分配
二項分配是二元資料分析、與百分比估計分析的基礎,是一般公共調查(如選情預測)與市場調查級最常用到的資料分析種類。
近年在統計軟體的進步下,學術調查研究分析競走複雜分析路線。
但在學術史上,對現代量化政治學、傳播學、社會學均扮演開山巨作的:People's
Choice
一書,只用了百分比分析,而且還是敘述分析、不是推論分析。
半世紀以來,這3大學門的複雜研究何止千萬,但在知識的探索、與方法論的反省上,鮮少有能超過這本書的。
統雄老師用意不是要走回頭路,而是指出基礎的分析工具,還是能夠發展深遠的貢獻。
二項分配是n個獨立的是/非實驗中,成功次數的機率分配,其中每次的成功機率為p,失敗的機率為q=1-p。
典型的例子,就是投n次銅版,正面會出現的機率。
二項分配資料的母群很大時,分配的性質很接近下述的常態分配。
二項分配的進階說明與推論檢定,另提供專篇討論。
常態分配
生物界的大多數特質,樣本之間都會呈現常態分配-亦即如下圖般:左右對稱的鐘型曲線。
底部X
軸表示標準差(Z)。
Y值就是觀察特徵值X值對應的樣本數。
函數曲線所覆蓋的面積,就是總樣本數。
底部﹦號後的數值,為其垂直範圍占總樣本數的百分比(P),如正負1個標準差內的草數佔全體68.26%。
Probability=範圍內樣本數,占母群的百分比。
StandardDeviations=標準差,亦稱離均差。
ZScores=Z分數,就是有幾個標準差,兩者其實相同。
常用Z值有2和2.5。
常用Z值有2和2.5。
當Z=2,單側P=.4772,左右合計為P≒.95,即95%的樣本,在2個標準差之內。
當Z=2.5,單側P=.4938,左右合計為P≒.99,即99%的樣本,在2.5個標準差之內。
常態分配有很多深入的啟示,其中1項就是:不要把形象表面的差距,誤以為是真實的差距!
常態分配的來源
本進階節主要說明微積分與統計的關係,以曲線面積解決問題,與其思想方法。
我個人從這個推論過程學習到很多,在此提供有意進階學習者參考,但初學者可以跳過。
常態分配時,設以下之機率條件:
正好等於其條件區間之定積分。
故其不定積分為其機率累加值,特稱CumulativeDistributionFunction(CDF)。
對積分微分,就是原始函數,特稱為Probability DensityFunction(PDF)。
將微分式轉為函數式:
以上是平均數為0,標準差為1的情形,稱為標準常態分配。
常態分配的一般式為:
Φ 是CDF函數。
Gamma分配
科學知識的解說
科學知識的解說方式造成效果差異很大,不論一般認為相當科普的wiki解說、或如何表現的正規解說,對不是對微積分非常有興趣的人士,一樣是天書。
TXGamma分配白話解說
統雄老師嘗試再給一個白話解說:Gamma
分配就是基於「大風吹遊戲」,排列組合觀念,計算可搶到椅子的機率。
然後應用到列聯表中,比較:當列次數分配與欄次數分配確定時,各細格的次數分配,是否仍在隨機範圍之內?
TXGamma函數最簡說
Gamma分配,是依據Gamma函數(Γ),也就是「排列函數factorialfunction」而來,若n為正整數,則其定義如下:
其計算方式舉例如下:
以上函數以圖形表現,是一個不連續的點圖形,而進階的考量,就是要發展一個函數,將各點連成平滑曲線,問題如下:
許多學者共同努力,最後發展出以下公式,且可在「複數系(complexnumbersplane)」中使用:
而其圖形為:
注意:右上方,就是由「正整數」開始發問的圖形。
而根據廣義「複數系(complexnumbersplane)」的公式,Gamma函數會出現一個重要的性質:
Gamma
分配家族包括:
t分配
卡方分配
F分配
Beta
分配
Poisson
分配:類同以上分配,當計量對象為類別資料時。
機率分配與中央極限定理
無母數統計Non-parametricstatistics/非機率分配統計Distribution-free
statistics
機率悖論
統計與理論建構篇
基本統計方法應用-SPSS篇
統計符號
http://cnx.org/content/m16302/latest/
統雄數學神掌系列目錄
分享意見反映
統計教學的內涵與取向
高考統計考題的解析
微積分精華篇
微積分思想篇
微積分進階精華篇
統計/數學符號與其英語讀法
資料型態與視覺呈現
敘述統計
機率論與機率分配
推論統計學精華篇
t分配與t檢定
推論統計‧理論建構
資料分析程序與SPSS基礎
SPSS資料清理
SPSS轉換:Recode重新編碼
SPSS轉換:Compute建構新變項
SPSS選擇觀察值_SPSS
資料庫管理
樣本代表性檢定
單變項:類別_二元資料/百分比分析-詮釋
單變項:類別_二元資料/百分比推論-應用
單變項分析:連續資料_描述與估計推論
單變項連續資料的視覺檢視:變項清理與啟發
卡方分析(雙向)
多向卡方分析
列聯表樞紐分析
單向卡方分析
變異數分析(單因子):詮釋
變異數分析(單因子):應用
簡單迴歸/相關分析:詮釋
簡單迴歸/相關分析:應用
對數/邏輯相關分析
測量工具信度/效度分析
量表信度檢定
量表效標關聯效度檢定
探索式因素分析(EFA):詮釋與實作
探索式因素分析(EFA):應用進階
因素效度分析_CFA:詮釋
因素效度分析_CFA:應用
多變項分析精華篇
多元迴歸分析:詮釋
多元迴歸分析:應用
一般線性模型精華篇
廣義線性模型
雙因子/多因子變異數分析
調節模型與交互作用詮釋
調節模型分析與建構
SPSS統計圖應用:調節模型檢定
共變數分析/詮釋
共變模型建構/應用
因果模型與因果邏輯
中介模型分析
因徑/SEM:模型詮釋與因果邏輯
因徑/SEM:探索式因徑模型建構
因徑/SEM:驗證式結構方程解析
多變項分析實例SEM篇
多變項分析實例SEM+調節篇
因徑/結構方程SEM:反省
無母數統計
統計研討篇
專題-統合分析Meta-Analysis與森林圖ForestPlot
專題-卜豐投針實驗
專題-機率與統計悖論
第1類知識計量工具
第2類知識計量工具
第3類知識計量工具
非等機率統計_新知識體系建構
TX空時座標建構
一般取用測量
信仰取用測量
研究方法/民調市調系列
本站Google排行榜‧全球冠軍
研究方法講義目錄
資訊管理講義目錄
數位文創/數位內容講義目錄
數位音樂講義目錄
產學合作-就業進修講義目錄
人文素養-人與社會講義目錄
人類行為+資訊管理研究目錄
網路使用/電子商務研究目錄
網路教育研究目錄
數位音樂作品目錄
延伸文章資訊
- 1抽樣與抽樣分配
建立估計值(統計值)及利用樣本資訊來檢. 定母體的假設。 ... 抽樣分配. (Sampling Distribution) (1). • 假設我們現在另外抽出30位主管的資料,得到以. 下的點...
- 2統雄-統計神掌機率論與機率分配篇/ Statistics Canon - 吳統雄
而機率分配的狹義定義,就是描述這個集合的函數,又分為2類:機率密度函數(probability density function, PDF),累積分佈函數(cumulative distribu...
- 3三分鐘搞懂常態分配(Normal Distribution)(鐘型曲線)
Hello~歡迎大家來到3分鐘統計小學堂, 記得上次和大家分享Z分數與T分數,不知道大家還有沒有印象呢? 現在要和大家聊聊常態分配一、常態分配的定義在有 ...
- 4連續隨機變數及其常用的機率分配
4. 了解均等分配、指數分配的意義及性質並計算其期望值與. 變異數。 5. 比較超幾何分配、二項分配、泊松分配與常態分配。 應用統計學林惠玲陳正倉著 ...
- 5第五章常態分配(The Normal Distribution)
3、 以機率的方式來表達前述之面積。 貳、前言. 常態曲線(The Normal Curve) 及常態分配的觀念,在統計中十分. 重要,它們是 ...