統雄-統計神掌機率論與機率分配篇/ Statistics Canon - 吳統雄

文章推薦指數: 80 %
投票人數:10人

而機率分配的狹義定義,就是描述這個集合的函數,又分為2類:機率密度函數(probability density function, PDF),累積分佈函數(cumulative distribution function, CDF ... 行為研究 English 吳統雄 國際研究團隊 知識光譜 第1類知識 第2類知識 第3類知識 取用行為模式 研究目錄 教學課程頁 研究方法 統計多變項分析 參考延伸文獻 討論區目錄 站務與協助 ☰ 社群地圖 社群新聞 │吳統雄 履歷 研究 教學 服務 榮譽 │社科 第1類知識 第2類知識 第3類知識 研究方法 統計/多變項分析 投票行為與選舉預測 53237選民結構 人類取用行為新典範 取用行為國際研究團隊 │資管 管理學‧經濟學 資訊系統開發 電子商務 網路教育 數位電視 產學合作 就業進修‧甄選必勝 │文創 數位美學/數位文創導論 數位出版/電子書 視覺設計 優化網站 數位視訊/微電影 數位文創管理 大學青年‧網路雜誌 │電音 統雄數位音樂作品選 我,被禁唱的民歌手 數位音樂創作教學 統雄的音樂知識美學 歡迎聽歌.點歌.下載樂譜 │人文 公共評論 法律評論 社會評論 教育文化傳媒評論 科技科普評論 美語樂學 文學創作 萬象現代(NBA) 資訊社會 幽默人生 統雄-統計神掌機率與分配 StatisticsProbabilityandDistribution 神掌打通任督二脈‧易筋經以簡馭繁 符號意義:統雄快訣 延伸閱讀 進階議題 警示訊息 統計精華 機率與機率論 機率分配 二項分配 常態分配 常態分配的來源 Gamma分配 機率分配與中央極限定理 無母數統計/非機率分配統計 機率悖論 統計與理論建構篇 統計方法SPSS應用篇 推論的基礎觀念基於常態分配,其為機率分配的一種。

  機率與機率論 機率就是碰運氣會發生某種事件的現象,典型的機率現象有扔硬幣、擲骰子、抽撲克牌以及輪盤遊戲等。

機率論就是從隨機變項、隨機程序、與發生事件3方面,研究機率現象。

  機率的估計值必須在「大數法則」下,才會實現;同時在「大數」時,觀察樣本會呈現「中央極限」現象,這是我們下一步解釋推論統計的基礎。

  機率現象是推論統計的基礎,而機率論已形成數學中的一個支流,並發展出許多有趣的悖論個案,而其中心旨意即:隨機現象與人類許多直覺並不相同。

  機率論博大精深、還有無限發展可能。

統雄老師的「接龍實驗」,也是試圖提出另一種機率預測的思想方法。

Probabilitytheoryisthebranchofmathematicsconcernedwithprobability,the analysisofrandomphenomena.Thecentralobjectsofprobabilitytheory arerandomvariables,random(stochastic)processes,andevents:mathematical abstractionsofnon-deterministiceventsormeasuredquantitiesthatmay eitherbesingleoccurrencesorevolveovertimeinanapparentlyrandom fashion.Ifanindividualcointossortherollofdiceisconsideredtobe arandomevent,thenifrepeatedmanytimesthesequenceofrandomevents willexhibitcertainpatterns,whichcanbestudiedandpredicted.Two representativemathematicalresultsdescribingsuchpatternsarethelawof largenumbersandthecentrallimittheorem. 機率分配 機率分配的傳統定義因為區別廣義(定義原理)、狹義(定義函數),以及各種應用時機,各個文獻的敘述通常很瑣碎、也很難懂。

統雄老師嘗試以白話說明:機率分配是某種樣本的集合,集合裡包括樣本會產生的統計量,以及各統計量所佔的樣本數。

而機率分配的狹義定義,就是描述這個集合的函數,又分為2類:機率密度函數(probabilitydensityfunction, PDF),累積分佈函數(cumulativedistributionfunction,CDF)。

機率密度函數(probabilitydensityfunction,PDF) 從微積分的觀念來理解:這個函數的Y值,就是觀察特徵值X值對應的樣本數,其函數曲線所覆蓋的面積,就是總樣本數。

(參見以下常態分配圖形) 這就是統雄老師教統計,要先教微積分的理由之一。

與其累積分佈函數(cumulativedistributionfunction,CDF) 從微積分的觀念來理解:就是以上函數的積分函數。

機率分配因各種時機不同,有數百種之多,當然其中有些是獨立存在的母分配,也有些是某種母分配下的特例子分配。

不過,還是以二項分配、常態分配、t分配,以及卡方分配、F分配(後2項是Gamma 分配的特殊情形),應用最廣泛。

機率分配與機率空間 所謂廣義的機率分配定義,就是以機率空間(Probabilityspace)為基礎定義。

(Ω,F,P):機率空間(Probabilityspace),是1個3元素(triplet)、基於集合論的數學構念。

Ω:是一個非空集合,稱作「樣本空間(samplespace)」。

F:是一個非空集合,集合元素稱為事件(event)。

P:機率(probability),隨機實驗時,某事件可能發生的百分比,同時P(Ω)=1。

即機率在0~1之間。

對屬於相同任意事件的2樣本,其出現機率相同,此現象即為機率分配,亦即其機率的積分現象。

樣本空間 假設有1付撲克牌,則其樣本空間為: Ω﹦{桃A~桃K,心A~心K,方A~方K,梅A~梅K} 計有52個樣本點(samplepoint)的樣本空間。

事件 樣本空間的任一子集,稱為一個「事件」。

在一個試驗裡,若我們關心某件事情會不會發生,則稱該件事情為「事件」,通常以大寫英文字母來表示一事件。

一個事件包含一個或多個樣本點。

事件有兩種:一種是簡單事件(simpleevent)。

另一種是複合事件(compositeevent)。

簡單事件 事件只包含一個樣本點者,稱為簡單事件。

令A事件為桃4,則表為 A={桃4},此為簡單事件。

  複合事件 事件包含二個或二個以上之樣本點者,稱為複合事件。

如令B事件為4,則表為B={桃4,心4,方4,梅4},此為複合事件。

機率 出現A事件的機率為:1/52 出現B事件的機率為:1/13 傳統機率論之事件類型 統雄老師以下將提出機率運算之新挑戰,故將當前之機率論,特稱為「傳統機率論」。

事件類型包括:空事件'、和事件、積事件、餘事件(complementevent),和互斥事件(mutuallyexclusiveevents)。

TX機率論之接龍實驗事件類型 隨機實驗的方法,就是「取出」,且每一樣本點彼此相同。

但接龍實驗的方法,更要「排序」,且每一樣本點之間有大小、優先、是否可排之條件。

同時,隨機實驗的執行,與實驗者是否具備何種能力無關;譬如,任何人要在一付牌中抽出{桃4},機率都是相同的。

對這種事件的解釋與預測,就是「機率知識」。

但人類行為許多都是非等機率的,譬如接龍實驗,與實驗者排序的知識與技術能力有關,每個人移動牌的機率,其實是主觀的、非等機率的。

以傳統機率知識,面對接龍實驗,要預測暗牌以完成排序,是無成功方案的。

過去已經有了一些非等機率的分析方法,譬如單向卡方分析 One-wayChi-squareAnalysis、貝氏定理、馬可夫鍊等,不過,也不足以解決接龍實驗這樣的複雜排序問題。

TX機率論:4元素非等機率空間論 統雄老師以解決「接龍問題」為例,特提出新4 元素非等機率空間論(TXprobabilityquadrupletspace): (Ω,Se,Su,P) Se:勢也,已知少數樣本組合,未知多數樣本組合事件。

Su:術也,在已知範圍內,實驗者可移動樣本排序的能力。

而每次開啟未知樣本,均為成本支出。

Su範圍在0~1。

P:以最少成本,成功預測、並完成未知樣本組合之排序機率。

故當Su=1時,便可經由模擬等低成本實驗,預測未知樣本組合之排序機率,而完成非等機率問題,如接龍實驗等的任務。

  線上排列組合計算器 基礎的機率計算,多是排列組合問題,當樣本空間(samplespace)、事件(event)大時,用手算也太複雜,所以練習可採用以上線上排列組合計算器。

其中: C:組合。

!:排列。

P:部分排列Partialpermutation,當前中文有譯為「置換」的趨勢。

H:重複組合,有些元素可重複出現。

n:總元素數 k:可重複出現元素數 複雜的機率計算,則牽涉離散數學(Discretemathematics)或稱組合數學(Combinatorics)的問題。

線上排列組合計算器實作 可在「統雄-統計神掌機率悖論專題篇」中,找一些例題應用實作。

二項分配 二項分配是二元資料分析、與百分比估計分析的基礎,是一般公共調查(如選情預測)與市場調查級最常用到的資料分析種類。

近年在統計軟體的進步下,學術調查研究分析競走複雜分析路線。

但在學術史上,對現代量化政治學、傳播學、社會學均扮演開山巨作的:People's Choice 一書,只用了百分比分析,而且還是敘述分析、不是推論分析。

半世紀以來,這3大學門的複雜研究何止千萬,但在知識的探索、與方法論的反省上,鮮少有能超過這本書的。

統雄老師用意不是要走回頭路,而是指出基礎的分析工具,還是能夠發展深遠的貢獻。

二項分配是n個獨立的是/非實驗中,成功次數的機率分配,其中每次的成功機率為p,失敗的機率為q=1-p。

典型的例子,就是投n次銅版,正面會出現的機率。

二項分配資料的母群很大時,分配的性質很接近下述的常態分配。

二項分配的進階說明與推論檢定,另提供專篇討論。

常態分配 生物界的大多數特質,樣本之間都會呈現常態分配-亦即如下圖般:左右對稱的鐘型曲線。

底部X 軸表示標準差(Z)。

Y值就是觀察特徵值X值對應的樣本數。

函數曲線所覆蓋的面積,就是總樣本數。

底部﹦號後的數值,為其垂直範圍占總樣本數的百分比(P),如正負1個標準差內的草數佔全體68.26%。

  Probability=範圍內樣本數,占母群的百分比。

StandardDeviations=標準差,亦稱離均差。

ZScores=Z分數,就是有幾個標準差,兩者其實相同。

常用Z值有2和2.5。

常用Z值有2和2.5。

當Z=2,單側P=.4772,左右合計為P≒.95,即95%的樣本,在2個標準差之內。

當Z=2.5,單側P=.4938,左右合計為P≒.99,即99%的樣本,在2.5個標準差之內。

  常態分配有很多深入的啟示,其中1項就是:不要把形象表面的差距,誤以為是真實的差距!   常態分配的來源 本進階節主要說明微積分與統計的關係,以曲線面積解決問題,與其思想方法。

我個人從這個推論過程學習到很多,在此提供有意進階學習者參考,但初學者可以跳過。

常態分配時,設以下之機率條件: 正好等於其條件區間之定積分。

故其不定積分為其機率累加值,特稱CumulativeDistributionFunction(CDF)。

對積分微分,就是原始函數,特稱為Probability DensityFunction(PDF)。

  將微分式轉為函數式:   以上是平均數為0,標準差為1的情形,稱為標準常態分配。

常態分配的一般式為:   Φ 是CDF函數。

  Gamma分配 科學知識的解說 科學知識的解說方式造成效果差異很大,不論一般認為相當科普的wiki解說、或如何表現的正規解說,對不是對微積分非常有興趣的人士,一樣是天書。

TXGamma分配白話解說 統雄老師嘗試再給一個白話解說:Gamma 分配就是基於「大風吹遊戲」,排列組合觀念,計算可搶到椅子的機率。

然後應用到列聯表中,比較:當列次數分配與欄次數分配確定時,各細格的次數分配,是否仍在隨機範圍之內? TXGamma函數最簡說  Gamma分配,是依據Gamma函數(Γ),也就是「排列函數factorialfunction」而來,若n為正整數,則其定義如下: 其計算方式舉例如下: 以上函數以圖形表現,是一個不連續的點圖形,而進階的考量,就是要發展一個函數,將各點連成平滑曲線,問題如下: 許多學者共同努力,最後發展出以下公式,且可在「複數系(complexnumbersplane)」中使用: 而其圖形為: 注意:右上方,就是由「正整數」開始發問的圖形。

而根據廣義「複數系(complexnumbersplane)」的公式,Gamma函數會出現一個重要的性質: Gamma 分配家族包括: t分配 卡方分配 F分配 Beta 分配 Poisson 分配:類同以上分配,當計量對象為類別資料時。

機率分配與中央極限定理 無母數統計Non-parametricstatistics/非機率分配統計Distribution-free statistics 機率悖論 統計與理論建構篇 基本統計方法應用-SPSS篇 統計符號 http://cnx.org/content/m16302/latest/ 統雄數學神掌系列目錄 分享意見反映 統計教學的內涵與取向 高考統計考題的解析 微積分精華篇 微積分思想篇 微積分進階精華篇 統計/數學符號與其英語讀法 資料型態與視覺呈現 敘述統計 機率論與機率分配 推論統計學精華篇 t分配與t檢定 推論統計‧理論建構 資料分析程序與SPSS基礎 SPSS資料清理 SPSS轉換:Recode重新編碼 SPSS轉換:Compute建構新變項 SPSS選擇觀察值_SPSS 資料庫管理 樣本代表性檢定 單變項:類別_二元資料/百分比分析-詮釋 單變項:類別_二元資料/百分比推論-應用 單變項分析:連續資料_描述與估計推論 單變項連續資料的視覺檢視:變項清理與啟發 卡方分析(雙向) 多向卡方分析 列聯表樞紐分析 單向卡方分析 變異數分析(單因子):詮釋 變異數分析(單因子):應用 簡單迴歸/相關分析:詮釋 簡單迴歸/相關分析:應用 對數/邏輯相關分析 測量工具信度/效度分析 量表信度檢定 量表效標關聯效度檢定 探索式因素分析(EFA):詮釋與實作 探索式因素分析(EFA):應用進階 因素效度分析_CFA:詮釋 因素效度分析_CFA:應用 多變項分析精華篇 多元迴歸分析:詮釋 多元迴歸分析:應用 一般線性模型精華篇 廣義線性模型 雙因子/多因子變異數分析 調節模型與交互作用詮釋 調節模型分析與建構 SPSS統計圖應用:調節模型檢定 共變數分析/詮釋 共變模型建構/應用 因果模型與因果邏輯 中介模型分析 因徑/SEM:模型詮釋與因果邏輯 因徑/SEM:探索式因徑模型建構 因徑/SEM:驗證式結構方程解析 多變項分析實例SEM篇 多變項分析實例SEM+調節篇 因徑/結構方程SEM:反省 無母數統計 統計研討篇 專題-統合分析Meta-Analysis與森林圖ForestPlot 專題-卜豐投針實驗 專題-機率與統計悖論 第1類知識計量工具 第2類知識計量工具 第3類知識計量工具 非等機率統計_新知識體系建構 TX空時座標建構 一般取用測量 信仰取用測量 研究方法/民調市調系列          本站Google排行榜‧全球冠軍 研究方法講義目錄 資訊管理講義目錄 數位文創/數位內容講義目錄 數位音樂講義目錄 產學合作-就業進修講義目錄 人文素養-人與社會講義目錄 人類行為+資訊管理研究目錄 網路使用/電子商務研究目錄 網路教育研究目錄 數位音樂作品目錄



請為這篇文章評分?