概率論

出自維基百科,自由嘅百科全書
跳去導覽 跳去搵嘢
輪盤(上)、掟銀仔(左下)同擲骰仔(右下)一般俾人認為係本質上隨機性嘅事件

概率論粵拼koi3 leot2 leon6英文probability theory)係研究概率嘅一個數學理論概率(probability),粵文入面又有叫機會率或者或然率,係指一件事件有幾可能係真,1 代表件事實會發生,0 代表件事絕對唔會發生,0.5 就表示件事「有 50% 機會發生」;例如家陣掟一個銀仔,假設個銀仔冇出千嘅話,應該會有 50% 機會出「公」、50% 機會出「字」,而呢件事嘅結果(公定字)原則上係冇可能預測嘅,反映咗不確定性(uncertainty)[1]

喺概率論史上,「概率呢個數值要點樣理解」係一個有相當爭議性嘅問題:喺最基本上,古典嘅決定論(determinism)主張如果一個觀察者喺而家呢一刻完美知道嗮宇宙嘅狀態(例:知道每粒原子喺乜位置同以乜嘢速度郁緊等等),佢將會有能力靠物理定律-假設佢識嗮所需嘅物理知識-完美預測宇宙下一刻嘅狀態(可以睇吓拉普拉斯魔[2],所以概率呢個數值淨係反映人類知識唔夠,而主張呢個觀點嘅人會話「人之所以預測唔到掟銀仔嘅結果,係因為人知唔嗮風向等嘅資訊[3][4]。不過廿世紀量子力學(quantum mechanics)研究指出,宇宙裏面有部份嘅事件似乎係本質上就冇可能完全準確噉預測嘅,人頂櫳都淨係有得估呢啲事件發生嘅概率[5]

喺廿一世紀初,概率論經已成為咗一個重要嘅數學理論。例如統計學(statistics)就係建基於概率論嘅[1],而概率同相關概念喺機械學習(教人工智能學習同處理不確定性嘅技術)[6]同埋遊戲設計(可能會涉及設計帶有隨機性嘅遊戲[7]上都有用。

基礎[編輯]

內文:不確定性隨機性

不確定性(uncertainty)指一個個體手上資訊唔夠嘅情況,例如有個人搵個唔透明嘅骰盅𢫏住咗粒六面嘅骰仔,然後係噉勁搖個骰盅,假設佢完全冇方法睇到粒骰仔(資訊唔夠),佢喺攞開個骰盅之前就會經歷不確定性,唔知粒骰仔邊一面向上。

例子

伯努利試驗(Bernoulli trial)指有兩個可能結果嘅隨機性實驗,例如係掟銀仔(一係出「公」一係出「字」)噉[8]

重要概念[編輯]

用一幅溫氏圖表示三件事件--之間嘅機會率要點樣用數學符號表達。

數學表示[編輯]

睇埋:溫氏圖

喺實際應用上,啲人一般會用以下嘅數學符號表示唔同事件嘅機會率:

  • (或者 )代表「 發生嘅機會率」,
  • 代表「 都發生嘅機會率」(交集;intersection),而
  • 就代表「 或者 發生嘅機會率」(併集;union)[1]

上述嘅概念可以用溫氏圖(Venn diagram)嚟表達。一幅溫氏圖入面會有若干個波波,每個波波代表一件事件,而兩個波波之間嘅相交空間代表嗰兩個波波代表嗰兩件事件嘅交集[9]

對立同互斥[編輯]

內文:對立事件互斥、 同 非互斥
  • 對立事件(complementary event):喺統計學同概率論上,「 嘅對立事件」( 或者 )係指「 冇發生」呢一件事件。
  • 互斥事件(mutually exclusive events):如果話「 係互斥事件」,即係話兩件事冇可能同時發生-
    [10]
  • 非互斥事件(non-mutually exclusive events):如果 係非互斥事件,即係話兩件事有可能同時發生-
    [10]

條件機會率[編輯]

內文:條件機會率
  • 條件機會率(conditional probability):指如果一件事件發生咗,另一件事件發生嘅機會率,「 發生咗, 嘅條件機會率」係
    ;呢個數值可以用以下呢條式計[11]
    如果 互斥事件
  • 貝葉斯定理(Bayes' theorem):指以下嘅定理

獨立[編輯]

內文:獨立 (概率論)
  • 獨立(statistical independence):喺統計學同概率論上,如果話「 係獨立」嘅話,意思即係兩件事唔會影響對方發生嘅機會率,
    ,所以
    呢條式表示,就算 發生咗, 發生嘅機會率依然係 ,反之亦然[12]

概率分佈[編輯]

內文:概率分佈

概率分佈(probability distribution):指一個表明某個變數嘅每個可能數值出現嘅機會率函數,當中 就係個概率分佈;呢個函數可以畫做一個表,X 軸代表個目標變數嘅數值,Y 軸代表嗰個目標變數嘅每個數值出現嘅機會率;是但搵個變數 喺總體當中有一個概率分佈,表示 每個可能數值 出現嘅機會率,呢個分佈喺實際上係不可知嘅,研究者淨係有得攞樣本,量度樣本當中嘅概率分佈(喺個樣本入面, 嘅每個可能數值出現嘅機會率大約係幾多),並且靠噉嚟估計個總體分佈[13]

常態分佈[編輯]

內文:常態分佈

例如常態分佈(normal distribution)係統計分析上最常用嘅概率分佈之一。喺常態分佈下,出現得最頻密嘅數值會係個平均數),而離平均數愈遠嘅數值就愈少會出現,畫成圖會出一條鐘形線(bell curve);常見可以用常態分佈模擬嘅變數有人類嘅身高-多數人嘅身高數值都傾向於平均數,愈極端嘅數值愈少出現,即係話好少有極高或者極矮嘅人。常態分佈嘅概率密度函數係( 係個分佈嘅標準差[13]

常態分佈畫做圖嘅樣;x 軸代表目標變數嘅數值,y 軸代表目標變數嘅每個數值出現嘅機會率

概率定理[編輯]

  • 概率連鎖法則chain rule):有兩件隨機事件
而如果要考慮嘅事件()有多過兩件:

同統計學嘅啦掕[編輯]

睇埋:統計學

機會率係統計學機械學習等領域上實要思考嘅一個課題:呢啲領域都涉及研究者由一個總體(population)入面攞一個樣本(sample)出嚟,並且嘗試靠分析手上嘅樣本嚟增進自己對個總體嘅認識,但呢種做法本質上就有不確定性(uncertainty)-難以保證個樣本實係代表到個總體,例如研究者想研究體重,因為人力物力嘅限制,佢冇可能研究嗮古往今來所有嘅狼,所以佢就去搵 100 隻狼返嚟做研究,佢量度到呢個樣本嘅狼平均體重係 40 公斤,就最嚴格嘅邏輯基準嚟講,呢個數可能真係代表到全世界嘅狼,但又有可能全世界嘅狼嘅平均體重查實係 60 公斤,個研究者之所以搵到 40 公斤呢個數只係佢咁啱唔好彩抽到個代表唔到個總體嘅樣本-隨機性係統計學分析上走唔甩嘅一部份[1]

詮釋[編輯]

內文:概率嘅詮釋

簡史[編輯]

睇埋[編輯]

[編輯]

  1. 1.0 1.1 1.2 1.3 William Feller, An Introduction to Probability Theory and Its Applications, (Vol 1), 3rd Ed, (1968), Wiley.
  2. Richard Langdon Franklin (1968). Freewill and determinism: a study of rival conceptions of man. Routledge & K. Paul.
  3. Laplace, Pierre Simon. A Philosophical Essay on Probabilities, translated into English from the original French 6th ed. by Truscott, F.W. and Emory, F.L., Dover Publications (New York, 1951).
  4. Moore, W.J. (1992). Schrödinger: Life and Thought. Cambridge University Press. p. 479.
  5. Stephen Hawking's Grand Design (2010), page 32: "the molecular basis of biology shows that biological processes are governed by the laws of physics and chemistry and therefore are as determined as the orbits of the planets...so it seems that we are no more than biological machines and that free will is just an illusion", and page 72: "Quantum physics might seem to undermine the idea that nature is governed by laws, but that is not the case. Instead it leads us to accept a new form of determinism: Given the state of a system at some time, the laws of nature determine the probabilities of various futures and pasts rather than determining the future and past with certainty." (discussing a Many worlds interpretation).
  6. Mohri, Mehryar; Rostamizadeh, Afshin; Talwalkar, Ameet (2012). Foundations of Machine Learning. USA, Massachusetts: MIT Press.
  7. Dervishi, Kay (2019-06-18). "Other games of chance and skill on Albany's agenda". CSNY.
  8. Papoulis, A. (1984). "Bernoulli Trials". Probability, Random Variables, and Stochastic Processes (2nd ed.). New York: McGraw-Hill. pp. 57–63.
  9. Mahmoodian, Ebadollah S.; Rezaie, M.; Vatan, F. (March 1987). "Generalization of Venn Diagram". Eighteenth Annual Iranian Mathematics Conference. Tehran and Isfahan, Iran.
  10. 10.0 10.1 Miller, Scott; Childers, Donald (2012). Probability and Random Processes (Second ed.). Academic Press. p. 8. ISBN 978-0-12-386981-4. The sample space is the collection or set of 'all possible' distinct (collectively exhaustive and mutually exclusive) outcomes of an experiment."
  11. Olofsson (2005) p. 29.
  12. Olofsson (2005) p. 35.
  13. 13.0 13.1 Ash, Robert B. (2008). Basic probability theory (Dover ed.). Mineola, N.Y.: Dover Publications. pp. 66–69.

參考文獻[編輯]

  • Patrick Billingsley (1979). Probability and Measure. New York, Toronto, London: John Wiley and Sons.
  • Olav Kallenberg; Foundations of Modern Probability, 2nd ed. Springer Series in Statistics. (2002). 650 pp. ISBN 0-387-95313-2