超幾何
概率質量函數  |
累積分佈函數  |
變數 |
 |
---|
撐集 |
 |
---|
PMF |
 |
---|
CDF |
where is the generalized hypergeometric function |
---|
平均數 |
 |
---|
眾數 |
 |
---|
方差 |
 |
---|
偏度 |
![{\displaystyle {\frac {(N-2K)(N-1)^{\frac {1}{2}}(N-2n)}{[nK(N-K)(N-n)]^{\frac {1}{2}}(N-2)}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f9ec1b0c28225251fa3fd794e30bffc3eb34315e) |
---|
峰度 |


![{\displaystyle {}+6nK(N-K)(N-n)(5N-6){\big ]}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/873d966636267a7d676f2d26681eb7bcf1a2259b) |
---|
MGF |
 |
---|
CF |
 |
---|
喺概率論同統計學,超幾何分佈係離散概率分佈一種,用嚟描述以下嘅現象:想像而家由某個總體嗰度做抽樣,總體入便有 N 件物件而 N 係有限數值,抽咗出嚟唔放返入總體;同時計數嘅人指定某某特性,而總體入便有 K 件物件有呢種特性;超幾何分佈模擬嘅就係
- 「由總體抽出咗 n 件物件之後,抽中 k 件有指定嗰種特性嘅物件」
嘅機率。
舉具體例子嘅話,可以想像抽啤牌。假想依家有一副標準 52 張嘅啤牌,假設副牌洗好咗,咭牌次序係隨機嘅,而計數嘅人想知由呢副牌入便抽 5 張出嚟,即係 n = 5,有幾大機會其中兩張係紅心,即係指定嘅特性係紅心而 k = 2 咁多。假設抽咗出嚟嘅牌唔會放返入去,呢個情況就可以用超幾何分佈嚟計算。事實上,超幾何分佈成日會用嚟分析咭牌遊戲嘅數學特性。
超幾何分佈同二項分佈有啲似,但二項分佈假設係抽咗樣之後係會放返入去嘅,一次抽樣抽到乜嘅機率,唔會受「上次抽到乜」影響;相比之下,超幾何分佈模擬嘅係抽咗出嚟唔會放返入去,所以今次抽到紅心,下次再抽到紅心嘅機率就會變咗。
超幾何分佈可以用以下嘅條件描述:
- 每次抽樣結果,都可以分成兩個互斥嘅類別(例如:合格或唔合格,或者就業或失業)。
- 每次抽樣後,因為唔放返入(有限)總體,所以成功(抽到想要嗰個類別)嘅機率會改變。
- 如果某某隨機變數 X 遵循超幾何分佈,佢嘅概率質量函數(PMF)可以寫做以下噉[1]:

當中:
係總體入面物件嘅總數,
係總體入面擁有指定特性嘅物件數量,
係抽樣次數(即係每次試驗抽幾多件),
係實際抽到擁有指定特性嘅物件數量,
係二項式係數。
呢個概率質量函數喺以下範圍內會出正嘅數值:

一個隨機變量如果遵循參數為
、
同
嘅超幾何分佈,可以寫做:

超幾何分佈可以用嚟分析多種紙牌遊戲嘅數學特性。
想像而家玩集換式咭牌遊戲,玩家喺度設計自己副咭組(deck),佢好可能會想知道「喺第 n 個回合,有幾大機會抽到一張有 XX 特性嘅咭,呢個時候就可能會用到超幾何分佈嚟計數。舉例,假設玩家用緊一副有 60 張咭嘅咭組,入面有 8 張係目標咭牌,而每個回合玩家都會抽一張咭。噉玩家就可以問,喺開局嗰陣嘅 7 張手牌加埋喺第 n 回合前抽到嘅咭(總共 7+n-1 咁多張)抽中最少一張目標咭牌嘅機率係幾多?而因為啲咭抽咗之後正常唔會放返入去,所以呢種情況啱啱好符合超幾何分佈嘅條件。舉個數值例子:如果想計喺第 3 回合開始之前,到時已經抽咗 7+2=9 張咭,抽到最少一張目標咭牌嘅機率,可以用超幾何分佈去搵答案;首先,計「完全抽唔到目標咭牌」嘅機率[2]:
- 總體有 N=60 張咭。
- 成功狀態(抽中目標咭牌)數量係 K=8。
- 抽咗 n=9 張咭
- 想計 k=0(一張目標咭牌都抽唔中)嘅機率。
呢種計算對設計咭組策略嚟講好重要,可以幫玩家預測咭組運行起上嚟有幾穩定。