跳去內容

點估計

出自維基百科,自由嘅百科全書
圖中嘅概率分佈,設打橫軸做目標變數嘅可能值,
點估計會類似噉:估計目標變數嘅預期值,係 0。
區間估計會類似噉:估計目標變數嘅數值,係喺 -a 同 a 之間。

點估計(參見英文point estimation )係統計學上嘅重要概念,講緊要用樣本數據嚟計出參數嘅值,作為估計嘅數值,相對於區間估計:區間估計係指做估計嗰陣,估計目標數值喺某個區間之中。圖像化噉想像:如果畫做圖嘅話,個估計值會係軸上面嘅,而區間估計則會係一個區域,包括若干個數值[1]

基本諗頭

[編輯]
睇埋:抽樣參數

統計學嘅一個重點,係在於要透過局部去推斷全部:喺科學上,研究者通常都無法攞晒成個總體嘅所有個案嘅數據,所以就焗住要做抽樣,由樣本入手,用樣本嘅數據去對總體嘅特性做出判斷。喺哲學上,呢個諗法基於歸納推理

生物統計學做例,設想研究者依家要研究香港某年某月流感個案嘅數量。如果佢用點估計,會類似噉:隨機抽樣後,發現平均每 1,000 人就有 50 人惹到,於是佢就直接估算全市有 5% 人感冒。而如果佢用區間估計,就比較似係噉:估計染病人數比例係 2% 至 8% 之間[註 1]

偏差

[編輯]

簡化講,如果某估計量嘅期望值 E 唔等於佢想估計嗰個真實參數值,呢個估計量就謂之「有偏差[註 2]

用數學式嚟表達,設 係參數 θ 嘅估計量:

  • 若果 ,佢就算係無偏差。
  • 若果 ,佢就算係有偏差。

而偏差程度則可以想像成[2]

當中 P(x|θ) 為有 θ 嘅模型,產生觀察值 x 嘅概率分佈

充分

[編輯]

若果話某統計量充分嘅,意思即係話知道咗個統計量嘅值係幾多,就唔再需要樣本中啲個別數值,都可以對未知嘅參數做估計。

搵嘅方法

[編輯]

最大似然

[編輯]

最大似然估計(MLE )可以用嚟做點估計。呢種做法嘅核心直覺係:分析者要搵出一個估計值,令到得到手上嘅數據嘅機率最大化。

最大似然估計嘅邏輯,係以下呢幾個步驟:[3]

  • 首先研究者梗要對數據背後嘅來源做出某啲假設,譬如假設呢啲數據跟從常態分佈或者伯努利分佈等。如果呢個假設係有問題嘅,後面計出嚟嘅估計值都唔會準。設手上嘅數據為
  • 寫出似然函數,假設啲數據個案係獨立同分佈(iid),成組數據出現嘅總機率,係每一個個案出現嘅機率就噉乘埋一齊,作:
    ,當中 θ 係想估計嗰個參數,而 Π 則係連乘符號
  • 喺數學上,要計算某函數嘅最大值,可以用偏導數嘅概念。
  • 簡單講,重點要係搵出 θ 喺邊個值,會令到似然函數嘅偏導數變成 0。至於點解,詳情可以睇微積分嘅概念。

動差估計

[編輯]

動差估計呢種做法,被指係喺運算上較有效率。

應用例子

[編輯]

頻率學派推論除咗會做假說檢定之外,亦成日會使用點估計同區間估計嘅做法。

譬如,假想依家要估計某中學嘅學生嘅平均體重[4]。由於學生人數眾多,研究者冇可能量度晒所有人嘅體重,於是佢哋就要用統計方法做點估計,首先,假設全體學生嘅體重,服從常態分佈。即係

,其中:
  • 總體嘅平均體重,屬未知參數。
  • 係總體體重嘅方差,都係未知參數。

目標係要用樣本計出嚟嘅值,搵出呢兩個未知參數嘅點估計值係幾多。假想依家喺校園做隨機抽樣,搵咗 5 位同學返嚟,量度佢哋嘅體重,計量單位係公斤

攞住呢個樣本,若果研究者用最大似然估計嚟做推論。代返啲式嘅話,總體平均值嘅點估計,會係樣本平均值,即係 63 公斤。

相關假設

[編輯]

睇埋

[編輯]

註釋

[編輯]
  1. 呢個係簡化咗嘅例子。喺實際應用上,區間估計嗰啲區間要點計,可以幾複雜。詳情可以睇下信心區間等嘅概念。
  2. 英文biased

引咗

[編輯]
  1. Estimation and Inferential Statistics (English). Pradip Kumar Sahu, Santi Ranjan Pal, Ajit Kumar Das. 2015.{{cite book}}: CS1 maint: unrecognized language (link)
  2. Kozdron, Michael (March 2016). "Evaluating the Goodness of an Estimator: Bias, Mean-Square Error, Relative Efficiency (Chapter 3)" (PDF). stat.math.uregina.ca. 喺2020-09-11搵到.
  3. Categorical Data Analysis. John Wiley and Sons, New York: Agresti A. 1990.
  4. 呢度個例子,係以呢頁個 Example 1-2 為基礎嘅:1.2 - Maximum Likelihood Estimation

文獻

[編輯]

  • Bickel, Peter J. & Doksum, Kjell A. (2001). Mathematical Statistics: Basic and Selected Topics.第I卷 (第Second (updated printing 2007)版). Pearson Prentice-Hall.
  • Liese, Friedrich & Miescke, Klaus-J. (2008). Statistical Decision Theory: Estimation, Testing, and Selection. Springer.
  • Statistical Theory, Chapter 2 - Point Estimation

資源

[編輯]