點估計

點估計會類似噉:估計目標變數嘅預期值,係 0。
區間估計會類似噉:估計目標變數嘅數值,係喺 -a 同 a 之間。
點估計(參見英文:point estimation )係統計學上嘅重要概念,講緊要用樣本嘅數據嚟計出參數嘅值,作為估計嘅數值,相對於區間估計:區間估計係指做估計嗰陣,估計目標數值喺某個區間之中。圖像化噉想像:如果畫做圖嘅話,個估計值會係軸上面嘅一點,而區間估計則會係一個區域,包括若干個數值[1]。
基本諗頭
[編輯]統計學嘅一個重點,係在於要透過局部去推斷全部:喺科學上,研究者通常都無法攞晒成個總體嘅所有個案嘅數據,所以就焗住要做抽樣,由樣本入手,用樣本嘅數據去對總體嘅特性做出判斷。喺哲學上,呢個諗法基於歸納推理。
用生物統計學做例,設想研究者依家要研究香港某年某月流感個案嘅數量。如果佢用點估計,會類似噉:隨機抽樣後,發現平均每 1,000 人就有 50 人惹到,於是佢就直接估算全市有 5% 人感冒。而如果佢用區間估計,就比較似係噉:估計染病人數比例係 2% 至 8% 之間[註 1]。
偏差
[編輯]簡化講,如果某估計量嘅期望值 E 唔等於佢想估計嗰個真實參數值,呢個估計量就謂之「有偏差」[註 2]。
用數學式嚟表達,設 係參數 θ 嘅估計量:
- 若果 ,佢就算係無偏差。
- 若果 ,佢就算係有偏差。
而偏差程度則可以想像成[2]:
當中 P(x|θ) 為有 θ 嘅模型,產生觀察值 x 嘅概率分佈。
充分
[編輯]若果話某統計量係充分嘅,意思即係話知道咗個統計量嘅值係幾多,就唔再需要樣本中啲個別數值,都可以對未知嘅參數做估計。
搵嘅方法
[編輯]最大似然
[編輯]最大似然估計(MLE )可以用嚟做點估計。呢種做法嘅核心直覺係:分析者要搵出一個估計值,令到得到手上嘅數據嘅機率最大化。
最大似然估計嘅邏輯,係以下呢幾個步驟:[3]
動差估計
[編輯]呢節要加長。 |
動差估計呢種做法,被指係喺運算上較有效率。
應用例子
[編輯]頻率學派推論除咗會做假說檢定之外,亦成日會使用點估計同區間估計嘅做法。
譬如,假想依家要估計某中學嘅學生嘅平均體重[4]。由於學生人數眾多,研究者冇可能量度晒所有人嘅體重,於是佢哋就要用統計方法做點估計,首先,假設全體學生嘅體重,服從常態分佈。即係
- ,其中:
目標係要用樣本計出嚟嘅值,搵出呢兩個未知參數嘅點估計值係幾多。假想依家喺校園做隨機抽樣,搵咗 5 位同學返嚟,量度佢哋嘅體重,計量單位係公斤:
相關假設
[編輯]睇埋
[編輯]註釋
[編輯]引咗
[編輯]- ↑ Estimation and Inferential Statistics (English). Pradip Kumar Sahu, Santi Ranjan Pal, Ajit Kumar Das. 2015.
{{cite book}}: CS1 maint: unrecognized language (link) - ↑ Kozdron, Michael (March 2016). "Evaluating the Goodness of an Estimator: Bias, Mean-Square Error, Relative Efficiency (Chapter 3)" (PDF). stat.math.uregina.ca. 喺2020-09-11搵到.
- ↑ Categorical Data Analysis. John Wiley and Sons, New York: Agresti A. 1990.
- ↑ 呢度個例子,係以呢頁個 Example 1-2 為基礎嘅:1.2 - Maximum Likelihood Estimation
文獻
[編輯]- Bickel, Peter J. & Doksum, Kjell A. (2001). Mathematical Statistics: Basic and Selected Topics.第I卷 (第Second (updated printing 2007)版). Pearson Prentice-Hall.
- Liese, Friedrich & Miescke, Klaus-J. (2008). Statistical Decision Theory: Estimation, Testing, and Selection. Springer.
- Statistical Theory, Chapter 2 - Point Estimation
資源
[編輯]- (英文)第一堂:點估計,PennState