統計自由度
自由度(粵拼:zi6 jau4 dou6;英文:degree of freedom,)係統計上嘅一個概念,籠統啲講可以想像成「手上啲數據嘅值有幾咁自由」 ,而稍為精確啲噉講即係指
幾多。自由度呢個值幾重要,可以話到畀分析者知,場分析有幾能夠真正噉搵出實質存在嘅效應,所以啲人做親進階嘅統計分析,往往都會留意場分析嘅自由度有幾高。
基本概念
[編輯]要計自由度,可以用以下呢條式[1]:p 60:
用例子說明,想像而家手上有個樣本,樣本入邊有 3 隻貓,已知佢哋嘅平均體重係 5 公斤咁多,噉
- 如果貓 A 嘅體重係 4.0 公斤,而貓 B 嘅體重係 6.0 公斤,噉貓 C 嘅體重一定會係 5.0 公斤—可以自由變化嘅數值得 2 個;
- 如果貓 A 嘅體重係 4.5 公斤,而貓 B 嘅體重係 7.0 公斤,噉貓 C 嘅體重一定會係 3.5 公斤—可以自由變化嘅數值得 2 個;
... 如此類推。噉想像而家樣本有 50 隻貓,研究者想計呢 50 隻貓嘅平均體重,假設呢 50 隻貓嘅體重係彼此之間獨立[註 1]嘅,要估計統計量有 1 個(平均值),自由度就係
亦即係話統計自由度可以想像成「有幾多個數值可以自由噉變化」[1]。
進階啲嘅統計測試嘅自由度,可以用同樣方法嚟想像。例如想像家陣要做線性迴歸分析,個迴歸模型有 咁多個自變數,而樣本大細係 ,統計自由度就係
當中 要減 而唔係 ,噉係因為個迴歸模型嘅截距都係一個要估計嘅參數。
點解重要
[編輯]喺廿一世紀初嘅應用當中,自由度係一個相當重要嘅數值。啲人喺社科同醫學上成日會做統計分析,要解答例如—
... 等嘅研究問題,基本上都實會睇睇場統計分析嘅自由度有幾高。如果一場分析嘅自由度低,就表示手上嘅資訊量(相對於想要估計嘅參數嘅數量)比較少,而呢點就表示分析者對於「呢場測試係咪真係能夠探測到實質存在嘅效果」(統計功效)存疑。簡化噉講嘅話,如果一場統計分析自由度高,就表示分析者手上有好多多餘嘅資訊,噉例如估計迴歸模型嗰啲參數嗰陣,就有多啲唔同個案嘅值可以攞嚟代入條式嗰度,有得代多幾次嚟驗證吓個模型係咪真係做到準確嘅預測。
統計自由度嘅計法就噉睇好似好簡單。喺好似計平均值或者迴歸分析呢啲簡單基本嘅分析當中,自由度睇一兩個數值就計得到出嚟,但喺進階啲嘅統計模型—例如結構方程式模型—入邊,一個統計模型可能閒閒哋有成幾十個參數[註 2],可能會要求個樣本坐底有 200 個個體先至算係有充足嘅自由度[2]。
睇睇
[編輯]註釋
[編輯]引述
[編輯]拎
[編輯]- (英文) 統計自由度解釋咗:方程式同例子,投資百科
- (英文) 統計學講嘅自由度,Statistics by Jims.