跳去內容

統計自由度

出自維基百科,自由嘅百科全書
  提示:呢篇文講嘅唔係力學自由度
迴歸分析:而家要估計一條直線,用嚟模擬例如智商社經地位之間嘅關係,噉就實要有方法估計條直線嗰條式嗰啲參數嘅值。

自由度粵拼zi6 jau4 dou6英文degree of freedom)係統計上嘅一個概念,籠統啲講可以想像成「手上啲數據嘅值有幾咁自由」 ,而稍為精確啲噉講即係指

幾多。自由度呢個值幾重要,可以話到畀分析者知,場分析有幾能夠真正噉搵出實質存在嘅效應,所以啲人做親進階嘅統計分析,往往都會留意場分析嘅自由度有幾高。

基本概念

[編輯]

要計自由度,可以用以下呢條式[1]:p 60

獨立數值嘅數量 要估計幾多個統計量

用例子說明,想像而家手上有個樣本,樣本入邊有 3 隻,已知佢哋嘅平均體重係 5 公斤咁多,噉

  • 如果貓 A 嘅體重係 4.0 公斤,而貓 B 嘅體重係 6.0 公斤,噉貓 C 嘅體重一定會係 5.0 公斤—可以自由變化嘅數值得 2 個;
  • 如果貓 A 嘅體重係 4.5 公斤,而貓 B 嘅體重係 7.0 公斤,噉貓 C 嘅體重一定會係 3.5 公斤—可以自由變化嘅數值得 2 個;

... 如此類推。噉想像而家樣本有 50 隻貓,研究者想計呢 50 隻貓嘅平均體重,假設呢 50 隻貓嘅體重係彼此之間獨立[註 1]嘅,要估計統計量有 1 個(平均值),自由度就係

亦即係話統計自由度可以想像成「有幾多個數值可以自由噉變化」[1]

進階啲嘅統計測試嘅自由度,可以用同樣方法嚟想像。例如想像家陣要做線性迴歸分析,個迴歸模型 咁多個自變數,而樣本大細係 ,統計自由度就係

當中 要減 而唔係 ,噉係因為個迴歸模型嘅截距都係一個要估計嘅參數

點解重要

[編輯]
睇埋:統計功效

喺廿一世紀初嘅應用當中,自由度係一個相當重要嘅數值。啲人喺社科醫學上成日會做統計分析,要解答例如—

... 等嘅研究問題,基本上都實會睇睇場統計分析嘅自由度有幾高。如果一場分析嘅自由度低,就表示手上嘅資訊量(相對於想要估計嘅參數嘅數量)比較少,而呢點就表示分析者對於「呢場測試係咪真係能夠探測到實質存在嘅效果」(統計功效)存疑。簡化噉講嘅話,如果一場統計分析自由度高,就表示分析者手上有好多多餘嘅資訊,噉例如估計迴歸模型嗰啲參數嗰陣,就有多啲唔同個案嘅值可以攞嚟代入條式嗰度,有得代多幾次嚟驗證吓個模型係咪真係做到準確嘅預測。

統計自由度嘅計法就噉睇好似好簡單。喺好似計平均值或者迴歸分析呢啲簡單基本嘅分析當中,自由度睇一兩個數值就計得到出嚟,但喺進階啲嘅統計模型—例如結構方程式模型—入邊,一個統計模型可能閒閒哋有成幾十個參數[註 2],可能會要求個樣本坐底有 200 個個體先至算係有充足嘅自由度[2]

睇睇

[編輯]

註釋

[編輯]
  1. 概率論有更詳細噉講概率獨立呢個概念。
  2. 一個模型多參數表示佢比較複雜,而噉可以表示佢提供得到更多嘅資訊,預測到更多嘢。

引述

[編輯]
  1. 1.0 1.1 Urdan, T. C. (2016). Statistics in plain English. Routledge.
  2. Julious, S. A. (2005). Sample size of 12 per group rule of thumb for a pilot study. Pharmaceutical Statistics: The Journal of Applied Statistics in the Pharmaceutical Industry, 4(4), 287-291.

[編輯]