信度

信度（粵拼：seon3 dou6；英文：reliability）喺統計學上係評估一個量度方法有幾好嘅指標，指對一個現象用嗰個方法進行重複觀察之後，係咪可以得到相同嘅數值。

指標

正路嚟講，如果一個量度方法係可信嘅，噉無論何時何地何人用嗰個方法量度同一樣嘢，都理應會得到相同嘅數值^[1]^[2]。常用嘅信度指標有以下呢啲：

評分者間信度：用嚟評估一個量度有幾受做量度嘅人影響；例如有一個俾教育家用嚟評估細路學習進度嘅方法，但做完研究發現，五位教育家分別噉用同一個方法評估同一班細路，五個得到完全唔同嘅數值，噉呢個量度方法嘅評分者間信度就低^[3]。
重測試信度：用嚟評估一個量度方法有幾受時間影響；例如有一個俾心理學家用嚟量度智商嘅測驗，做研究，搵班受試者返嚟做個測驗，得到一柞分數 ${\text{test}}_{t1}$ ，然後過咗一個月之後，搵返班受試者返嚟又做過，得到另一柞分數 ${\text{test}}_{t2}$ ；一般認為智商冇乜可能會喺一個月之內改變嘅，如果 ${\text{test}}_{t1}$ 同 ${\text{test}}_{t2}$ 差異好大，就表示呢個測驗嘅重測試信度低。
內部一致度：指一個有多條題目嘅量度方法有幾「係量度緊同一樣嘢」；例如有一個智商測驗，有 50 條題目，理論上，呢啲題目冚唪唥都係量度緊智商，所以彼此之間理應喺得分上有返咁上下正相關，但研究發現，嗰 50 條題目當中有 5 條零舍係同其餘嗰啲題目有負相關，噉心理學家就好可能會要求攞走嗰 5 條題目（佢哋似乎唔係量度緊智商，所以唔應該擺喺一個智商測驗入面），變成一個 45 條題目嘅測驗。睇返卡隆巴系數。

... 等等。

↑ Carmines, E. G., & Zeller, R. A. (1979). Reliability and validity assessment (Vol. 17). Sage publications.
↑ American Educational Research Association, Psychological Association, & National Council on Measurement in Education. (1999). Standards for Educational and Psychological Testing. Washington, DC: American Educational Research Association.
↑ McHugh, M. L. (2012). Interrater reliability: the kappa statistic. Biochemia medica: Biochemia medica, 22(3), 276-282.

呢篇統計學文係楔位文。歡迎幫維基百科擴寫佢。