刪失

出自維基百科,自由嘅百科全書
跳去導覽 跳去搵嘢

刪失粵拼saan1 sat1英文censoring)喺統計學上係指一個想量度嘅數值「淨係局部噉知佢數值」嘅情況。

概論[編輯]

睇埋:量度

想像家陣研究者研究肝癌病人生存到幾耐,佢搵咗班病人返嚟,响跟住嗰一年之間跟進佢哋嘅病情,但可能嗰隻肝癌致命性唔係咁高,有好多病人過咗一年之後都未死,而且有啲仲好返,噉即係話有一部份病人嘅死亡時間係「不詳」[1]

例如想像下圖:下圖 X 軸做時間 Y 軸病人;病人有 5 位,頭嗰 4 位响研究結束前死咗(times to failure),但最後嗰位去到研究做完(Termination)嗰陣都仲未死。

Censored Data Example.svg

數學化啲噉講,上述嘅刪失情況可以噉諗:想像 係個隨機變數,表示「距離死亡仲有幾耐」,而 係個隨機變數,表示「距離引致刪失嗰件事件(份研究結束)仲有幾耐」,研究者觀察得到嗰個時間數值 實際上係

而研究者亦都觀察到刪失指標(censoring indicator;

嘅數值一係 1 一係 0,表示「有冇刪失發生」呢樣資訊

分類[編輯]

刪失仲可以進一步分做幾種[2][3]

  • 右刪失:淨係知個數值大過某個數(例如「終結事件發生時間不明」);
  • 左刪失:淨係知個數值細過某個數。

睇埋[編輯]

[編輯]

  1. Lin, D. Y.; et al. (1997). "Estimating medical costs from incomplete follow-up data". Biometrics. 53 (2): 419-434.
  2. Darity, William A. Jr., ed. (2008). "Censoring, Left and Right". International Encyclopedia of the Social Sciences. Vol. 1 (2nd ed.). Macmillan. pp. 473-474. Retrieved 6 November 2016.
  3. Richards, S. J. (2012). "A handbook of parametric survival models for actuarial use". Scandinavian Actuarial Journal. 2012 (4): 233-257.