輪廓系數

出自維基百科,自由嘅百科全書

輪廓系數英文Silhouette coefficient)係聚類分析上成日用嘅一種指標。

想像以下嘅思路[1]:p. 3-4

  • 做拃數據入面嘅一個個案,而 所屬嗰個聚類;
  • 大致同 入面啲個案有幾似(距離幾遠);
  • 大致同 以外嘅物件有幾似(距離幾遠),

如果 淨係得 一個個案,噉 ;每個個案 數值都會喺 -1 同 1 之間(),跟住就可以考慮咁多個個案嘅平均 ,而呢個平均 值係愈接近 1 愈好。

[編輯]

  1. Rousseeuw, P. J. (1987). Silhouettes: a graphical aid to the interpretation and validation of cluster analysis. Journal of computational and applied mathematics, 20, 53-65.