輪廓系數
閱讀設定
呢篇文 需要熟悉呢方面嘅人幫手寫。 |
輪廓系數(英文:Silhouette coefficient,)係聚類分析上成日用嘅一種指標。
想像以下嘅思路[1]:p. 3-4:
- 設 做拃數據入面嘅一個個案,而 係 所屬嗰個聚類;
- 指 大致同 入面啲個案有幾唔似(距離幾遠);
- 指 大致同 以外嘅物件有幾唔似(距離幾遠),
- 計
如果 淨係得 一個個案,噉 ;每個個案 數值都會喺 -1 同 1 之間(),跟住就可以考慮咁多個個案嘅平均 ,而呢個平均 值係愈接近 1 愈好。
攷
[編輯]- ↑ Rousseeuw, P. J. (1987). Silhouettes: a graphical aid to the interpretation and validation of cluster analysis. Journal of computational and applied mathematics, 20, 53-65.