降維
閱讀設定
降維(粵拼:gong3 wai4 | 英文:dimension reduction)喺統計學同機械學習上係指「減少手上考慮嘅隨機變數嘅數量」嘅過程。常見嘅降維方法有主成份分析同埋因素分析呀噉。
基本諗頭
[編輯]降維係指減低手上拃 data(dei1 taa4)入面隨機變數嘅數量,簡單例子可以想像而家要分析 1,000 隻蝴蝶,手上嘅 data 描述
- 蝴蝶 0001 翼係咩形狀、色水係點、有乜花紋...
- 蝴蝶 0002 翼係咩形狀、色水係點、有乜花紋...
- 蝴蝶 0003 翼係咩形狀、色水係點、有乜花紋...
要做降維嘅話,就可能係按呢啲 data 將啲蝴蝶分做唔同嘅物種,噉就變成
- 蝴蝶 0001 屬於物種 A / 蝴蝶 0002 屬於物種 B / 蝴蝶 0003 屬於物種 C...
—令到啲 data 嘅維度下降咗,用日常用語講即係令啲 data 易睇咗。做研究嗰陣,降維好多時都能夠令到啲 data 更易處理。
主成份分析
[編輯]内文:主成份分析
主成份分析(PCA)係一種常用嚟判斷「邊個變數重要啲」嘅統計分析方法。
線性判別
[編輯]内文:線性判別分析
因素分析
[編輯]内文:因素分析
因素分析(FA)將大量嘅變數轉化做少量因素,當中「因素」通常係一啲數值冇得直接量度嘅嘢,所以就要由量度到嗰啲變數嚟「反映」佢哋。例如智商測驗(講緊正式心理學上會用嗰啲)就係因素分析嘅一個應用例子:智商測驗旨在量度智能,但係智能(因素)呢家嘢冇得話攞把尺去量度,一個個體嘅智能值只可以靠住由測驗題目攞到嘅分數(量度得到嘅變數)嚟反映[1]。
睇埋
[編輯]引咗
[編輯]- ↑ Child, Dennis (2006), The Essentials of Factor Analysis (3rd ed.), Continuum International.
連結
[編輯]- (英文) 乜嘢係降維?,IBM