微調 (深度學習)
閱讀設定
深度學習上講嘅微調(英文:Fine-tuning)係指緊對預先訓練好嘅模型做進一步嘅訓練,適應新任務嘅需求。
舉例說明,想像而家訓練大型語言模型處理粵文。唔同種類嘅語言會有唔同嘅表達特色:好似用粵文寫科學文章,同寫新聞報導比較,就會發現科學文章會特別多用某啲詞,譬如科學方法、實驗、證據之類。如果有個大語言模型已經學識咗點樣估計「下一個字詞會係咩」,但係佢嘅訓練資料乜都有——有科普、有新聞、有笑話故事等等,噉佢嘅預測能力就未必夠專門化。喺呢種情況之下,用家可能想做微調:一個簡單嘅方法就係搵返啲粵文科學文章(好似粵文維基百科噉)嚟做新一輪訓練,等模型嘅參數可以略為調整[註 1]。
睇埋
[編輯]註釋
[編輯]- ↑ 因為大語言模型有好多參數,要更新晒會好花時間,所以用家通常會「鎖定」部分參數,淨係畀「冇鎖」嘅參數喺微調過程入面改變。