大型語言模型

出自維基百科，自由嘅百科全書

大型語言模型（英文：large language model，LLM）係大嘅語言模型。

語言資源對於教人工智能處理語言嚟講係不可或缺嘅。噉係因為教電腦處理一隻語言，通常都係要畀電腦讀取一大堆用嗰隻語言寫出嚟嘅文字。例如要整 ChatGPT，設計者就用咗閒閒哋幾億字咁多嘅英文文字。

睇埋[編輯]

語言資源

自然語言處理（NLP）

教 AI 處理自然語言嘅技術

語言數據

語言資源
語料庫（口語語料庫 · Treebank · PropBank（英文：PropBank））
詞庫資源
機械可讀字典
受控詞表
索引典

字句層次

文字分割	字切割句子切割記號化詞法分析淺度解析同分析樹
N-gram（2-gram · 3-gram）詞形還原字幹提取命名實體識別合成詞處理語言辨認停用詞詞性標注字袋模型搭配詞抽取 Regex 解析 Tf-idf Truecasing

語義層次

詞義消歧同詞義歸納語義角色標籤指代解決情感分析自然語言理解本體學習自動總結（句子提取 · 文字簡化 · 多文件總結）主題模型（文檔分類）概念探勘文本蘊涵
分佈語義	語義距離文件詞彙矩陣外顯同潛在語義分析字嵌入 Word2vec

第啲應用

相關技術

相關領域

呢篇同AI相關嘅文係楔位文。歡迎幫維基百科擴寫佢。

由「https://zh-yue.wikipedia.org/w/index.php?title=大型語言模型&oldid=2066582」收

屬於1隱類：

有英文嘅文章