字幹提取
出自維基百科,自由嘅百科全書
跳去導覽
跳去搵嘢
字幹提取
(
英文
:
stemming
)係
自然語言處理
上嘅一樣工作,指
[1]
攞一隻經過
詞形變化
嘅
字
做
input
;
俾出「隻字嘅
字幹
」做
output
;
嘅
演算法
。
睇埋
[
編輯
]
資訊提取
資訊抽取
攷
[
編輯
]
↑
Frakes, W. B. (1992);
Stemming algorithms, Information retrieval: data structures and algorithms
, Upper Saddle River, NJ: Prentice-Hall, Inc.
睇
傾
改
自然語言處理
(NLP)
教
AI
處理
自然語言
嘅技術
語言
數據
語料庫
(
口語語料庫
·
Treebank
·
PropBank
(
英文
:
PropBank
)
)
詞庫資源
機械可讀字典
受控詞表
索引典
語言模型
語義網絡
(
WordNet
·
BabelNet
·
語義相似性網絡
)
對等字詞
Universal Dependencies
(
英文
:
Universal Dependencies
)
字
句
層次
文字分割
字切割
句子切割
記號化
詞法分析
淺度解析
同
分析樹
N-gram
(
2-gram
·
3-gram
)
詞形還原
字幹提取
命名實體識別
合成詞處理
語言辨認
停用詞
詞性標注
字袋模型
搭配詞抽取
Regex
解析
Tf-idf
Truecasing
語義
層次
詞義消歧
同
詞義歸納
語義角色標籤
指代解決
情感分析
自然語言理解
本體學習
自動總結
(
句子提取
·
文字簡化
·
多文件總結
)
主題模型
(
文檔分類
)
概念探勘
文本蘊涵
分佈語義
語義距離
文件詞彙矩陣
外顯
同
潛在
語義分析
字嵌入
Word2vec
機械翻譯
翻譯器
例子為本
、
規則為本
同
統計
轉移為本
神經為本
用家介面
聲用家介面
傾偈機械人
問答系統
虛擬助理
互動式小說
第啲應用
資訊
提取
同
抽取
(
詞彙抽取
)
電腦輔助評閱
(
拼寫檢查
·
文法檢查
·
自動評分
)
反垃圾電郵技術
網頁刮料
自動資料收集
(語音
識別
同
分割
·
光學字符識別
)
語音合成
自然語言生成
文本探勘
同
遙距閱讀
相關技術
NLTK
spaCy
DBpedia
ROUGE
語義網
機械學習
同
人工智能完全
字串搜尋演算法
困惑度
ChatGPT
相關領域
語言學
(
語料庫語言學
同
運算語言學
)
圖書館學
同
資訊科學
數碼人文學
文獻計量學
市場學
心理測量學
呢篇同
語言學
有關嘅文章係
楔
位文。歡迎幫維基百科
擴寫佢
。
睇
•
論
•
改
•
歷
屬於3類
:
語言學楔類
資訊
自然語言處理
屬於1隱類:
有英文嘅文章
導覽選單
個人架生
未簽到
同呢個互聯網地址嘅匿名人傾偈
貢獻
開戶口
簽到
空間名
文章
討論
粵語
外觀
閱
改
睇返紀錄
多啲
導覽
頭版
目錄
正嘢
時人時事
是但一版
關於維基百科
聯絡處
捐畀維基百科
交流
說明書
城市論壇
社區大堂
最近修改
架撐
有乜連過嚟
連結頁嘅更改
上載檔案
專門版
固定連結
此版明細
引用呢篇文
維基數據項
打印/匯出
下載PDF
印得嘅版本
第啲話
العربية
Català
Čeština
Deutsch
English
Español
Euskara
Suomi
Français
Հայերեն
Bahasa Indonesia
Italiano
한국어
ଓଡ଼ିଆ
Polski
Português
Русский
Slovenščina
Svenska
Українська
中文
改拎