跳去內容
主目錄
主目錄
移去側欄
收埋
導覽
頭版
目錄
正嘢
時人時事
是但一版
關於維基百科
聯絡處
交流
說明書
城市論壇
社區大堂
最近修改
查嘢
搵嘢
閱讀設定
捐畀維基百科
開戶口
簽到
個人架生
捐畀維基百科
開戶口
簽到
未簽到編者用嘅版面
知多啲
貢獻
同呢個互聯網地址嘅匿名人傾偈
目錄
移去側欄
收埋
文頭
1
睇埋
2
引咗
開/收內容一覽
詞幹提取
21種語言
العربية
Català
Čeština
Deutsch
English
Español
Euskara
Suomi
Français
Հայերեն
Bahasa Indonesia
Italiano
한국어
ଓଡ଼ିଆ
Polski
Português
Русский
Slovenščina
Svenska
Українська
中文
改拎
文章
討論
粵語
閱
改
睇返紀錄
架撐
架撐
移去側欄
收埋
動作
閱
改
睇返紀錄
基本
有乜連過嚟
連結頁嘅更改
上載檔案
專門版
固定連結
此版明細
引用呢篇文
攞短網址
下載QR code
打印/匯出
下載PDF
印得嘅版本
第啲維基項目
維基數據項
閱讀設定
移去側欄
收埋
出自維基百科,自由嘅百科全書
(由
字幹提取
跳轉過嚟)
詞幹提取
(
英文
:
stemming
)係
自然語言處理
上嘅一樣工作,指
[
1
]
攞一隻經過
詞形變化
嘅
字詞
做
input
;
俾出「隻字詞嘅
詞幹
」做
output
;
嘅
演算法
。
睇埋
[
編輯
]
構詞學
資訊提取
資訊抽取
引咗
[
編輯
]
↑
Frakes, W. B. (1992);
Stemming algorithms, Information retrieval: data structures and algorithms
, Upper Saddle River, NJ: Prentice-Hall, Inc.
睇
傾
改
自然語言處理
(NLP)
教
AI
處理
自然語言
嘅技術
語言
數據
語言資源
語料庫
(
口語語料庫
·
Treebank
·
PropBank
(
英文
:
PropBank
)
)
詞庫資源
機械可讀字典
受控詞表
索引典
語言模型
(
大型語言模型
)
語義網絡
(
WordNet
·
BabelNet
·
語義相似度網絡
)
對等字詞
普世依賴項
字
句
層次
文字分割
字切割
句子切割
記號化
詞法分析
淺度解析
同
分析樹
N-gram
(
2-gram
·
3-gram
)
詞形還原
同
詞幹提取
命名實體識別
合成詞處理
語言辨認
停用詞
詞性標注
字袋模型
搭配詞抽取
Regex
解析
Tf-idf
Truecasing
語義
層次
詞義消歧
同
詞義歸納
語義角色標籤
指代解決
情感分析
自然語言理解
本體學習
自動總結
(
句子提取
·
文字簡化
·
多文件總結
)
主題模型
(
文檔分類
)
概念探勘
文本蘊涵
分佈語義
語義距離
文件詞彙矩陣
外顯
同
潛在
語義分析
字嵌入
Word2vec
機械翻譯
翻譯器
例子為本
、
規則為本
同
統計
轉移為本
神經為本
用家介面
聲用家介面
傾偈機械人
問答系統
虛擬助理
互動式小說
第啲應用
資訊
提取
同
抽取
(
詞彙抽取
)
電腦輔助評閱
(
拼寫檢查
·
文法檢查
·
自動評分
)
反垃圾電郵技術
網頁刮料
自動資料收集
(語音
識別
同
分割
·
光學字符識別
)
語音合成
自然語言生成
文本探勘
同
遙距閱讀
提示工程
相關技術
自然語言工具箱
spaCy
DBpedia
ROUGE
語義網
機械學習
同
AI 完全
字串搜尋
困惑度
ChatGPT
速記
相關領域
語言學
(
語料庫語言學
同
運算語言學
)
圖書館學
同
資訊科學
數碼人文學
文獻計量學
市場學
心理測量學
NLP 類
呢篇同
語言學
有關嘅文係
楔
位文。歡迎幫維基百科
擴寫佢
。
睇
•
論
•
改
•
歷
屬於3類
:
語言學楔類
資訊
自然語言處理
屬於1隱類:
有英文嘅文章