跳去內容
主目錄
主目錄
移去側欄
收埋
導覽
頭版
目錄
正嘢
時人時事
是但一版
關於維基百科
聯絡處
交流
說明書
城市論壇
社區大堂
最近修改
查嘢
搵嘢
捐畀維基百科
閱讀設定
開戶口
簽到
個人架生
開戶口
簽到
未簽到編者用嘅版面
知多啲
貢獻
同呢個互聯網地址嘅匿名人傾偈
目錄
移去側欄
收埋
文頭
1
睇埋
2
外拎
開/收內容一覽
資訊提取
39種語言
العربية
Azərbaycanca
Български
Català
Čeština
Dansk
Deutsch
Ελληνικά
English
Esperanto
Español
Euskara
فارسی
Suomi
Français
Gaeilge
Galego
हिन्दी
Bahasa Indonesia
Italiano
日本語
한국어
Монгол
Bahasa Melayu
Nederlands
Norsk nynorsk
Norsk bokmål
Polski
Português
Русский
Simple English
Српски / srpski
Svenska
தமிழ்
Тоҷикӣ
Türkçe
Українська
Tiếng Việt
中文
改拎
文章
討論
粵語
閱
改
睇返紀錄
架撐
架撐
移去側欄
收埋
動作
閱
改
睇返紀錄
基本
有乜連過嚟
連結頁嘅更改
上載檔案
專門版
固定連結
此版明細
引用呢篇文
攞短網址
下載QR code
維基數據項
打印/匯出
下載PDF
印得嘅版本
第啲維基項目
維基同享
閱讀設定
移去側欄
收埋
出自維基百科,自由嘅百科全書
提示:
呢篇文講嘅唔係
資訊抽取
。
資訊提取
(
英文
:
information retrieval,IR
)係指「由一個
資訊系統
度攞自己需要用嘅資源嚟用」嘅過程。
例子有用
搜尋器
打
關鍵字
,摷自己想要嘅文件。
睇埋
[
編輯
]
資訊系統
合成詞處理
搜尋器
外拎
[
編輯
]
(英文)
一本講資訊提取嘅教科書
睇
傾
改
自然語言處理
(NLP)
教
AI
處理
自然語言
嘅技術
語言
數據
語言資源
語料庫
(
口語語料庫
·
Treebank
·
PropBank
(
英文
:
PropBank
)
)
詞庫資源
機械可讀字典
受控詞表
索引典
語言模型
(
大型語言模型
)
語義網絡
(
WordNet
·
BabelNet
·
語義相似度網絡
)
對等字詞
普世依賴項
字
句
層次
文字分割
字切割
句子切割
記號化
詞法分析
淺度解析
同
分析樹
N-gram
(
2-gram
·
3-gram
)
詞形還原
同
詞幹提取
命名實體識別
合成詞處理
語言辨認
停用詞
詞性標注
字袋模型
搭配詞抽取
Regex
解析
Tf-idf
Truecasing
語義
層次
詞義消歧
同
詞義歸納
語義角色標籤
指代解決
情感分析
自然語言理解
本體學習
自動總結
(
句子提取
·
文字簡化
·
多文件總結
)
主題模型
(
文檔分類
)
概念探勘
文本蘊涵
分佈語義
語義距離
文件詞彙矩陣
外顯
同
潛在
語義分析
字嵌入
Word2vec
機械翻譯
翻譯器
例子為本
、
規則為本
同
統計
轉移為本
神經為本
用家介面
聲用家介面
傾偈機械人
問答系統
虛擬助理
互動式小說
第啲應用
資訊
提取
同
抽取
(
詞彙抽取
)
電腦輔助評閱
(
拼寫檢查
·
文法檢查
·
自動評分
)
反垃圾電郵技術
網頁刮料
自動資料收集
(語音
識別
同
分割
·
光學字符識別
)
語音合成
自然語言生成
文本探勘
同
遙距閱讀
提示工程
相關技術
自然語言工具箱
spaCy
DBpedia
ROUGE
語義網
機械學習
同
AI 完全
字串搜尋
困惑度
ChatGPT
速記
相關領域
語言學
(
語料庫語言學
同
運算語言學
)
圖書館學
同
資訊科學
數碼人文學
文獻計量學
市場學
心理測量學
NLP 類
資訊提取
係
電算
楔位文
,你可以
編輯佢
充實內容。
屬於2類
:
電算楔類
資訊科學
屬於1隱類:
有英文嘅文章