問答系統
閱讀設定
問答系統(英文:Question answering,QA)係廿一世紀初電腦科學上嘅一種技術進展,結合資訊提取同自然語言處理,目的係教電腦
概覽
[編輯]問答系統(通常係電腦程式)可以透過查詢結構化嘅數據庫(通常係知識庫)嚟構建答案。更常見嘅情況係,問答系統會從非結構化嘅自然語言文件庫中抽取答案。
用於問答系統嘅自然語言文件庫例子包括:
問答系統類型
[編輯]問答研究旨在開發處理多種問題類型嘅方法,包括事實、清單、定義、方法、原因、假設、語義限制同跨語言問題。
- **閱讀理解相關問題**:要求系統基於指定文章回答問題,算係較簡單嘅形式,因為文章通常比一般問答領域短。例如畀一篇關於愛因斯坦嘅文,問「愛因斯坦係因為乜嘢攞諾貝爾獎?」
- **閉卷式問答**:系統靠訓練時記住嘅事實直接答題,唔需要額外上下文,類似人類考閉卷試。
- **封閉領域問答**:專注特定領域(例如醫學、汽車維修),利用領域知識庫。有時亦指只接受特定問題類型(例如描述性而非程序性問題)。醫學領域亦有相關應用,例如Template:Vague阿茲海默症嘅研究[2]。
- **開放領域問答**:處理幾乎任何問題,依賴通用知識庫,例如直接問「愛因斯坦係因為乜嘢攞諾貝爾獎?」而唔提供背景文章。
另一種分類方式係按技術方法:
規則系統用預設規則搵答案;統計系統靠概率搵最可能答案;混合系統結合兩者。
歷史
[編輯]早期系統包括**BASEBALL**[3]同**LUNAR**[4]。BASEBALL回答美國職棒大聯盟一年內嘅問題Template:Ambiguous;LUNAR分析阿波羅任務帶返嘅月球岩石,1971年示範時能答九成問題。呢類系統依賴專家手動建立嘅核心數據庫,語言處理技術類似早期聊天機械人ELIZA。
- SHRDLU**(1960年代末由Terry Winograd開發)模擬積木世界嘅機械人,可查詢世界狀態。優勢在於領域極度限定,物理規則易編碼。
1970年代嘅知識庫專注狹窄領域,問答系統依賴專家整理嘅結構化數據,與現代系統最大分別在於現代多用統計處理非結構化文本。
1980年代Unix顧問(UC)同德國旅遊資訊系統LILOG等項目推動理論發展,但未超越示範階段。後續有專門系統如醫學領域嘅**EAGLi**[5]。
睇埋
[編輯]- ↑ 引用錯誤 無效嘅
<ref>
標籤;無文字提供畀叫做:2
嘅參照 - ↑ Roser Morante, Martin Krallinger, Alfonso Valencia 同 Walter Daelemans. 針對阿茲海默症嘅生物醫學文本機器閱讀. CLEF 2012 評估實驗室及工作坊. 2012年9月17日
- ↑ GREEN JR, Bert F; 等 (1961)。〈Baseball:自動問答系統〉 (PDF)。Western Joint IRE-AIEE-ACM 電腦會議: 219–224。
- ↑ Woods, William A; Kaplan, R. (1977)。〈用自然英語分析月球岩石〉。Linguistic Structures Processing 5。5: 521–569。
- ↑ 〈EAGLi平台—MEDLINE問答系統〉。candy.hesge.ch。喺2021-12-02搵到。