跳去內容

問答系統

出自維基百科,自由嘅百科全書

問答系統英文Question answering,QA)係廿一世紀初電腦科學上嘅一種技術進展,結合資訊提取自然語言處理,目的係教電腦

概覽

[編輯]

問答系統(通常係電腦程式)可以透過查詢結構化嘅數據庫(通常係知識庫)嚟構建答案。更常見嘅情況係,問答系統會從非結構化嘅自然語言文件庫中抽取答案。

用於問答系統嘅自然語言文件庫例子包括:

問答系統類型

[編輯]

問答研究旨在開發處理多種問題類型嘅方法,包括事實、清單、定義、方法、原因、假設、語義限制同跨語言問題。

  • **閱讀理解相關問題**:要求系統基於指定文章回答問題,算係較簡單嘅形式,因為文章通常比一般問答領域短。例如畀一篇關於愛因斯坦嘅文,問「愛因斯坦係因為乜嘢攞諾貝爾獎?」
  • **閉卷式問答**:系統靠訓練時記住嘅事實直接答題,唔需要額外上下文,類似人類考閉卷試。
  • **封閉領域問答**:專注特定領域(例如醫學、汽車維修),利用領域知識庫。有時亦指只接受特定問題類型(例如描述性而非程序性問題)。醫學領域亦有相關應用,例如Template:Vague阿茲海默症嘅研究[2]
  • **開放領域問答**:處理幾乎任何問題,依賴通用知識庫,例如直接問「愛因斯坦係因為乜嘢攞諾貝爾獎?」而唔提供背景文章。

另一種分類方式係按技術方法:

規則系統用預設規則搵答案;統計系統靠概率搵最可能答案;混合系統結合兩者。

歷史

[編輯]

早期系統包括**BASEBALL**[3]同**LUNAR**[4]。BASEBALL回答美國職棒大聯盟一年內嘅問題Template:Ambiguous;LUNAR分析阿波羅任務帶返嘅月球岩石,1971年示範時能答九成問題。呢類系統依賴專家手動建立嘅核心數據庫,語言處理技術類似早期聊天機械人ELIZA。

    • SHRDLU**(1960年代末由Terry Winograd開發)模擬積木世界嘅機械人,可查詢世界狀態。優勢在於領域極度限定,物理規則易編碼。

1970年代嘅知識庫專注狹窄領域,問答系統依賴專家整理嘅結構化數據,與現代系統最大分別在於現代多用統計處理非結構化文本。

1980年代Unix顧問(UC)同德國旅遊資訊系統LILOG等項目推動理論發展,但未超越示範階段。後續有專門系統如醫學領域嘅**EAGLi**[5]

睇埋

[編輯]
  1. 引用錯誤 無效嘅<ref>標籤;無文字提供畀叫做:2嘅參照
  2. Roser Morante, Martin Krallinger, Alfonso Valencia 同 Walter Daelemans. 針對阿茲海默症嘅生物醫學文本機器閱讀. CLEF 2012 評估實驗室及工作坊. 2012年9月17日
  3. GREEN JR, Bert F; 等 (1961)。Baseball:自動問答系統 (PDF)Western Joint IRE-AIEE-ACM 電腦會議: 219–224。
  4. Woods, William A; Kaplan, R. (1977)。自然英語分析月球岩石Linguistic Structures Processing 55: 521–569。
  5. EAGLi平台—MEDLINE問答系統candy.hesge.ch。喺2021-12-02搵到