機械翻譯

出自維基百科,自由嘅百科全書
Jump to navigation Jump to search

機械翻譯粵拼gei1 haai6 faan1 jik6英文machine translation,簡稱「MT」),或者叫機器翻譯,有陣時會簡稱機翻,係電算語言學(computational linguistics)嘅一個子領域,專門研究點樣用電腦軟件嚟幫手翻譯一啲用自然語言寫嘅文-「自然語言」即係好似廣東話台灣話人類日常講嘢會用嘅語言[1][2][3][4]

喺最基本嘅層次,機翻會將一種語言嘅字直接換做目標語言當中相應嘅字,但係現實係,靠呢種做法通常都唔會俾到理想嘅翻譯出嚟-呢種做法得出嘅結果幾乎實要用人手執先至會靚[5]。要翻譯得流暢,部機器要識得睇嗮成句句子,甚至乎係成段嘢,了解嗮當中每一個字嘅意思,先至再決定俾啲乜嘢輸出好。舉兩句英文句子嚟說明:

句子 1:The thriller movie is disturbing.
句子 2:The noises he makes are disturbing.

喺以上呢兩句句子裏面,講緊嘢嗰個人都用咗「disturbing」呢個形容詞,但係呢個字要譯做粵文嘅話就起碼有兩個可能嘅意思:呢個字就噉睇可以譯做「令人不安」噉解,但係譯做「令人覺得佢煩」噉解又得[6],所以對於呢個字要點譯,就一定要睇嗮成句句子先可以做決定:句子 1 用「disturbing」嚟形容一套驚慄片,而句子 2 就用「disturbing」嚟形容某個人所發出嘅噪音。因為噉,喺前者嘅情況當中,「disturbing」比較有可能係指「令人不安」,而喺後者嘅情況入面,「disturbing」就比較可能係指緊「令人覺得佢煩」。由上面呢個例子睇得出,一個字嘅意思可能會因為成句句子或者成段嘢當中嘅其他字而有所不同。一個完善嘅機翻程式一定要識處理呢個問題,而呢個過程通常要用到統計同埋人工神經網絡等嘅技巧[1]

有陣時人類又可以幫手改善機翻軟件嘅輸出嘅質素。例如係有啲系統就會俾個用家負責指明要翻嗰段文入面邊啲字係屬於名,等部電腦識得邊啲字唔好直譯(例如「New York」要譯做粵文就唔應該譯做「新約克」)。有咗呢啲技術,機翻成功噉俾人類廣泛噉用嚟幫手做翻譯,而喺某啲情況裏面,機翻俾出嚟嘅輸出仲可以直接-即係唔使經人手執-攞嚟用,好似係對天氣報告嘅翻譯就係噉樣。

對於機翻嘅潛質,學界自從 1950 年代嗰陣開始經已有唔少嘅爭論,當中有唔少相關領域嘅科學家都唔覺得機翻會有一日完全取代人手翻譯,但係又有啲科學家持有相反嘅意見[7][8]

機翻嘅基本原理[編輯]

一個譯到鬼五馬六嘅餐牌;就噉將一種語言嘅字直接換做目標語言當中相應嘅字好多時會俾到令人啼笑皆非嘅輸出。

核心問題[編輯]

睇埋:翻譯

用人手做翻譯嘅過程大致上如下[9]

  1. 解讀源文段字嘅意思;
  2. 將呢啲意思重新噉用目標語言表達出嚟。

呢個過程就噉睇好似簡單得好交關,但係實際上佢背後有住一柞好複雜嘅認知作業[10]。要將源文段字嘅意思完全噉解讀嗮出嚟嘅話,個翻譯者實要分析嗮成段字嘅特徵-呢個過程要求個翻譯者要好詳細噉了解嗰隻語言嘅文法語義句法慣用語、以至講嗰隻語言嗰班人嘅文化。同一道理,個翻譯者亦都要對隻目標語言有深入嘅認識[9]。而機械翻譯呢個領域最主要嘅挑戰就在於要點先至可以寫一啲程式令到一部電腦曉學人噉樣做呢個過程,而且俾出嚟嘅輸出仲要係望落同人手做嘅冇分別嘅

進一步嘅MT原理[編輯]

Using corpus techniques,我哋可以進行複雜啲嘅翻譯, allowing for better handling of differences in linguistic typology, phrase recognition,同埋成語嘅翻譯, as well as the isolation of anomalies.

Current machine translation software often allows for customisation by domain or profession (such as weather reports) — improving output by limiting the scope of allowable substitutions. This technique is particularly effective in domains where formal or formulaic language is used. It follows then that machine translation of government and legal documents more readily produces usable output than conversation or less standardised text.

統計翻譯嘅原理[編輯]

提高翻譯文質素[編輯]

講嚟講去,依家最好嘅提高質量方法依然係人工介入,譬如人擅長于響長長嘅文字段落中辨別出專有名詞,而且好少會搞錯,所以可以先由人將嗰啲詞翻譯出來,再有機器翻譯其他,有效減少出錯嘅機會。

但係,當前嘅機譯系統始終都唔能夠達到人翻譯嘅同等質量,特別係當文字語氣寫得唔係幾嚴謹時。

MT嘅歷史[編輯]

MT響今日世界嘅現狀[編輯]

日本[編輯]

20世紀80年代末,日本文部省大藏省都極力主張大搞人工智能同機器譯,並由野村研究所專門負責協調各項MT技術研究。搞出好多款實用嘅MT軟體,以下為有代表性嘅幾款。

大中華地區[編輯]

亞洲其他地方[編輯]

澳洲同紐西蘭[編輯]

歐陸[編輯]

美加[編輯]

參考同工具[編輯]

基礎知識[編輯]

經典書籍[編輯]

Hutchins, W. John; and Harold L. Somers (1992). 《機械翻譯導論》 —— An Introduction to Machine Translation. London: Academic Press. ISBN 0-12-362830-X.  Cite uses deprecated parameter |coauthors= (詳情)

  • 機械翻譯文獻網 —— 該網址由以上同一作者維護,An electronic repository (and bibliography) of articles, books and papers in the field of machine translation and computer-based translation technology

有代表性嘅MT引擎[編輯]

翻訳サイトのいわば下請け業者的な物で、実際にはこれらの翻訳エンジンの出力結果が表示される。新たに翻訳サイトを立ち上げる時に、自ら開発をしない場合はこれらの業者からライセンスを受けることになる。

  • BizLingo エキサイト翻訳ほか
  • KODENSHA エキサイト翻訳ほか
  • クロスランゲージ Yahoo!翻訳、Infoseek マルチ翻訳ほか
  • Amikai エキサイト翻訳、EnjoyKoreaほか
  • World Lingo Googleほか
  • J-SERVER 英語、中国語、韓国語に対応。OCN翻訳に左記3言語翻訳を、Excite翻訳に中国語翻訳を提供している。Yahoo!Chinaにも提供。)

人氣好嘅網上機械翻譯[編輯]

[編輯]

  1. 1.0 1.1 Brown, P. F., Cocke, J., Pietra, S. A. D., Pietra, V. J. D., Jelinek, F., Lafferty, J. D., ... & Roossin, P. S. (1990). A statistical approach to machine translation. Computational linguistics, 16(2), 79-85.
  2. Somers, H. (1999). Example-based machine translation. Machine translation, 14(2), 113-157.
  3. Bahdanau, D., Cho, K., & Bengio, Y. (2014). Neural machine translation by jointly learning to align and translate. arXiv preprint arXiv:1409.0473.
  4. Machine Translation | SYSTRAN Technologies.
  5. Albat, Thomas Fritz. "Systems and Methods for Automatically Estimating a Translation Time." US Patent 0185235, 19 July 2012.
  6. Definition of 'disturbing'. Collins English Dictionary.
  7. Yehoshua Bar-Hillel (1964). Language and Information: Selected Essays on Their Theory and Application. Reading, MA: Addison-Wesley. pp. 174–179.
  8. "Madsen, Mathias: The Limits of Machine Translation (2010)". Docs.google.com.
  9. 9.0 9.1 Kelly, Nataly; Zetzsche, Jost (2012). Found in Translation: How Language Shapes Our Lives and Transforms the World. TarcherPerigee.
  10. Gutt, E. A. (2014). Translation and relevance: Cognition and context. Routledge.

[編輯]