CAT (翻譯)

出自維基百科,自由嘅百科全書
  提示:呢篇文講嘅唔係翻譯器
典型嘅 CAT 畫面,左:主畫面、右上:配對一覽、右下:詞彙表

CAT(全寫 computer-aided translation),中文譯電腦輔助翻譯,喺專業翻譯,係指一種將翻譯工作入面比較死板嘅部分半自動化嘅輔助軟件,佢本身並唔係機械翻譯,但係現時多數嘅 CAT 都可以駁機械翻譯,用來幫翻譯員起稿。

構成 CAT 嘅基本功能係句子切割segmentation)、翻譯記憶(TM,translation memory)同配對。所謂句子切割係指將原文嘅段落切成類似句子嘅較細單位,等翻譯員唔使成段譯,而係逐句來,而翻譯記憶就係一種數據庫。翻譯員將切割咗嘅原文譯好之後,CAT 會將原文同譯文都放入翻譯記憶;之後,當相同或者近似嘅原文再次出現,隻 CAT 就會將搵到嘅可能啱用嘅譯文(matches)顯示畀個翻譯員揀,個翻譯員可以揀、唔揀,或者揀咗再改,爾種搵舊譯文嘅功能叫配對。

配對唔一定要全中,而係可以搵唔到原文,但係搵到近似句子,都會照出,顯示出lei4畀個翻譯揀,但係會maak1低(軟件心目中)中咗百分之幾,咁樣唔係全中都照出嘅叫模糊配對[1]fuzzy match)。

坊間嘅 CAT 當中應用程式網上服務嘅版本都有,但係有啲翻譯員基於保密理由,認為唔應該用網上服務。用樣理由,好多翻譯員都唔會駁機器翻譯,因為佢哋認為將原文傳去伺服器即係將資料畀咗第三方,係合同或者專業守則唔容許嘅事;爾個理由係同個翻譯員支唔支持機器翻譯無關。

好多 CAT 亦都有自訂詞彙表嘅功能,等翻譯員可以將同一領域、客人或者專案嘅詞彙寫入去,等譯文用嘅詞彙可以前後一致。

CAT 只會對可以半自動化嘅翻譯有用,對於例如譯小說之類嘅創意性翻譯,CAT 嘅用處有限。

衍生問題[編輯]

CAT 嘅句子切割功能淨識跟住原文嘅次序機械式咁切割,如果源語言同目標語言嘅文法相差太遠,咁樣切割並唔會幫到個翻譯員。最簡單嘅例係中英文句號逗號用法唔同,原文係英文,切割之後,如果翻譯盲目跟機直譯,出lei4嘅中文句子就會過短;相反,原文係中文,如果盲目跟機譯做英文,出lei4嘅英文句子就會係技術上唔啱文法嘅 run-on sentence。又例如,中文同英文信嘅格式唔同,將一封英文信放入 CAT,出來啲嘢會錯嗮次序,如果翻譯社硬要個翻譯用 CAT,就可能要人手譯完封信之後夾硬順序打篇譯文入個 CAT 度,即係個翻譯記憶會亂嗮;比賽規則等等亦有類似情形。翻譯社盲目要翻譯員用 CAT 係造成西式中文嘅原因之一。

另外,有嘅翻譯員同有啲翻譯社相信 CAT 嘅配對功能係準同有用嘅,令佢哋相信如果個 CAT 搵到配對就即係可以做少啲嘢,可以減價,有啲翻譯社甚至會壓價。但係如果源語言同目標語言嘅文法相差太遠,搵到配對可能冇意義[2],例如英譯中,英文一般冇量詞,如果原文有一大堆數字,翻譯員要判斷使唔使加返量詞,加埋翻譯記憶以為嗰大堆數字可以自動處理,可以令到個翻譯員比唔用 CAT 更加煩。

[編輯]

  1. OmegaT簡介 (臺灣中文). 喺2023年5月12號搵到.
  2. "Determining your rates and fees as a translator" (英文). CAT-based discounts. 喺2023年4月21號搵到.