Wikipedia:粵語地方用字轉換

出自維基百科,自由嘅百科全書

粵語維基百科嘅用家嚟自五湖四海,係唔同地方嘅用字係有唔同,好似廣府粵語,用「課室」唔用「班房」,用「冰箱」多過用「雪櫃」。要做到「海納百川」,就要尊重唔同用家嘅用法,亦可以減低編輯戰嘅可能。

做法[編輯]

粵語地方用字轉換可以用現成中文維基百科處理地區用詞嗰套。

討論[編輯]

  • 英文、葡萄牙文、西班牙文同埋德文維基百科都有地方用詞唔同嘅問題,但係佢哋唔會引入自動地方用詞轉換。實際嘅解決辦法,應該係編輯之間互相尊重,唔好監生改人嘅哋地方用詞。地區詞轉換治標唔治本。 2013年3月23號 (六) 14:14 (UTC)[回覆]
不幸嘅係,宜家唔單止有人監聖改,連粵語維基百科嘅系統都經常誤判「國維行話」。殘陽孤侠 (傾偈) 2013年4月1號 (一) 18:42 (UTC)[回覆]
  • 就目前來講,地區詞轉換係最好嘅辦法——唔單止可以大幅降低編輯戰嘅機會,重可以有效解決粵語維基百科因為歷史原因造成嘅,喺唔同方面都存在嘅尊港抑粵問題。殘陽孤侠 (傾偈) 2013年3月25號 (一) 01:59 (UTC)[回覆]
  • 唔單止地方用詞唔同嘅問題,係題目命名時 User:Cedric_tsan_cantonais 要求「間隔號」可以一齊解決埋。--WikiCantona (傾偈) 2013年3月26號 (二) 20:42 (UTC)[回覆]
  • 其實同一種言語喺幾個唔同嘅政治行政區域使用就有呢個問題,各自文化發展都唔同,語音出現變化,甚至連文字都同。大陸同台灣就有普通話簡體字同國語正體字嘅差異;我識得啲原籍廣東嘅客家人,母語係客家話,話唔知客家基維百科啲係乜文,可能因為台灣啲學校係教客家基維嗰種客家語,結果大部客家人都唔識用,真係可惜;英文同其他西區語系嘅維基百科冇呢個問題,可能因為唔同政治行政區域嘅文化交流好自由,幾個英語強國嘅英語都係唯一嘅主流語言,差異比較少,但粵語除咗喺香港同澳門係唯一嘅主流語言,喺大陸不但俾普通話同化,喺其他地區嘅粵語都受到當地嘅主流語言影響,所以差異好大。所以地區詞同繁簡轉換可以決定好多問題,唔同地區嘅人可以記錄地方特色嘅粵語,如果保留埋唔轉換嘅原文,仲可以記錄埋唔同年代嘅粵語演化㖭。Hkcantonese (傾偈) 2013年4月23號 (二) 06:41 (UTC)[回覆]
  • @Cedric tsan cantonaisWikiCantonaHkcantonese具體嘅軟件設定想點整?我幫到手。Ochloese (傾偈) 2014年12月21號 (日) 17:37 (UTC)[回覆]

做題先[編輯]

呢牌傾 Talk:愛滋病改名,User:S7w4j9 因為「地區差別」搞到好勞氣,呢件事令我諗到,如果我哋先行一細步,係咪好啲,即係:唔好要求一次搞掂「自動地方用詞轉換」,而係先做咗文章題目嘅轉換先。係咪冇咁多問題呢?我對 Javascripts 係一知半解,所以我會請 @S7w4j9Cedric tsan cantonaisDeryck ChanShinjimanWilliam915, @OchloeseHkcantonesePQ77wd出下聲。--WikiCantona (傾偈) 2018年1月24號 (三) 06:44 (UTC)[回覆]

呢個問題我冇意見。不過類似「愛滋病」呢單嘢的確有唔少文章出現呢個情況,例如以前粟米篇嘢試過遇到類似「用詞轉換」嘅問題。最近幾日又有個貴港佬傾到字詞轉換問題,我覺得應該要納入「自動地方用詞轉換」。--PQ77wd (傾偈) 2018年1月24號 (三) 06:57 (UTC)[回覆]
唔知機器壞定乜嘢,我冇收到@我嘅通知,偶然先睇到呢度開咗題。@WikiCantona@Deryck Chan
我講嘢有時一激氣,語氣會粗重啲,性格使然,望你哋多多包涵。我嘅出發點都係好,希望日後可以減少兩地摩擦,你開心,我開心,自然少啲無謂拗撬。
我係支持搞轉換嘅,但我提個總原則:低限度轉換,只針對「不可調和」嘅兩地差異而做,諸如「斯大林同史太林」,「愛滋病同艾滋病」,「軟件同軟體」呢啲。若果係涉及邏輯分類嘅,比如「豬腸粉」「白酒」,唔可以轉換,兩地嘅用語涵意差異應該喺文內講清,溝通兩地,彼此瞭解,大家一齊努力增進粵語地區嘅知識。我唔希望因爲少少問題撕裂社羣,因爲啲啲用語分解粵人,因爲團結先可以對抗北方嘅外侮。我之所以提分版,我嘅目的在於想通過威脅逼倒你哋同意開轉換,而唔係真係有心搞分裂。
現時技術可能唔易搞,不妨做住標題嘅轉換先,內文唔做住,時機成熟再一鑊熟佢。
我相信呢個係個長期工程,應該成立個小組去執頭執尾,若果你哋同意,我願意出來帶頭成爲呢個小組嘅成員,去看住個轉換機,有咩要要加入轉換或者提議,可以搵我,逐個討論後再由我放入轉換機。呢個轉換機應該特定人來喐佢,防止別有用心嘅人搞破壞。所以呢個我需要喺社羣入面嘅權力,如果你哋信得過我,我願意承擔呢項任務。呢個權力只針對轉換機,其他事宜我唔會插手,由其他事務員、管理員去執行。你哋都可以隻隻眼𥄫實我,睇我有冇越權。--S7w4j9 (傾偈) 2018年2月1號 (四) 10:46 (UTC)[回覆]
另外一題,關於貴港話(勾漏粵語)。
我睇咗@滕謄提供嘅貴港話文本,我認爲技術上做唔到穗貴轉換。理由如下:
  1. 我哋嘅基本虛詞唔一樣。若果一對一轉,冇問題;若果多對一,只要有詞庫,都冇問題。問題在於佢交叉。比如穗語嘅「嘅」對貴語嘅「個」,但問題係穗語亦用「個」,穗語嘅「個」可做領屬助詞(「我個仔」),亦做定冠詞(「個人」),亦做量詞(「幾個蘋果」)。用機器硬轉,會損傷穗語嘅表現神采,另外穗語量詞「個」對貴語「隻」,然而穗語亦用「隻」作爲專門量詞。噉試問系統幾時識別「個」係穗語嘅「個」,定貴語嘅「個」?又幾時識別出「個」係穗語嘅助詞,定係穗語嘅量詞?
  2. 呢個交叉重疊問題,意味住用java轉換冇可能成功轉換到,只能夠用人工智能去完成轉換。但我哋明顯冇咁高技術去攻破呢個難題。所以現時對待貴港話嘅政策,我建議係穗貴分離,各開一版,用dablink連埋兩版即可。貴港嘅嘢,我願意畀貴港話做主場,畀你去連wikidata,我哋廣州話退居二線,喺注音上,貴港版注貴港拼音,而不必注廣州拼音,廣州版則需要兩注。我哋作爲標準粵語,應當大度讓人,畀空間人發展。
@Ochloese似乎通曉技術,想聽聽你喺轉換技術上嘅意見。--S7w4j9 (傾偈) 2018年2月1號 (四) 10:46 (UTC)[回覆]
我都唔介意貴港地區相關文章用貴港寫法,寧願內文係貴港話,再喺生澀貴港用詞喺一篇文第一次出現嗰時,後面用括號加穗港用語對照。虛詞方面,粵海母語讀者睇用「個」做屬格助詞、「隻」做量詞,其實唔影響理解。諗諗下,四邑地區相關題材都可以咁處理。翹仔 (傾偈) 2018年2月1號 (四) 17:33 (UTC)[回覆]
我認爲仲係穗貴分版好。你唔識我,我亦唔識你,問題在於維基文章隨時改,唔識貴港話嘅人你要佢點寫?一唔係就寫唔到,一唔係就係寫廣州話上去,篇文咪夾花囉,一啲係一啲唔係,好肉酸㗎,你叫人點睇嗟?不如分版,你有你做,我有我開,既保存到各自嘅純粹,亦畀彼此有空間存在,有何唔好?想做全家桶、大鑊煮,呢種諗法太烏托邦。--S7w4j9 (傾偈) 2018年2月11號 (日) 12:30 (UTC)[回覆]
我覺得用詞差異可以分類討論。
  1. 粵語方言之間嘅差異,廣州話、台山話、肇慶話、貴港話、南寧話等等。我個人諗唔到咩解決方案。一個可以參考嘅例子係低地蘇格蘭語。可以睇到同英文比較其實係睇得明,係拼寫唔同,讀法唔同(所以難聽得明)。所以我估,如果差異大到不能容,就只能夠指意 其它話 開新wiki咯。差異未至於咁大,同埋未有得開新wiki之前,下邊再講。
  2. 1950年之後出現嘅香港粵語同廣州粵語嘅分化,純粹音譯嘅,比如『斯大林/史太林』、『希特勒/希特拉』、『貝克漢姆/碧咸』。我建議採用基於粵語嘅音譯。你地唔覺得斯大林希特勒有咩問題,只不過因為佢地粵語發音都算係似。而貝克漢姆因為好唔同,同埋粵語講波好多人都接觸到,所以即使廣東報紙90%以上都會寫北方話音譯,大眾都係會講碧咸,一講就明。所以我舉兩個例,『齊奧塞斯庫/壽西斯古』,『昂山素季/昂山素姬』,唔多人識得,但係北方話音譯明顯比粵語音譯更加偏離佢地原來嘅發音。因此,我建議呢一類,以源自粵語嘅有好多人採納嘅音譯作準,別名做redirect同埋喺篇文入邊標出來。
  3. 1950年之後出現嘅香港粵語同廣州粵語嘅分化,本土事物,唔產生歧義嘅,噉我覺得用邊個都冇所謂,比如『膠擦/擦紙膠』、『回形針/萬字夾』。
  4. 1950年之後出現嘅香港粵語同廣州粵語嘅分化,本土事物,會產生歧義嘅,可參考現時『腸粉』嘅做法。英文wiki嘅例子pants英文pants
  5. 1950年之後出現嘅香港粵語同廣州粵語嘅分化,外來嘅新鮮事物,意譯嘅,比如『汽油/電油』、『摩托車/電單車』、『冰箱/雪櫃』、『手機/手提電話(流動電話)』,兩家用詞嘅普及度都差唔多,噉就惡搞啲。比如前邊四個,我個人係會選擇『汽油/電油』、『摩托車』、『雪櫃』、『手機』。電單車會令唔知嘅人可以會錯意電動單車,但係摩托車,或者可以估到係motorbike。雪櫃係櫃,冰箱唔係箱。手機意義明確,何必用更累贅嘅詞。可以參考出邊呢個論壇樓主嘅考究。英文例子elevator英文elevator
  6. 最近二十年,北方話用語進入粵語。有啲詞係唔應該用,主要係北方話好鍾意創設新詞同無厘頭縮寫,比如『失聯』(失踪)、『群體(性)事件』(示威/抗議)、『手遊』(手機遊戲)。因為粵語係有清晰準確嘅既有表達,中國大陸學校(同埋依家香港)『普通話教中文』搞到啲人唔識,轉晒用嗰啲詞,唔代表啲詞就係粵文。呢一方面,常用程度,廣泛認可程度,唔能夠影響佢地屬唔屬於粵語。佢地由始至終都唔係。
上述咁多類,我覺得,係只有第1類值得搞地區轉換。第2345類,參考比如英文wiki,係揀一個最唔可能產生歧義,最能夠令多啲人明白嘅,未得咯。第1類當前處理做法都一樣。只要可以明,未點寫都得咯。一旦比較難明,太局限於某個地方,就要標出來,係邊度方言,而大家都明嘅叫法又係乜。我諗編寫原則就係,最緊要大家都睇得明。何必執著內文用邊個叫法寫。自己平時點講,唔會因為睇咗呢度嘅文受影響。就好似我都唔見有人去拗『學校』,仲可以叫『書館/學堂/書院』個喎,憑乜嘢用個新詞,唔用清朝/民國嗰時嘅詞?
一句講晒,我唔贊成採用地區轉換。因為粵語方言太多,差異太大,一旦用地區轉換,喺短期之內都唔會夠人去編寫。廣東廣西可以話係一個鎮就有一種方言。淨系省城、南番順、四邑、東莞、肇慶、中山加埋,都已經幾十種。仲有粵西、廣西、海南都唔知有幾多。香港同北美又一種。星馬至少一種。越南又有。我地無意推行一種『粵語普通話』,只係希望大家盡量寫大家都睇得明嘅。好似上邊貴港嘅朋友寫嘅,一眼睇得明啊。--Roy17 (傾偈) 2018年2月21號 (三) 23:09 (UTC)[回覆]
睇到個noticeboard入黎,用地方用字轉換係好事黎,可以吸納唔同讀者,亦都可以減低一啲編輯戰嘅風險。不過轉換字詞建議只限粵地地方都用緊嗰隻字都係喺口語化嘅環境度出現。唔係個話呢度就變咗做官話維基百科,係又轉,唔係又轉。特克斯特 (傾偈) 2021年3月15號 (一) 16:03 (UTC)[回覆]
其實點解呢度唔用LanguageConverter,而係用JavaScript做轉換嘅?H78c67c·傾偈 2021年5月1號 (六) 14:13 (UTC)[回覆]

睇埋[編輯]

有用[編輯]