Diskuse k Wikipedii:Časté chyby při strojovém překladu
Francouzština
editovatNabízím příklad, s kterým jsem se sám nedávno v praxi setkal, i když není přímo z článku, ale ze zdroje k němu a z podrobného popisu k obrázku. Ukazuje překladačovu naprostou bezradnost:
francouzština (zdrojový text) | čeština (překlad Google) | čeština (překlad DeepL) | chyby |
---|---|---|---|
Baron de Limoron par lettres patentes du 13 mars 1812. Règlement d'armoiries : Ecartelé : au premier, d'or à l'arbre arraché, de sinople, accompagné en chef de deux tiges à trois épis chacune du même posées en chevron ; au deuxième, des barons tirés de l'armée ; au troisième, de gueules au boeuf arrêté, contourné, d'argent ; au quatrième, d'or à la fourmi posée en fasce, de sable. Livrées : les couleurs de l'écu, le verd en bordure seulement. |
Baron de Limoron patentem dopisů z 13. března 1812. Erbovní řád: Čtvrtletní: první, zlatá s roztrhaným stromem, sinople, doprovázená v čele dvěma stonky se třemi ušima, každý z nich umístěný v šípu; na druhém baroni pocházející z armády; třetí, gules, zastavený vůl, tvarovaný, argent; čtvrtý, zlatý s mravencem ve fesu, sobolí. Livreji: barvy štítu, zelená pouze na okraji. |
Baron de Limoron na základě patentu ze dne 13. března 1812. Pravidla pro zbraně : Čtvrcený: v prvním, Or strom vymýcený, vert, mezi v čele dva stonky po třech klasech položené v chevronu; ve druhém, baroni vytaženi z vojska; ve třetím, Gules vůl zastavený, contourny, argent; ve čtvrtém, Or mravenec položený v fess, sable. Játra: barvy štítu, zelená pouze na okraji. |
Tučně jsou zobrazeny stylistické nepřesnosti, vadné otrocké překlady nebo i vyloženě nepřeložené části.
Jedná se o heraldický popis šlechtického znaku. Protože je text jen hutným heslovitým výčtem jednotlivých prvků, překladač nedokáže izolované výrazy zasadit do kontextu, nerozpoznává gramatické vazby, nepoznává ustálené výrazy označující heraldické barvy (or = zlatá, vert = zelená, gules = červená, argent = stříbrná, sable = černá) apod. |
Na druhou stranu ale nevím, jestli vůbec chceme ukazovat i takové na první pohled zjevně vadné překlady, nebo spíš jenom poukázat a vypíchnout ty překladatelské vady v jinak poměrně obstojně vyhlížejících textech. --Bazi (diskuse) 9. 1. 2025, 22:15 (CET)
- Ahoj, pokud si našel nějakou featuru, kterou jsem tam nedal a na kterou jsi přišel ty (heraldiku nepřekládám to je pravda) tak to tam samozřejmě přidej. Jde jen o to aby se jeden příklad neopakoval vícekrát. Aktron (✆|✍) 9. 1. 2025, 22:21 (CET)
- Tohle je tak otřesný překlad, že by se to snad nikdo neodvážil pubilikovat takhle :) Livrej nevím česky, ale určitě ne játra :D To bych radši nechal livrej, kdybych nic lepšího nenašel... Zajímavé je to "gules" a "sable", jako barvy... kdybych to nenašel ve slovníku, tak snad vygooglil... v nejhorším bych dal "šavlová barva" (i když nejspíš špatně... a gules jsem nehledal ve slovníku, neznám)...
- Max. bych to dal jako příkad, co je snad na okamžité smazání, pokud si tam někdo nedá, že na tom pracuje...
- --Pato Yapuq (diskuse) 9. 1. 2025, 22:54 (CET)
- Ano, je to opravdu spíš ukázka toho, jak nedůvtipné a bezradné ty překladače umí být na úzce odborném a obtížném textu, než že by to byl někdo schopen takhle zveřejnit a ty chyby v tom přehlédnout (i když kdo ví, nechci ani lidskou nedůvtipnost podceňovat). Jinak ty výrazy pro barvy se takhle používají i třeba v angličtině, sable je sobolí kožešina, proto černá, gules se zas prý vykládá jako nákrčník z červené kožešiny. Ale to jsou prostě věci, které by člověk znalý základů heraldiky mohl znát, ty překladače buď nemají do sebe nasypáno dost heraldických textů, nebo jim (pravděpodobněji) chybí ten kontext, protože je ten text takový zhuštěný a heslovitý, takže se v té změti nemají čeho chytnout, s čím to spojit. --Bazi (diskuse) 9. 1. 2025, 23:46 (CET)
Pozitivní příklady
editovatAhoj(te), stránku bych koncipoval spíše a i pozitivně, s radami, jak překlady vylepšit, a ne překladatelstvo odradit, např.:
- ve většině příkladů než známý google překladač použijte deepl.com, vytváří stylisticky kvalitnější text a méně chybuje (stav k lednu 2025)
- když u překladače deepl kliknete myší na překlad konkrétního slova/pojmu (který se vám úplně nezdá, přijde vám ne zcela "český" v daném kontextu), objeví se alternativní návrhy. Možná tam bude lepší pojem, lepší vazba pro vás. Když např. změníte u prvního výskytu slova rod (třeba z byl na byla), překladač automaticky až do konce odstavce opraví i další výskyty tohoto slova.
- (Např. v příkladu "Sága o Nibelunzích" stačí právě kliknout na ty "nesmyslné" pojmy (staroslověnština, předchůdce) a hned první slova ze seznamu nabízí lepší řešení.)
- Pokud se vám v překladu nějaký pojem/sousloví trochu nezdá, často se vyplatí v původní textu najet na tento pojem a rozkliknout si případný článek o něm a následně, pokud existuje, příslušný článek v češtině nebo jiném mně bližším jazyce
- Strojové překlady jsou obecně kvalitnější pokud překládají mezi dvěma velmi rozšířenými jazyky (angličtina <> francouzština), naopak třeba pro překlad lotyština <> slovenština můžeme/musíme předem očekávat nižší kvalitu a větší šanci na velké chyby.
- Pokud překládáte z nějakého méně rozšířeného jazyka ((a nebo často i libovolného jazyka kromě angličtina)), zkuste daný text nejprve přeložit do angličtiny. Lze tak lépe odhalit nějaké větší i menší chyby.
- Někdy za chyby může špatný původní text a chyby v něm. Mnohem lépe se překládají kvalitní články, tedy dobré a nejlepší (a jejich ekvivalenty v příslušných Wikipediích)
- výsledný přeložený text lze "prohnat" nějakým AI nástrojem (např. k lednu 2025 je zdarma https://www.zerogpt.com/grammar-checker najednou zvládne 1000 slov), může pomoci odhalit různé chyby (pravopis, gramatika, stylistika)
- Někdy pomůže se podívat na zdrojový článek v dalších jazycích, třeba je to právě překlad z tohoto jazyka a nebo v tomto dalším jazyce lépe pochopíme/odhadneme kontext.
- ...
--Pavouk (diskuse) 10. 1. 2025, 12:58 (CET)
- Hned k prvnímu tvrzení by asi bylo potřeba ho mít podložené něčím víc než jen dojmem. Obzvlášť jestli máme propagovat nějaký nástroj na úkor jiných. Už to, že všechny úvodní příklady byly vybrané jen z jednoho překladače a jiné nedostaly prostor, mi přijde ne úplně šťastné (proto jsem do svého příkladu výše použil aspoň dva pro srovnání).
- Problém s prohnáním ZeroGPT vidím v tom, že zase nanejvýš jenom uhladí výsledný jazyk, ale překladové chyby vzniklé v předchozích fázích překladu těžko napraví, protože neporovnává s původním textem a jeho významem, ani nějakou jeho znalostí odborné terminologie z různých oblastí bych si nebyl moc jistý.
- Jinak třeba s doporučením překládat přednostně kvalitní texty NČ a DČ bych souhlasil, ale všimněme si, že tato stránka se jmenuje "časté chyby", takže logicky obsahuje a rozebírá právě ty chyby. Obecně strojovému překladu se věnuje stránka jiná: Wikipedie:Strojový překlad Wikipedie. --Bazi (diskuse) 10. 1. 2025, 13:21 (CET)
- Souhlas s mnohým, Jednu věc bych ale z toho bych nedoporučoval: Přeložit třeba z ruštiny do angličtiny a pak do češtiny by jenom zvětšovalo šanci na ztrátu kontextu a gramatické chyby. Osobně používám překladače pro psaní článků jako pomocníka jen u jazykům, kterým jakž takž rozumím v psané podobě, abych to dokázal po automatu zkontrolovat --Zagothal (diskuse) 10. 1. 2025, 13:26 (CET)
- Ahoj, to není o tom že ty překladače jsou špatně. Naopak jsou velmi dobré a pracuje se s nimi suprově, jenom člověk si musí dát pozor právě na tyto záludnosti, které upřímně vzato ne každý z praxe zná. A může toho být mnohem více, než jsem si tady všiml. Ano, třeba problém s českými exonymy nebude mít ContentTranslate, protože využívá Wikidata, což je naprosto geniální přístup, na druhou stranu trpí zase na jiné věci. Zkušenost s jinými nástroji (jsou jich pravda mraky) není na škodu doplnit, pokud je stránka snad moc striktní nebo nepříjemně napsaná tak tam můžete cokoliv změnit. Já to bral jako navázání na kdysi právě Blahmou zjištěné závěry československého překladače, akorát pro jinou dobu a v jiných objemech. Pracuji tam hodně s párem cs-hu, proto jsem tam dal to, čeho jsem si všiml už několikrát. Rozhodně se ale nebojte rozšiřovat! O tom by to tu mělo být. Aktron (✆|✍) 11. 1. 2025, 18:48 (CET)