Katse: veebimasin tõlgib, kuid läbi häda
Tühjatoimetaja Villem Sakspere. Võrdlev-ajalooline uurimus. Tallinn 2009. Autor tõestab näidete varal, et tõlkemasinad peavad veel mehemoodi õppima.
1. Esimene katse - 1998
1.1. Maalehes ilmus 12. märtsil 1998 - emakeelepäeva eel artikkel "Inimkeel ja masinmeel". Selle autor Mati Soomre kahtlustas, et arvutid võivad hakata tõlkijatel leiba käest kiskuma, kuid eeldas, et nad sellega niipea hakkama ei saa.
1.1.1. Kahtlustus
Aastate
jooksul on elektroonika võimed ja võimsus tohutult arenenud.
1.1.2. Eeldus
Inimestel on tore komme kõnelda kujundlikult ja teha nalja. Nali aga põhineb sõnade mitmetähenduslikkusel või nende tavapärasest kontekstist väljarebimisel.
Kuis peaks vaene arvuti taipama, millal "Tere hommikust!" tähendab teretust, millal rahulolematust, või miks "mine võta kinni" tuleb kord tõlkida go and get it, kord search me! (‘otsi mind läbi')?
1.2. Analüüs
Kontrolliks tõlkis ta ise ühe lookese eesti keelest inglise keelde ja laskis Internetis tõlkemasinal selle ümber panna saksa, edasi prantsuse, siis hispaania, portugali, itaalia ning tagasi inglise keelde.
Ka viimase tõlke inglise keelest eesti keelde tegi ta ise, sest tõlkemasinad tollal eesti keelt ei osanud.
1.3. Algne lugu
Karjamaal oli kaks lehma, kes tundsid mõnu päikesest ja sõid rohtu. Üks lehm vaatas ringi ja ütles hingepõhjast: "Muu." Teine lehm ütles: "Imelik, sa lausa võtsid mul sõnad suust."
1.4. Tulemus
Siin on olnud kaks lehma grammis, on lugu pidanud päikesest ja sööb mingit valgendab grammis.
Esiteks ligikaudu mõistlik lehm ja sisemise lehma suhteliselt sisemise näo keskmine. "MOO," tollelt teiselt lehmalt, et see oli õnn. "et on rõõmsasti, see f4ez'i küsitlus sõnadega minu avausest."
1.5. Järeldus
Kuni arvutid kujundlikust keelepruugist ega naljast aru ei saa, ei maksa vähemalt taidetõlkijatel neid tõsisteks konkurentideks pidada.
2. Teine katse - 2004
2.1. Viie aasta pärast kahtlustas Soomre, et arvutid on vahepeal hiiglamoodi targemaks saanud ja kordas 11. märtsi Maalehe artiklis "Masin ikka maas" täpselt sedasama katset.
2.2. Uus tulemus
Kahest lehmast grammis on antud päike, gramm on hinnatud ja sööb.
Esimene on vaadelnud lehma ümberringi ja suhtelise südame alama osa tunded: "MUU." teine lehm, et "kui ta ütles, "et ta on rahul: "see sina kõrvaldamine sõnad mu avausest."
2.3. Uus järeldus
Tundub siiski, et sõnapaar "hiiglamoodi targemaks" on leebelt öeldes liialdus.
3. Kolmas katse - 2009
3.1. Vahepeal on tõlkemasinate rivvi astunud ka Google. Tänavu 1. veebruaril ilmus selle töökeelte sekka viimaks ka eesti keel. Taas sama tõlkerada rännates tekib algloost juba midagi peaaegu arusaadavat.
3.2. Värske tulemus
Kaks lehma aasal, et mõnu tunda päikesest, ja rohtu söömas. Esimene etapp nägi lehma, südamest ja ütles: "Muu." Teine lehm ütles: "Nali, sul on sõnad minu suust."
3.3. Värske järeldus
Mati Soomre väidab: "Google'i masinast võib veel asja saada, seda enam et sellel on ka parandusnupp - kes masina tööga rahule ei jää, saab talle soovitada paremat tõlget."
4. Järelduse kriitika
4.1. Esiteks on 2009. aasta tulemus saadud nii, et nagu eelmistelgi kordadel, tõlkis eesti-inglise ja inglise-eesti suunal inimene. Katse korratavuse nõuded on sellega kiiduväärselt täidetud, ent ajaloolise tõe huvides tulnuks Soomrel needki tööd usaldada tõlkemasinale ja nimetada senised tõlked segatõlgeteks. Tegin seda ise.
4.1.1. Tegelik masintõlge
Kaks lehmade karjamaa, mis tundus, et tal on päike ja muru jumal. Hingepõhjast vaadeldi lehma ja ütles: "Muud". Teine lehm ütleb: "Kui imelik, siis on teil sõnu suhu."
Siinkohal tuleb nentida, et algloost säilinud sõna "hingepõhjast" ei ole mitte masina tõlkeloominguline saavutus, vaid vastupidi - tema küündimatus. Nimelt ei saanud sellest sõnast aru ükski keelepaar ja see käis eestikeelsena läbi kõikide osatõlgete.
4.2. Teiseks oleks enne niivõrd positiivse hinnangu andmist tulnud Google'ile usaldada ka meie tüvitekstide tõlkimist - ilma pikema ringita, lihtsalt eesti keelest mõnda teise meile vajalikku keelde. Tegin ka seda ise. Tulemused on kõnekad ilma neile hinnangut andmatagi.
4.2.1. Tüvitekstitõlkeid
4.2.1.1. Kui Arno isaga koolimajja jõudis, olid tunnid juba alanud.
If Arno School came to her father, had already begun hours.
Если Арно школы пришли к своему отцу, уже начали часов.
Jos Arno Isäni koolimajja pääsi olivat tunnit jo alkanut.
4.2.1.2. Sauna taga tiigi ääres / mängis Miku Manniga, / püüdsid väikseid konnapoegi / lõhkilöödud panniga.
Sauna behind the pond along / Miku played pines, / tried to capture the small tadpole / lõhkilöödud panniga.
Наряду пруду позади сауна / Miku играл сосны, / старались небольших головастик / lõhkilöödud panniga.
4.2.1.3. Jää vabaks, Eesti meri! / Jää vabaks, Eesti pind! / Siis tuisku ega tormi / ei karda eesti rind!
Ice-free, for the sea! / Ice-free, for the surface! / Belisle and the storm / Estonia is not afraid of boobs!
Свободных ото льда, на море! / Ice-бесплатно, на поверхности! / Затем буря или Tuisku / не боятся эстонских сиськи!
4.3. Kolmandaks diskrimineerib Google'i masin eesti keelt. Inglise kõnekäänu out of sight, out of mind ("mis silmist, see südamest") oskab ta korralikult tõlkida vene keelde - с глаз долой, из сердца вон. Kord ammu olevat tema eelkäija maha saanud tulemusega слепoй идиoт ("pime idioot").
Niisama kenad on tulemused nt soome (poissa silmistä, poissa mielestä) ja saksa keeli (aus den Augen, aus dem Sinn).
Mingil arusaamatul põhjusel keeldub Google seda kõnekäändu eesti keelde tõlkimast ega võta kuulda parandusnupu kaudu soovitet paslikku vastust.
5. Kaebus
5.1. Google ise kaebab enda peale: "Tõlke kvaliteet pole nii hea kui sooviks.
Kas seda saab täpsemaks muuta?"
5.1.1. Vastus kaebusele
Google ise vastab endale: "Ka kõige keerukam tänapäeva tarkvara ei suuda võistelda seda keelt emakeelena rääkiva inimese ladususega ega oma professionaalse tõlkija oskusi."
6. 1. Kokkuvõte
Egas massin inimese vastu saa, ütles vanamutt kirikus, kui oli kaks salmi orelist ette jõudnud.
6.2. Summary
Egas in weight can be a human, said vanamutt church, where the two had reached the verse orelist.