Eelmisel nädalal avaldasime loo sellest, et Tartu ülikooli arvutiteaduse instituudi keeletehnoloogid said valmis uuendusliku eestikeelse masintõlke tööriista, mis töötab eesti-inglise-eesti suunal ja toetub tehisnärvivõrkudele.

Teadusportaal Forte testis ja võrdles eestlaste neurotõlke ja Google Transale tõlkimisoskust ja leidis, et eestlaste leiutisel on veel arenguruumi.

Uue tõlkevõimaluse vastu oli huvi väga suur ja testijad nii palju, et vahepeal kippus lehekülg lausa hanguma. „Kasutajaid oli tõepoolest väga palju, ainuüksi Maalehe veebiküljelt tuli üle 10 000 külastuse, ning kokku teisipäeva jooksul oli 15 000 külastust,“ ütles TÜ keeletehnoloogia õppetooli juhataja dotsent Mark Fišel. „Muuhulgas saime 6000 tagasisidejupikest "Mängi" nupu kaudu.“

Ta tunnistas, et masintõlge neurovõrkudega on väga raskelt ennustatav ja raskelt kontrollitav. See võib, aga ei pruugi tõlkimisel vaadata sisendlauset - seega on võimalik, et ta pigem genereerib väljundteksti ilma seoseta sisendtekstiga. „Meie põgus analüüs näitab, et umbes pooled laused on imehead, ning pooled on üllatavalt seosetu sisendiga,“ lisas Fišel. „Lisaks kasutab meie süsteem vähem tõlkenäiteid õppimiseks kui Google ja tõenäoliselt ka Tilde tõlketööriist. Meie puhul on kasutatud 15.4 miljonit lausepaari (183 miljonit inglise sõna / 142 miljonit eesti sõna).“

Pärast esimeste päevade poleemikat ja suurt katsetamist tegi Mark Fišel tagasisidest kokkuvõtte, et näha erapooletut ja tasakaalustatud tagasisidet. „Osutub, et keskmiselt valitakse meid parimaks sama sageli kui Google'it, ning Tilde jääb taha - ilmselt seetõttu, et nende tõlkesüsteem on häälestatud teistele tekstivaldkondadele nagu tehnilised juhised jms,“ märkis ta. Enamasti sai eestlaste neurotõlge sisendiks lühilauseid, mille pikkus oli kuni 7 sõna ning nendega saab Google Translate hästi hakkama. „Pikemate lausete puhul eelistatakse pigem meie väljundit,“ märkis ta. „Lähitulevikus uurime kindlasti, kuidas süsteemi "stabiliseerida", lisada treeningandmeid ning tõlkekvaliteeti tõsta.“

