Tõene või väär: Google Translate'is on tänapäeval saadaval juba enam kui 200 keelt
Väär, kuid tublisti üle 100 keele on Google Translate'i pagasis küll ja neid lisandub igal aastal juurde
See masintõlkesüsteem ühendab reeglipõhise, statistilise ja neuromasintõlke tugevused
Mis on hübriidmasintõlge?
Lisaks masintõlke tehnoloogia arengu käigus välja kujunenud kolmele peamisele meetodile on olemas ka hübriidsüsteeme, mis kombineerivad eelmainitud kolme masintõlke liike.
See populaarne avatud lähtekoodiga masintõlkesüsteem tuli 2016. aastal esimesena neuromasintõlkega turule
Mis on Google Translate?
2016. aastast kasutab Google Translate uut algoritmi GNMT (Google Neural Machine Translation).
Google arendas 2006. aastal Google Translate'i välja statistilise masintõlketeenusena. On süsteeme, mis kasutavad siiani paralleelselt statistilist masintõlget ja neuromasintõlget, kuid üldine suund on neuromasintõlke suunas.
Selliste tarkvaratoodete arendamisse kaasatakse lingviste:
Mis on juturobot:
Tõene või väär: neuromasintõlke mootor analüüsib üksikute fraaside asemel kogu lähtelauset
Tõene.
Kui statistilise masintõlke mootorid vaatavad korraga pigem fraasi või äärmisel juhul lühikest lauset, siis neurotõlke mootor vaatab korraga kogu lauset ning üritab närvivõrkude tööd järele aimates luua mingeid üldistavaid mudeleid, mille põhjal sihtkeelne lause kokku pannakse.
Suuliste ja kirjalike tekstide (või ka loomuliku keele) digitaalne kogu, mille abil kogub masin teadmisi keele kohta
Mis on korpus?
Euroopa Liidu neuromasintõlkemootor
Mis on eTranslation?
Tõlkija haridusega inimest otsitakse just sellesse ametisse:
Mis on Language Data Analyst
"... väike, kollane ja kaanitaoline ja võib-olla kõige arvukam asi Universumis" tegelane Douglas Adamsi ulmeromaanist "Pöidlaküüdi reisijuht Galaktikas", kelle järgi sai 1997. aastal nime DEC-i ja Systrani-i tõlketeenus
Mis on Babel Fish ehk paabeli kala? (babelfish.altavista.com, hiljem Yahoo! Babel Fish, mis 2012. aasta mais asendati Bing Translatoriga (nüüd Microsoft Translator))
Meetod, mis võimaldab süsteemil automaatselt läbi kogemuste õppida ja täiustuda ilma inimese sekkumiseta
Mis on masinõpe?
Masinõpet kasutatakse nt internetiotsingute vastete leidmisel, kõne tekstiks töötlemisel, näotuvastuses, juturobotites, toodete ja teenuste soovitamiseks e-platvormidel.
Selle populaarse masintõlkemootori tasuta versioon kasutab teie tekste neurotõlke arendamiseks
DeepL
Tõlkijat otsitakse just sellesse ametisse:
Mis on AI treenimine
Tõene või väär: vähem kasutatud keelepaaride puhul tõlgib programm lähtekeele esmalt inglise keelde ning alles seejärel sihtkeelde
Tõene. Eesti keelest võõrkeelde või võõrkeelest eesti keelde tõlkimisel tõlgib Google Translate teksti esmalt inglise keelde ja alles seejärel sihtkeelde. Seega on eesti keele puhul eesti-inglise keelepaar ainus, mida Google’i tõlkeprogrammis kasutada tasuks.
Just seesugust "kihilist" õppemeetodit kasutab Google Translate oma neuromasintõlke süsteemi tõlketäpsuse suurendamiseks
Google'i neuromasintõlke (GNMT) süsteem kasutab lähtelausete analüüsimiseks ja tõlkimiseks sügavõppe meetodit. Tõlkeotsuste tegemisele aitavad kaasa tehisnärvivõrgud ja suured andmehulgad. Neurovõrgud võtavad arvesse kogu lause konteksti, soravust, stiili.
Selle puudumine vähendab masintõlke usaldusväärsust:
Mis on kontekst.
Kui kasutad kliendi tõlketöös ChatGPT abi, tuleb andmete turvalisuse tagamiseks välja lülitada just see säte
Chat history and Training - välja lülitada
Just need omadused teevad eesti keele masintõlke ja automaatse keeletöötluse jaoks keeruliseks
Rikas morfoloogia (suur arv käändeid ja pöördeid), vaba sõnajärg (probleemid teema ja reemaga), vaba liitsõnamoodustus, ühend- ja väljendverbid, piiratud paralleelsete tekstide hulk (st vähem tõlkenäiteid kui paljudes suuremates keeltes).
Väiksemate keelte (nt põhjasaami) puhul napib tihti andmeid, mille pealt tehisintellekt saaks õppida. Mida teha, kui andmetest ei piisa hea neurotõlkesüsteemi loomiseks? HÕBEVILLAK!
Masintõlkesüsteemi treenitakse mitmes keeles samaaegselt, et parandada tõlkekvaliteeti. Mitmekeelsesse mudelisse valitakse sarnaste mustritega sugulaskeeled (nt soome-ugri keeled). Nii saavad väiksemad keeled (millest on vähem andmeid) suuremate keelte (millest on rohkem andmeid) andmestikust kätte kasulikku teavet.
Selle masintõlkemootoriga saab muuhulgas tõlkida ka võro, liivi, põhjasaami ja ersa keelt
Mis on neurotõlge
Tartu Ülikooli keeletehnoloogia uurimisrühma arendatud tõlkemootor
Selle 29 keele hulka kuulub 23 soome-ugri keelt, nende hulgas ka võro, liivi, põhjasaami, ersa, niidumari ja palju muud.
Lisaks tõlkimisele võimaldab süsteem ka veaparandusi, ehk vigase teksti korrigeerimist, kuna on treenitud vaid korrektse keele näidete põhjal.
I good partner. → I am a good partner.
Ma tahab et me laula → Ma tahan, et me laulaksime
Tõlge, millesse tuleb tõlkijal lisada otsingumootori märksõnad
SEO-tõlge (Search Engine Optimisation)