Varia
Tehnoloogia A & O
Masintõlkemootorid
Turg ja teenus
100

Tõene või väär: Google Translate'is on tänapäeval saadaval juba enam kui 200 keelt

Väär, kuid tublisti üle 100 keele on Google Translate'i pagasis küll ja neid lisandub igal aastal juurde

100

See masintõlkesüsteem ühendab reeglipõhise, statistilise ja neuromasintõlke tugevused

Mis on hübriidmasintõlge?

Lisaks masintõlke tehnoloogia arengu käigus välja kujunenud kolmele peamisele meetodile on olemas ka hübriidsüsteeme, mis kombineerivad eelmainitud kolme masintõlke liike.

100

See populaarne avatud lähtekoodiga masintõlkesüsteem tuli 2016. aastal esimesena neuromasintõlkega turule

Mis on Google Translate? 

2016. aastast kasutab Google Translate uut algoritmi GNMT (Google Neural Machine Translation). 

Google arendas 2006. aastal Google Translate'i välja statistilise masintõlketeenusena. On süsteeme, mis kasutavad siiani paralleelselt statistilist masintõlget ja neuromasintõlget, kuid üldine suund on neuromasintõlke suunas.

100

Selliste tarkvaratoodete arendamisse kaasatakse lingviste:

Mis on juturobot: 


200

Tõene või väär: neuromasintõlke mootor analüüsib üksikute fraaside asemel kogu lähtelauset

Tõene. 

Kui statistilise masintõlke mootorid vaatavad korraga pigem fraasi või äärmisel juhul lühikest lauset, siis neurotõlke mootor vaatab korraga kogu lauset ning üritab närvivõrkude tööd järele aimates luua mingeid üldistavaid mudeleid, mille põhjal sihtkeelne lause kokku pannakse.


200

Suuliste ja kirjalike tekstide (või ka loomuliku keele) digitaalne kogu, mille abil kogub masin teadmisi keele kohta



Mis on korpus?




200

Euroopa Liidu neuromasintõlkemootor

Mis on eTranslation?

  • High security - all data processed by the system stays within the Commission’s firewalls and can't be seen by outsiders
  • Translates from and into any  official EU language as well as Arabic, Chinese, Icelandic, Japanese, Norwegian, Russian, Turkish and Ukrainian
  • Offers several styles of translation (“domains”) in the fields of EU Formal Language, General Text, Finance and a few more
  • Supports all common office formats, including pdf
  • Can provide tmx or xliff files for professional translators
200

Tõlkija haridusega inimest otsitakse just sellesse ametisse:

Mis on Language Data Analyst

300

"... väike, kollane ja kaanitaoline ja võib-olla kõige arvukam asi Universumis"  tegelane Douglas Adamsi ulmeromaanist "Pöidlaküüdi reisijuht Galaktikas", kelle järgi sai  1997. aastal nime DEC-i ja Systrani-i tõlketeenus

Mis on Babel Fish ehk paabeli kala? (babelfish.altavista.com, hiljem Yahoo! Babel Fish, mis 2012. aasta mais asendati Bing Translatoriga (nüüd Microsoft Translator))

300

Meetod, mis võimaldab süsteemil automaatselt läbi kogemuste õppida ja täiustuda ilma inimese sekkumiseta

Mis on masinõpe? 

Masinõpet kasutatakse nt internetiotsingute vastete leidmisel, kõne tekstiks töötlemisel, näotuvastuses, juturobotites, toodete ja teenuste soovitamiseks e-platvormidel.


300

Selle populaarse masintõlkemootori tasuta versioon kasutab teie tekste neurotõlke arendamiseks

DeepL


300

Tõlkijat otsitakse just sellesse ametisse:

Mis on AI treenimine

400

Tõene või väär: vähem kasutatud keelepaaride puhul tõlgib programm lähtekeele esmalt inglise keelde ning alles seejärel sihtkeelde

Tõene. Eesti keelest võõrkeelde või võõrkeelest eesti keelde tõlkimisel tõlgib Google Translate teksti esmalt inglise keelde ja alles seejärel sihtkeelde. Seega on eesti keele puhul eesti-inglise keelepaar ainus, mida Google’i tõlkeprogrammis kasutada tasuks.

400

Just seesugust "kihilist" õppemeetodit kasutab Google Translate oma neuromasintõlke süsteemi tõlketäpsuse suurendamiseks

Google'i neuromasintõlke (GNMT) süsteem kasutab lähtelausete analüüsimiseks ja tõlkimiseks sügavõppe meetodit. Tõlkeotsuste tegemisele aitavad kaasa tehisnärvivõrgud ja suured andmehulgad. Neurovõrgud võtavad arvesse kogu lause konteksti, soravust, stiili.

400

Selle puudumine vähendab masintõlke usaldusväärsust:


Mis on kontekst.


400

Kui kasutad kliendi tõlketöös ChatGPT abi, tuleb andmete turvalisuse tagamiseks välja lülitada just see säte

Chat history and Training - välja lülitada

500

Just need omadused teevad eesti keele masintõlke ja automaatse keeletöötluse jaoks keeruliseks

Rikas morfoloogia (suur arv käändeid ja pöördeid), vaba sõnajärg (probleemid teema ja reemaga), vaba liitsõnamoodustus, ühend- ja väljendverbid, piiratud paralleelsete tekstide hulk (st vähem tõlkenäiteid kui paljudes suuremates keeltes).

500

Väiksemate keelte (nt põhjasaami) puhul napib tihti andmeid, mille pealt tehisintellekt saaks õppida. Mida teha, kui andmetest ei piisa hea neurotõlkesüsteemi loomiseks? HÕBEVILLAK!

Masintõlkesüsteemi treenitakse mitmes keeles samaaegselt, et parandada tõlkekvaliteeti. Mitmekeelsesse mudelisse valitakse sarnaste mustritega sugulaskeeled (nt soome-ugri keeled). Nii saavad väiksemad keeled (millest on vähem andmeid) suuremate keelte (millest on rohkem andmeid) andmestikust kätte kasulikku teavet.

500

Selle masintõlkemootoriga saab muuhulgas tõlkida ka võro, liivi, põhjasaami ja ersa keelt

Mis on neurotõlge

Tartu Ülikooli keeletehnoloogia uurimisrühma arendatud tõlkemootor

Selle 29 keele hulka kuulub 23 soome-ugri keelt, nende hulgas ka võro, liivi, põhjasaami, ersa, niidumari ja palju muud.

Lisaks tõlkimisele võimaldab süsteem ka veaparandusi, ehk vigase teksti korrigeerimist, kuna on treenitud vaid korrektse keele näidete põhjal.

I good partner. → I am a good partner.
Ma tahab et me laula → Ma tahan, et me laulaksime

https://neurotolge.ee/#info

500

Tõlge, millesse tuleb tõlkijal lisada otsingumootori märksõnad

SEO-tõlge (Search Engine Optimisation)