Mašīntulkošana
Mašīntulkošana, saīsināti MT, ir datorlingvistikas apakšnozare, kas nodarbojas ar automatizētu vienā valodā rakstīta teksta tulkošanu citā valodā.
MT programmas atšķirībā no citiem ar datora izmantošanu saistītiem paņēmieniem – datorizētas tulkošanas (computer-assisted translation, computer-aided translation — CAT) un interaktīvas tulkošanas (tulkošanas ar datora palīdzību) – veic tulkošanu ar minimālu cilvēka līdzdalību vai bez tās.
Vēsture
[labot šo sadaļu | labot pirmkodu]Sākotnēji MT veica primitīvu tulkojamās valodas vārdu aizstāšanu ar atbilstošiem, biežāk lietotās nozīmes vārdiem citā valodā, tomēr ar šādu paņēmienu nav iespējams panākt pieņemamu rezultātu, jo atkarībā no teksta un konteksta, kurā vārds lietots, tam var būt ļoti atšķirīgas nozīmes. Attīstoties nozarei, MT sāka izmantot valodas korpusus[1] un statistikas metodes, kas ļauj ņemt vērā atšķirības valodu tipoloģijā un tulkot, piemēram, frazeoloģismus.
Šodien mašīntulkošanas programmās izmanto iespēju uzstādīt tulkojamā teksta piederību jomai vai profesijai (piemēram, laika ziņas), uzlabot rezultātu, sašaurinot iespējamo aizvietojumu loku. Šī tehnika ir īpaši noderīga jomās, kur tiek izmantota izteikti formāla vai formalizēta valoda. Līdz ar to oficiālu paziņojumu (tekstu) vai juridisku dokumentu mašīntulkojums sniedz labāku rezultātu nekā sarunu vai citu, mazāk standartizētu tekstu, tai skaitā literāru sacerējumu tulkojums.
Laikam ritot, mašīntulkošanas teorētiskās iespējas apspriež gan zinātnieki, gan programmētāji un, piemēram, daži kritiķi uzskata, ka pilnībā automatizēta tulkošana principā nav iespējama.[2]
Metodes
[labot šo sadaļu | labot pirmkodu]Populārākās mašīntulkošanas metodes:
- Likumos balstīta mašīntulkošana — tradicionālā metode, kurā nepieciešamas vārdnīcas un gramatikas likumi. Populārākās sistēmas: Apertium, SYSTRAN, Eurotra.
- Statistiskā mašīntulkošana — izmanto statistikas metodes.[3] Zināmākās sistēmas: GIZA++ (vārdos balstītu mašīntulkošanas sistēmu izstrādāšanai; jaunākās metodēs tiek izmantota tikai vārdu sastatīšanas nodrošināšanai), Moses (frāzēs balstītu mašīntulkošanas sistēmu izstrādāšanai), AppTek. Daži publiski pieejami statistiskās mašīntulkošanas pakalpojumi ir Google Translate (Google statistisko tulkošanas metodi izmanto kopš 2007. gada), Bing Translator (Microsoft izstrādāts tiešsaistes pakalpojums, kas pieejams no 2009. gada), hugo.lv (Latvijas valsts pārvaldes mašīntulkošanas pakalpojums) un citi.
- Piemēros balstīta mašīntulkošana — tulkošanu veic pēc analoģijas, izmantojot paralēlus tekstu korpusus.
- Hibrīdā mašīntulkošana — apvieno statistiskās un likumos balstītās metodes.
Atsauces
[labot šo sadaļu | labot pirmkodu]- ↑ Daudzvalodu korpusa un mašīntulkošanas infrastruktūras izveide e-pakalpojumu pieejamības nodrošināšanai Arhivēts 2014. gada 31. jūlijā, Wayback Machine vietnē. (latviski)
- ↑ «Matiass Madsens: Mašīntulkošanas ierobežojumi (2010. gads)». Docs.google.com. Skatīts: 2014. gada 1. jūlijā.
- ↑ Angļu-latviešu statistiskās mašīntulkošanas sistēmas izveide: Resursi un pirmie rezultāti
Ārējās saites
[labot šo sadaļu | labot pirmkodu]- Google tulkotājs
- Bing Tulkotājs
- Tildes Tulkotājs Arhivēts 2014. gada 3. septembrī, Wayback Machine vietnē.
Šis ar informācijas tehnoloģijām saistītais raksts ir nepilnīgs. Jūs varat dot savu ieguldījumu Vikipēdijā, papildinot to. |
|