Pāriet uz saturu

Mašīntulkošana

Vikipēdijas lapa

Mašīntulkošana, saīsināti MT, ir datorlingvistikas apakšnozare, kas nodarbojas ar automatizētu vienā valodā rakstīta teksta tulkošanu citā valodā.

MT programmas atšķirībā no citiem ar datora izmantošanu saistītiem paņēmieniem – datorizētas tulkošanas (computer-assisted translation, computer-aided translation — CAT) un interaktīvas tulkošanas (tulkošanas ar datora palīdzību) – veic tulkošanu ar minimālu cilvēka līdzdalību vai bez tās.

Sākotnēji MT veica primitīvu tulkojamās valodas vārdu aizstāšanu ar atbilstošiem, biežāk lietotās nozīmes vārdiem citā valodā, tomēr ar šādu paņēmienu nav iespējams panākt pieņemamu rezultātu, jo atkarībā no teksta un konteksta, kurā vārds lietots, tam var būt ļoti atšķirīgas nozīmes. Attīstoties nozarei, MT sāka izmantot valodas korpusus[1] un statistikas metodes, kas ļauj ņemt vērā atšķirības valodu tipoloģijā un tulkot, piemēram, frazeoloģismus.

Šodien mašīntulkošanas programmās izmanto iespēju uzstādīt tulkojamā teksta piederību jomai vai profesijai (piemēram, laika ziņas), uzlabot rezultātu, sašaurinot iespējamo aizvietojumu loku. Šī tehnika ir īpaši noderīga jomās, kur tiek izmantota izteikti formāla vai formalizēta valoda. Līdz ar to oficiālu paziņojumu (tekstu) vai juridisku dokumentu mašīntulkojums sniedz labāku rezultātu nekā sarunu vai citu, mazāk standartizētu tekstu, tai skaitā literāru sacerējumu tulkojums.

Laikam ritot, mašīntulkošanas teorētiskās iespējas apspriež gan zinātnieki, gan programmētāji un, piemēram, daži kritiķi uzskata, ka pilnībā automatizēta tulkošana principā nav iespējama.[2]

Populārākās mašīntulkošanas metodes:

  • Likumos balstīta mašīntulkošana — tradicionālā metode, kurā nepieciešamas vārdnīcas un gramatikas likumi. Populārākās sistēmas: Apertium, SYSTRAN, Eurotra.
  • Statistiskā mašīntulkošana — izmanto statistikas metodes.[3] Zināmākās sistēmas: GIZA++ (vārdos balstītu mašīntulkošanas sistēmu izstrādāšanai; jaunākās metodēs tiek izmantota tikai vārdu sastatīšanas nodrošināšanai), Moses (frāzēs balstītu mašīntulkošanas sistēmu izstrādāšanai), AppTek. Daži publiski pieejami statistiskās mašīntulkošanas pakalpojumi ir Google Translate (Google statistisko tulkošanas metodi izmanto kopš 2007. gada), Bing Translator (Microsoft izstrādāts tiešsaistes pakalpojums, kas pieejams no 2009. gada), hugo.lv (Latvijas valsts pārvaldes mašīntulkošanas pakalpojums) un citi.
  • Piemēros balstīta mašīntulkošana — tulkošanu veic pēc analoģijas, izmantojot paralēlus tekstu korpusus.
  • Hibrīdā mašīntulkošana — apvieno statistiskās un likumos balstītās metodes.

Ārējās saites

[labot šo sadaļu | labot pirmkodu]