Mašīntulkošana

Vikipēdijas lapa
Pārlēkt uz: navigācija, meklēt

Mašīntulkošana, saīsināti MT, ir datorlingvistikas apakšnozare, kas nodarbojas ar automatizētu vienā valodā rakstīta teksta tulkošanu citā valodā.

MT programmas atšķirībā no citiem ar datora izmantošanu saistītiem paņēmieniem – datorizētas tulkošanas (computer-assisted translation, computer-aided translation — CAT) un interaktīvas tulkošanas (tulkošanas ar datora palīdzību) – veic tulkošanu bez vai ar minimālu cilvēka līdzdalību.

Vēsture[labot šo sadaļu | labot pirmkodu]

Sākotnēji MT veica primitīvu tulkojamās valodas vārdu aizstāšanu ar atbilstošiem, biežāk lietotās nozīmes vārdiem citā valodā, tomēr ar šādu paņēmienu nav iespējams panākt pieņemamu rezultātu, jo atkarībā no teksta un konteksta, kurā vārds lietots, tam var būt ļoti atšķirīgas nozīmes. Attīstoties nozarei, MT sāka izmantot valodas korpusus[1] un statistikas metodes, kas ļauj ņemt vērā atšķirības valodu tipoloģijā un tulkot, piemēram, frazeoloģismus.

Šodien mašīntulkošanas programmās izmanto iespēju uzstādīt tulkojamā teksta piederību jomai vai profesijai (piemēram, laika ziņas), uzlabot rezultātu, sašaurinot iespējamo aizvietojumu loku. Šī tehnika ir īpaši noderīga jomās, kur tiek izmantota izteikti formāla vai formalizēta valoda. Rezultātā, oficiālu paziņojumu (tekstu) vai juridisku dokumentu mašīntulkojums sniedz labāku rezultātu kā sarunu vai citu, mazāk standartizētu tekstu, tai skaitā literāru sacerējumu tulkojums.

Laikam ritot, mašīntulkošanas teorētiskās iespējas apspriež gan zinātnieki gan programmētāji un, piemēram, daži kritiķi uzskata, ka pilnībā automatizēta tulkošana principā nav iespējama.[2]

Metodes[labot šo sadaļu | labot pirmkodu]

Populārākās mašīntulkošanas metodes:

  • Likumos balstīta mašīntulkošana — tradicionālā metode, kurā nepieciešamas vārdnīcas un gramatikas likumi. Populārākās sistēmas: Apertium, SYSTRAN, Eurotra.
  • Statistiskā mašīntulkošana — izmanto statistikas metodes.[3] Zināmākās sistēmas: GIZA++ (vārdos balstītu mašīntulkošanas sistēmu izstrādāšanai; jaunākās metodēs tiek izmantota tikai vārdu sastatīšanas nodrošināšanai), Moses (frāzēs balstītu mašīntulkošanas sistēmu izstrādāšanai), AppTek. Daži publiski pieejami statistiskās mašīntulkošanas pakalpojumi ir Google Translate (Google statistisko tulkošanas metodi izmanto kopš 2007. gada), Bing Translator (Microsoft izstrādāts tiešsaistes pakalpojums, kas pieejams no 2009. gada), hugo.lv (Latvijas valsts pārvaldes mašīntulkošanas pakalpojums) un citi.
  • Piemēros balstīta mašīntulkošana — tulkošanu veic pēc analoģijas, izmantojot paralēlus tekstu korpusus.
  • Hibrīdā mašīntulkošana — apvieno statistiskās un likumos balstītās metodes.

Atsauces[labot šo sadaļu | labot pirmkodu]

Ārējās saites[labot šo sadaļu | labot pirmkodu]