Mašīntulkošana

Vikipēdijas raksts
Pārlēkt uz: navigācija, meklēt

Mašīntulkošana, saīsināti MT, ir datorlingvistikas apakšnozare, kas nodarbojas ar automatizētu vienā valodā rakstīta teksta tulkošanu citā valodā.

MT programmas atšķirībā no citiem ar datora izmantošanu saistītiem paņēmieniem – datorizētas tulkošanas (computer-assisted translation, computer-aided translation — CAT) un interaktīvas tulkošanas (tulkošanas ar datora palīdzību) – veic tulkošanu bez vai ar minimālu cilvēka līdzdalību.

Vēsture[izmainīt šo sadaļu | labot pirmkodu]

Sākotnēji MT veica primitīvu tulkojamās valodas vārdu aizstāšanu ar atbilstošiem, biežāk lietotās nozīmes vārdiem citā valodā, tomēr ar šādu paņēmienu nav iespējams panākt pieņemamu rezultātu, jo atkarībā no teksta un konteksta, kurā vārds lietots, tam var būt ļoti atšķirīgas nozīmes. Attīstoties nozarei, MT sāka izmantot valodas korpusus[1] un statistikas metodes, kas ļauj ņemt vērā atšķirības valodu tipoloģijā un tulkot, piemēram, frazeoloģismus.

Šodien mašīntulkošanas programmās izmanto iespēju uzstādīt tulkojamā teksta piederību jomai vai profesijai (piemēram, laika ziņas), uzlabot rezultātu, sašaurinot iespējamo aizvietojumu loku. Šī tehnika ir īpaši noderīga jomās, kur tiek izmantota izteikti formāla vai formalizēta valoda. Rezultātā, oficiālu paziņojumu (tekstu) vai juridisku dokumentu mašīntulkojums sniedz labāku rezultātu kā sarunu vai citu, mazāk standartizētu tekstu, tai skaitā literāru sacerējumu tulkojums.

Laikam ritot, mašīntulkošanas teorētiskās iespējas apspriež gan zinātnieki gan programmētāji un, piemēram, daži kritiķi uzskata, ka pilnībā automatizēta tulkošana principā nav iespējama.[2]

Metodes[izmainīt šo sadaļu | labot pirmkodu]

Populārākās mašīntulkošanas metodes:

  • Uz noteikumiem bāzētas — tradicionālā metode, kurā nepieciešamas vārdnīcas un gramatikas noteikumi. Populārākās sistēmas: SYSTRAN, Eurotra, Linguatec.
  • Statistiskā — izmanto statistikas metodes.[3] Zināmākās sistēmas: GIZA++, AppTek, Google statistisko tulkošanas metodi izmanto kopš 2007. gada (Google Translate).
  • Uz piemēriem bāzētas — izmanto paralēlus tekstus abās valodās, tulkošanu veic pēc analoģijas.
  • Hibrīdās — apvieno statistiskās un uz noteikumiem bāzētas metodes.

Atsauces[izmainīt šo sadaļu | labot pirmkodu]

Ārējās saites[izmainīt šo sadaļu | labot pirmkodu]