Pāriet uz saturu

Datorlingvistika

Vikipēdijas lapa

Datorlingvistika ir starpdisciplīnu nozare, kas nodarbojas ar dabīgo valodu modelēšanu.[1] Praktiskie galamērķi ir mašīntulkošana, pareizrakstības un gramatikas pārbaudes rīki, runas sintēze un atpazīšana, automatizēta tekstu korpusu valodnieciskā apstrāde, kā arī informācijas izgūšana no tekstiem un tās apkopošana.[2][3]

Datorlingvistikas pirmsākumi meklējami 20. gadsimta 50. gados, kad līdz ar datoru tehnoloģiju attīstību radās pirmie mēģinājumi automatizēt valodu apstrādi. Viens no pirmajiem mērķiem bija mašīntulkošana, īpaši Aukstā kara laikā, kad vajadzēja ātri tulkot tekstus starp angļu un krievu valodu. 1954. gadā Džordžtaunas–IBM mašīntulkošanas eksperiments parādīja, ka ar ierobežotu vārdu krājumu un noteikumu kopumu iespējams panākt primitīvus tulkojumus.

1960.–1970. gados datorlingvistika cieši saistījās ar formālo valodniecību un mākslīgā intelekta pētījumiem, īpaši sintakses un semantikas modelēšanā. 1980. gados parādījās statistiskās metodes, kas balstījās lielos tekstu korpusos, un tas ievērojami uzlaboja mašīntulkošanu un runas atpazīšanu.

21. gadsimta sākumā datorlingvistiku būtiski mainīja neironu tīkli un dziļās mācīšanās metodes, kas ļāva radīt precīzākas un elastīgākas dabīgās valodas apstrādes sistēmas, piemēram, automātisko tulkošanu, virtuālos asistentus un kontekstuālus meklētājus.

  1. «The Association for Computational Linguistics: What is Computational Linguistics?». www.aclweb.org. Skatīts: 2023-03-12.
  2. Oettinger, A. G. (1965-02). "Computational Linguistics". The American Mathematical Monthly 72 (2): 147. doi:10.2307/2313322.
  3. Liz Liddy, Eduard Hovy. «Natural Language Processing». Skatīts: 12.03.2023.