Runas sintēze

Vikipēdijas lapa

Runas sintēze ir cilvēka runas mākslīga radīšana; process, kurā ģenerē cilvēka balsij līdzīgas skaņas. Datorsistēmu, kuru izmanto šim nolūkam, sauc par runas datoru vai runas sintezatoru, un to var realizēt ar specializētas programmatūras vai aparatūras palīdzību. Šīs sistēmas pārveido valodas rakstisko tekstu runā; citas sistēmas runas atveidošanai izmanto simbolisko lingvistikas reprezentaciju, piemēram, fonētisko transkripciju.

Runas sintēzi var realizēt ar dažādām tehnoloģijām. Populārākās no tām:

  • konkatenatīvā sintēže — izmanto iepriekš ierakstītu elementu vardnīcu, elementus savienojot kopā;
  • formantā sintēze — izmanto aditīvo sintēzi, veidojot tembru, un akustisko modeli;
  • artikulārā sintēze — bāzēta uz cilvēka runas trakta modeļa un artikulācijas procesiem;
  • HMM bāzētā sintēze — bāzēta uz slēptā Markova modeļa, ar kuru modelē runas frekvences spektru (vokālo traktu), pamatfrekvenci (runas avotu) un ilgumu (prosodiju).