Tekst til tale fonetikk

Fonetikk er kunsten representerer vokale lyder av tegn og skrifttegn. Stemmegjenkjenning programvare gjør bruk av fonetikken å oversette det talte ord til tekst, eller å oversette teksten til det talte ord.

Funksjon

Teksten til tale-funksjonen er gitt i talegjenkjenning programmer hovedsakelig som en korrekturlesing verktøy, slik at brukeren kan lytte til hva maskinen har tolkes. Hvert program inneholder en database på minst 150.000 ord, slik at det å analysere ord og skjulte dem inn i tekst eller tale. Nye ord kan legges til i databasen til enhver tid.

Opplæring

Talegjenkjenning programvare krever vanligvis en innledende treningsperioden, hvor brukeren snakker inn i en datamaskin innebygd mikrofon eller et headset. Dette gjør at programmet gjøre seg kjent med brukerens stemme mønstre, og sikrer mer nøyaktig oversettelse.

Egenskaper

Tale til tekst fonetikk innebærer å tolke den menneskelige stemme som en bølgeform, en matematisk representasjon av lyd. Ifølge LumenVox talesyntese hjemmeside, talegjenkjenning programvare analysere egenskapene til lydene stammer fra bølgeformen og sammenligne dem med sine egne akustiske modeller.