Problemer med stemmegjenkjenning programvare

July 30

Stemmegjenkjenning programvare er programvare som gjør at en datamaskin til å gjenkjenne hva en bruker sier og reagerer deretter. Programvaren fungerer ved å identifisere de lydmønstre som brukeren produserer og assosiere hvert mønster med en bestemt oppføring i sin database. For å illustrere, stemmegjenkjenning programvare som brukes for diktering kan erkjenne at en bestemt lyd mønster tilsvarer sin database oppføring for "hei." Når programvaren mottar dette mønsteret gjennom en mikrofoninngang, tilgang til programvare databasen og returnerer "hallo" i teksten som det er å skrive for brukeren.

Brukere snakke inn i en mikrofon for å bruke stemmegjenkjenning programvare.

Historie

Teknologi utviklet for å gjenkjenne det talte ord og bruke informasjonen som meningsfulle data til en datamaskin dukket opp så tidlig som i 1940 i begynnelsen av forskning av AT & T Bell Laboratories. Men etterspørselen etter bruk av stemmegjenkjenning programvare som forbruker verktøy begynte å vokse på 1990-tallet. Computer leverandørene begynte å innlemme stemmegjenkjenningsprogrammer i operativsystemer for personlige datamaskiner tilgjengelig for hjemmebrukere og bedrifter, for eksempel, med innføringen av talegjenkjenning evner i Windows XP i 2001.

typer

Stemmegjenkjenning programvare er tilgjengelig for forbrukere som frittstående programmer og som en del av noen operativsystemer. Microsoft-operativsystemer som Windows Vista innlemme talegjenkjenning teknologi som kan utføre funksjoner, som å ta diktat, samt å utføre bestemte datamaskiner kommandoer, for eksempel åpning og lukking dokumenter. Specialized talegjenkjenning programvarepakker kan tjene til å gjøre det mulig diktat eller å tillate talestyring av bestemte programmer.

Egenskaper

Sofistikert stemmegjenkjenning programvare tilbyr funksjoner som gjør at programvare for å lære tale mønstre av sine brukere. Fordi individer uttale bestemte ord annerledes, jo mer informasjon som talegjenkjenning programvare har om en bestemt bruker tale, jo bedre kan gjenkjenne hva brukeren sier til enhver tid, og færre feil programvaren gjør i transkribere tale eller utføre kommandoer.

problemer

Stemmegjenkjenningsprogrammer begynner med en database med forhåndsprogrammerte lydmønstre. Imidlertid varierer faktiske bruker tale. En brukers uttalen av et gitt ord kan endres, og kvaliteten på mikrofonen samle lyd mønstre kan være dårlig, og omgivelsesstøy kan alle endre lyden mønster for en bestemt ord. Stemmegjenkjenning programvare fungerer best etter at programvaren har samlet data om hver brukers tale mønstre. Dette betyr at programvaren har en innledende læringskurve; programvaren blir mest effektive med tiden og i utgangspunktet gjør mange feil.

fordeler

Når brukerne er i stand til å overvinne problemene knyttet til programvaren, kan det transkribere en brukere tale raskt, noe som kan være nyttig for brukere som skriver sakte eller som ikke klarer å skrive eller på annen måte bruke en datamaskin tastatur. Brukere som lider av slitasjeskader i forbindelse med langvarig bruk av tastaturet kan erstatte talegjenkjenning diktering for alle eller noen av sine keyboarding oppgaver.