Hva er Tale til tekst?

Hva er Tale til tekst?


En av de mange anvendelser av talegjenkjenning programvare er å ta diktat. Mens enheter som kan erkjenner stemmekommandoer har eksistert i noen form i flere tiår, programvare sofistikert nok til å gjenkjenne et bredt utvalg av talte ord, konvertere dem til tekst, og bruke dem til et dokument er en relativt ny utvikling, og omfanget av teknologi fortsatt begrenset. Men en rekke produkter for både generelle og profesjonelle brukere (som advokater og leger) som finnes på markedet.

Hvordan tale-til-tekst programvare fungerer

Tale-til-tekst dikterings programvaren utfører to grunnleggende funksjoner. Først registrerer programvaren en vokal kommando via mikrofon, deretter utfører en funksjon (for eksempel åpne en nettleser eller utnytte et ord) som den er programmert til å assosiere med lyden. Denne funksjonen utføres av alle talegjenkjenning programvare. Diktat programvare, derimot, har en ekstra funksjon: å forsøke å matche en spoken word med en skriftlig motstykke lagret i sitt vokabular. Hvis en kamp blir funnet, vil programmet så går automatisk ordet inn i kroppen av en e-post, tekstdokument, eller en nettside.

Bruker

Stemmegjenkjenning programvare generelt, og tale-til-tekst-programmer i særdeleshet, er spesielt nyttig for personer med funksjonshemminger eller skader som ikke kan bruke et tastatur effektivt, hvis i det hele tatt. I tillegg har folk vanligvis snakker i et raskere tempo enn de skriver, noe som gjør tale-til-tekst diktat en mer effektiv bruk av ens tid i teorien. Journalister, tekstforfattere, og kreative forfattere kan finne en hands-free setup frigjørende, som tillater dem å komponere en skriftlig stykke uten å avlede sitt fokus mot å skrive.

Maskinvare og programvare

Mens spesifikke maskinvarekrav for tale-til-tekst-programvare varierer etter merke, alle programmer krever en stasjonær eller bærbar datamaskin som kjører et nyere operativsystem, samt mikrofon eller headset. Sistnevnte skal inneholde en innebygd støyfilter, som ambient lyd kan hemme programvarens ytelse. Programmer som brukes i forbindelse med tale-til-tekst, for eksempel tekstbehandling programvare og nettlesere, må være i overensstemmelse med tale-til-tekst-programvare.

begrensninger

I dag kan tale-til-tekst-programvare bare gjenkjenne et endelig antall ord som programmerere har inkludert i sitt vokabular. Noen programmer, men tillater brukere å lage makroer som kan legge til nye ord og tilhørende vokal kommandoer til leksikonet. I tillegg til problemet med støy fra omgivelsene påvirker ytelsen, kan brukere med tunge utenlandske eller regionale aksenter være ute av stand til å bruke tale-til-tekst-programvare som selges i USA. Mange programmer må være "opplært" til å gjenkjenne den enkelte brukerens stemme, så endringer i tonehøyde og snakke hastighet (slik som de som er forårsaket av en sår hals, for eksempel) kan føre til diktering feil eller krever at brukeren å omskolere programvaren.

produkter

En rekke tale-til-tekst diktering programmer er tilgjengelig for gratis eller kommersielt via elektroniske distributører og programvare forhandlere. To av de mest ekspansive produktlinjer er Nuance Communications 'Dragon (PC) og Dikter / Scribe (Macintosh) serie. The Dragon serien inkluderer programvare som er beregnet for bruk av virksomheten, juridiske og medisinske fagfolk.