Hvordan virker OCR arbeid?

Hva er OCR?

Optisk tegngjenkjenning, mer kjent som OCR, er tolkningen av skannede bilder av håndskrevne, skrevet eller trykt tekst til tekst som kan redigeres på en datamaskin. Det finnes ulike komponenter som arbeider sammen for å utføre optisk tegngjenkjenning. Disse elementene omfatter mønster identifikasjon, kunstig intelligens og maskin visjon. Forskning på dette området fortsetter, utvikle mer effektive lese priser og større presisjon.

De to viktigste systemene som brukes til å utføre OCR er "matrix matching" og "-funksjonen utvinning." Matrise tilpasning er den enklere og mer vanlig, i tillegg til de mer begrenset, av de to.

Matrix Matching

Matrix matching (også kjent som mønstergjenkjenning) knytter hva skanneren oppfatter som en karakter med en lagret samling av punktgrafikkmønstre eller konturene av tegn. Når et bilde som svarer til en av disse valgte punktgrafikk innenfor en viss grad av likhet, identifiserer programmet som bildet som tilsvarer klartekst tegn. En tydelig brist av dette systemet er at det bare kan brukes for fonter og størrelser i sitt repertoar.

Feature Extraction

Feature utvinning er også kjent som intelligent tegngjenkjenning (ICR), eller topologisk funksjon analyse. Det er en form for optisk tegngjenkjenning som ikke er avhengig av nøyaktig tilpassing for å sette maler. Programmet søker etter vanlige elementer som åpne plasser, lukkede former, linjer - diagonaler kryssende og så videre.