Hvordan bruke Tesseract OCR i Java

July 16

Tesseract Optical Character Recognition bibliotekene tilby utviklere en metode for å skanne dokumenter og tekst i et bilde. Du bruker Tesseract bibliotekene til å lagre bilder av dokumenter som du ikke lenger trenger i papirutgave. Du bruker Tesseract biblioteker i Java ved looping gjennom hvert tegn og skrive tegnet til en fil. For å bruke bibliotekene, må du ta med Java navne for OCR-funksjoner.

Bruksanvisning

1 Høyreklikk på Java-filen du vil bruke til å lage OCR dokumentet. Klikk "Åpne med" og velg din foretrukne Java editor.

2 Legg OCR bibliotek navne på toppen av filen. Kopier og lim inn følgende kode til kildekoden filen:

com.tplan.robot.imagecomparison.tesseractocr

3 Lage koden som skanner tegn til filen. For eksempel, loops følgende kode gjennom hvert tegn i en fil og skriver det til en bildefil:

Var linjer = 0
CompareTo method = "tocr" cmparea = "x: 33, y: 2, w: 200, h: 22"
for (i = 1; {i} <{linjer} 1, i = {i} 1) {
Typeline "{_TOCR_LINE {i}}"
}

4 Klikk på Java redaktørens "Lagre" -knappen, og klikk "Kjør" for å kjøre koden i en Java debugger.