Hvordan bruke Tesseract OCR i Java
Tesseract Optical Character Recognition bibliotekene tilby utviklere en metode for å skanne dokumenter og tekst i et bilde. Du bruker Tesseract bibliotekene til å lagre bilder av dokumenter som du ikke lenger trenger i papirutgave. Du bruker Tesseract biblioteker i Java ved looping gjennom hvert tegn og skrive tegnet til en fil. For å bruke bibliotekene, må du ta med Java navne for OCR-funksjoner.
Bruksanvisning
1 Høyreklikk på Java-filen du vil bruke til å lage OCR dokumentet. Klikk "Åpne med" og velg din foretrukne Java editor.
2 Legg OCR bibliotek navne på toppen av filen. Kopier og lim inn følgende kode til kildekoden filen:
com.tplan.robot.imagecomparison.tesseractocr
3 Lage koden som skanner tegn til filen. For eksempel, loops følgende kode gjennom hvert tegn i en fil og skriver det til en bildefil:
Var linjer = 0
CompareTo method = "tocr" cmparea = "x: 33, y: 2, w: 200, h: 22"
for (i = 1; {i} <{linjer} 1, i = {i} 1) {
Typeline "{_TOCR_LINE {i}}"
}
4 Klikk på Java redaktørens "Lagre" -knappen, og klikk "Kjør" for å kjøre koden i en Java debugger.