OCR Dokumenter og TIFF-feil

OCR Dokumenter og TIFF-feil


Den Tagged Image File Format, eller TIFF, fungerer som et hyppig valg for lagring ukomprimerte bitmap-filer, inkludert bilder ervervet fra skanning trykksaker. Du kan opprette TIFF-filer og kjøre Optical Character Recognition på sider av typen som du ønsker å fange opp så levende tekst. Hvis TIFF-filen ikke oppfyller OCR spesifikasjoner, viser OCR-programvare en feil advarsel om at filen ikke kan behandles på riktig måte eller i det hele tatt.

TIFF Komprimering

TIFF-formatet kan du bruke lossless bilde komprimering når du lagrer dokumenter i et program som inneholder støtte for filkomprimering ordninger. Disse alternativene kan redusere størrelsen på filen, men ikke alle OCR-programmer støtter alle, eller noen, typer TIFF-komprimering. For best resultat, lagre TIFF uten komprimering for å gjøre dem så enkelt å bruke som mulig.

Lav oppløsning

Hvis du er kjent med oppløsningen som skal brukes for punktgrafikk på websider, kan du lurer på hvorfor en 72-piksel per tomme fil som ser bra ut når du ser den i en nettleser produserer dårlig kvalitet resultater i OCR-programmet. Det er fordi OCR-programvaren trenger en fil som vier nok piksler til hver tekst karakter å gjøre det gjenkjennelig med algoritmer som behandler skanner. For best resultat, trenger du minst en 150 ppi scan, om ikke høyere. Åpning av en 72-ppi skanning og resampling det til 300 ppi bare gjør filen større uten å forbedre bildekvaliteten. For best resultat, start med høy oppløsning eller skanne å oppnå det.

Crooked Images

Det er vanskelig å sette et stykke papir på bilde dekket av en skanner uten arket drivende litt skjevt på den glatte glassoverflaten. De øyeblikkene du tilbringer reposisjonering arket slik at du kan få en god kvalitet scan betale seg i bedre OCR resultater. Selv en skarp, klar krokete scan setter en større belastning på OCR-program enn en som er fanget rett opp og ned. For best resultat, lavere skannerens lokk sakte slik bevegelse i luften ikke vil forstyrre din papir.

andre hensyn

Avhengig av OCR-programmet du bruker, kan det hende du støter på feilmeldinger fordi TIFF-filer bruker en fargemodus som OCR-programvaren ikke støtter. For eksempel, hvis du har fanget en høy oppløsning, 16-bits RGB-fil for bruk i en retusjering prosjekt, kan det hende at OCR-programmet balk på størrelsen på filen eller dens bitdybde. Skanninger av sider som inneholder fotografier eller tegninger bevise plagsom for noen OCR-programvare, som kan presentere en feilmelding som gjenspeiler innholdet på siden, ikke filformatet. Til slutt, hvis skanningen representerer tekst på farget ark, kan du ha problemer fange denne teksten fordi den mangler tilstrekkelig kontrast mot bakgrunnen.