Slik konverterer PDF til OCR

Slik konverterer PDF til OCR


Når et trykt dokument skannes og lagres i PDF-format, ikke en datamaskin ikke vet forskjellen mellom det skannede tekstside og et fotografi. Dermed kan du ikke søke etter eller velge en hvilken som helst tekst på siden for å kopiere og lime inn. Hvis du ønsker å søke eller velge tekst, må du kjøre optisk tegngjenkjenning (OCR) på dokumentet. Adobe Acrobat Professional gir denne funksjonaliteten, men den frie versjonen av Adobe Acrobat ikke. Hvis du ikke har Acrobat Professional, vær oppmerksom på at andre enn Acrobat Professional programvare finnes for å kjøre OCR på en PDF-dokument, og kan finnes ved å søke på nettet.

Bruksanvisning

Kjør Optical Character Recognition (OCR) på et PDF-dokument

1 Last Adobe Acrobat Professional. OCR-funksjonen i Acrobat Professional er ikke tilgjengelig via web browser plug-in, så lasting av selve programmet er nødvendig.

2 Legg i en PDF-dokument med tekst som du ikke kan velge å kopiere og lime inn. Slike dokumenter vanligvis er produsert ved å skanne et dokument og lagre dokumentet i Adobe Acrobat PDF-format. (Se Ressurser for en prøve dokument, hvis du ønsker å øve med en.)

3 Slik konverterer PDF til OCR


Kjør OCR på dokumentet. I Adobe Acrobat Professional, klikker du på "dokument" -menyen, velg deretter "OCR tekstgjenkjenning" og deretter "Gjenkjenn tekst med OCR."

4 Slik konverterer PDF til OCR


Velg gjeldende OCR alternativer. Når du klikker "Gjenkjenn tekst med OCR," et nytt vindu vil dukke opp som ber deg velge sideområdet der du vil kjøre OCR. Du kan kjøre OCR på hele PDF-filen, eller du kan begrense OCR anerkjennelse til bare noen få sider. Når du velger hvor mange sider som du ønsker å kjøre OCR, klikker du på "OK". Acrobat Professional vil nå begynne å gjenkjenne teksten på sidene av dokumentet.

5 Slik konverterer PDF til OCR


Søk etter tekst når OCR er fullført, og kopiere og lime inn tekst på samme måte som du kan med en PDF destillert fra Microsoft Word. Vær imidlertid oppmerksom på at OCR-teknologi er ikke perfekt. OCR kan ikke riktig gjenkjenne visse ord og kan gå glipp av noen tekst helt. OCR fungerer best med perfekt klare bilder av tekst, noe som ikke alltid er mulig med skannede dokumenter.