Hvordan konvertere en PDF til tekst på Ubuntu

Portable Document Format (PDF) filer har blitt en industristandard dokumentformat som kan brukes når utgiveren av et dokument ønsker å sikre at dokumentets generelle layout og ser vil forbli den samme i alle datamaskiner. Men noen ganger kan de være en plage for sluttbrukeren når sammenlignet med vanlige tekstfiler, så verktøy finnes for å konvertere PDF til tekst på Ubuntu.

Bruksanvisning

1 Åpne terminalen ved å klikke på "Programmer" i menylinjen, og deretter "Tilbehør" og deretter "Terminal". Dette vil åpne Ubuntu kommandolinje terminal, Linux tilsvarer Windows DOS ledetekst skjermen.

2 Skriv inn følgende kommando i terminalen:

pdftotext file.pdf

Erstatt "file.pdf" med navnet på PDF-filen. En fil TXT med samme navn vil bli opprettet i den gjeldende katalogen.

3 Skriv inn følgende for å skrive ut den resulterende teksten:

katt file.txt

Sørg for å sjekke resultatet. PDF til TXT konvertering er unøyaktig i beste fall, og mens det vanligvis fungerer, er noen ganger den resulterende tekstfilen ødelagt.

Hint

  • Det finnes dusinvis av "pdftotext" alternativer tilgjengelige for å la deg spesifisere nøyaktig hvordan konverteringen går. Skriv "man pdftotext" i terminalen for å se disse alternativene.
  • Din suksess i å konvertere PDF til tekst vil variere med hver PDF-fil. Avhengig av oppsettet av PDF-filen, kan det vise seg svært godt eller teksten kan være håpløst virvar. Sjekk alltid resultatet selv før elektronisk distribuere en tekstfil konvertert fra en PDF-fil.
  • Alle Ubuntu-systemer kommer med "pdftotext" installert som en del av "poppler-utils" pakken. Denne pakken er installert som standard på Ubuntu-systemer, men hvis det ikke er installert på din, kan du installere det ved å skrive "sudo apt-get install poppler-utils" i terminalen.