Hvordan konvertere en PDF til HTML med Ubuntu

Hvordan konvertere en PDF til HTML med Ubuntu


Det er flere måter å forsøke å endre en PDF-fil i en HTML. Husk, vil det ferdige produktet vil sannsynligvis ikke se like bra som originalen. Portable Document Format er ikke lett omgått. HTML virker ikke med tekst og bilder i helt samme måte som PDF-filer gjør, spesielt komplekse, men her er noen måter å forsøke det.

Bruksanvisning

3 Metoder

1 Den enkleste måten er å gå til Adobes nettsted og laste opp PDF. Sannsynligvis på grunn av utslett av programvare blir markedsført for å gjøre nettopp dette, Adobe tilbyr det gratis. Alt du trenger å gjøre er å fylle inn noen blanks, klikker du på en knapp, og du er i gang.

http://www.adobe.com/products/acrobat/access_onlinetools.html

2 En annen måte er å bruke en kjekk liten verktøy kalt Bilde Magick. Det er lett å finne i Synaptic. Last den ned, velger du den fra "åpne med" -menyen, og "lagre som" html. Den eneste henge opp med det er at du bare kan gjøre én side om gangen.

3 Den siste måten er å bruke et lite program som heter pdftohtml. For å gjøre dette må du bruke terminalen for å sørge for at poppler-utils er installert.

sudo aptitude install poppler-utils

Programmet installeres automatisk, og så må du navigere til katalogen som PDF-fil er plassert. Når du er der, er alt du trenger å gjøre Type:

pdftohtml -c [filnavn] .pdf [filnavn] .html

Det ferdige produktet er ikke mye forskjellig fra det som er gitt deg av Adobes hjemmeside, men du vil få støtte åpen kildekode ved å bruke det!

Hint

  • Den eneste andre måten (og beste) er å trekke ut teksten (vanligvis kan du kopiere og lime den inn), og deretter bildene inn i din favoritt HTML editor, som NVU eller et tekstdokument i OpenOffice.org. Når alt er plassert slik du vil, kan du "lagre som" en HTML eller XHTML. Du får en bedre ferdig produkt, men du vil nesten bli gjenskape hjulet mens du er i gang. Hvis du bruker The Gimp, kan du lagre PDF-filen som et bilde. Selv teksten blir en del av bildet. Men du kan da sette det hele inn i et HTML-dokument.
  • Det er ikke en ett-trinns prosess ofte, og det er ikke alltid pen, men disse metodene fungerer. Med mindre PDF-filer er svært kompleks, bør du få en brukbar ferdig produkt.