Hvordan lese en PDF med Java

Hvordan lese en PDF med Java


PDF er en Adobe filformat som står for Portable Document Format. PDF-filer er oftest brukt til å lage dokumenter som ikke kan redigeres på fly; den \ ". doc \" format, for eksempel, kan redigeres av brukeren når den åpnes. Ved hjelp av Java, men du kan lese i PDF-dokumenter, med hjelp fra iText Java biblioteket tilgjengelig fra Lowagie.

Bruksanvisning

1 Naviger til \ "Last ned iText \" linken i Resources nedenfor og klikk \ "Last ned iText-5.0.1.jar \". Husk plasseringen av \ ". Jar \" fil lastet ned.

2 Åpne Eclipse. Gå til \ "Fil \" \ "Ny \" \ "Java Project, \" type \ "MyPdfReader \" som Prosjektnavn og klikk \ "Finish. \"

3 Second-klikk på \ "MyPdfReader \" i Package Explorer (verktøylinjen til venstre) og velg \ "Properties. \"

4 Klikk \ "Java Build-bane \" på venstre og deretter under \ "Libraries \" fanen til høyre, klikk på \ "Legg Eksterne JAR ... \" knappen. Naviger til \ ". Jar \" filen du lastet ned i trinn 1 og klikk \ "OK. \" The iText Library er nå aktivert i Java Project. Vi skal bruke sin PdfReader å lese PDF-filer.

5 Second Klikk MyPdfReader mappen til høyre og velg \ "Ny \" \ "Class. \" Kall det \ "ReadPdf \" og velg \ "skape public static void main metode \" boksen og klikk \ "OK . \ "

6 Velg de tomme ovenfor \ "public class ReadPdf {\" og skriv inn følgende kode:
import java.io.FileOutputStream

import com.itextpdf.text.



importere com.itextpdf.text.pdf.;

7 Velg mellomrom under \ "public static void main (String [] args) {\" og skriv inn følgende linje:
PdfReader leseren = new PdfReader (\ "HelloWorldPdf.pdf \")


Dette kodelinje leser i PDF ligger innenfor prosjektmappen (i dette tilfellet, er det HelloWorldPdf.pdf en test pdf-fil). Etter å ha lest den PDF-filen, har du tilgang til egenskapene for PDF som det er høyde og bredde.

8 Under linjen \ "PdfReader leseren = new PdfReader (\" HelloWorldPdf.pdf \ "); \" skriver du inn følgende kode:

int n = reader.getNumberOfPages();
Rectangle psize = reader.getPageSize(1)

float width = psize.height()

float height = psize.width()

Den variable \ "n \" inneholder nå antall sider av utvalget pdf og variablene \ "width \" og \ "height \" inneholder dens dimensjoner.