Hvordan lese HTML-filer ved hjelp av Java
Lese HTML-filer i Java er ikke annerledes enn å lese tekstfiler. Med mindre formatet på filen er XML, lese en HTML-fil oppnås med en Java-fil objekt. Objektet importerer tekst fra filen og leser linje for linje. Du kan deretter bruke teksten for manipulasjon, eller du kan sende teksten til skjermen. Bruke filen objekt i Java for å lese filer er dyktig med noen få linjer med kode.
Bruksanvisning
1 Importer de nødvendige biblioteker. Bruke filobjekt krever bruk av Java-biblioteker som ikke automatisk importert når du oppretter en ny klasse eller prosjekt. Følgende kode viser deg de bibliotekene som trengs:
import java.io.BufferedInputStream
GÅ
import java.io.DataInputStream
GÅ
import java.io.File
GÅ
import java.io.FileInputStream
GÅ
import java.io.FileNotFoundException
GÅ
import java.io.IOException;
2 Åpne filen og sette opp buffere. Filen objektet må plasseringen av HTML-fil på datamaskinen. Dette kan også være en fil på webserveren. Følgende kode setter en variabel for å åpne filen, og det skaper variabler som skal brukes for Filestream.
File myhtml = new File (\ "C: \\ myHTML.html \")
GÅ
Fileinput fileinput = null
GÅ
BufferedInputStream mybuffer = null
GÅ
Datainput datainput = null;
3 Tildele filinformasjonen til variabler de opprettede. Buffer variabler laste informasjonen inn i minnet for raskere lesing ganger.
fileinput = new Fileinputstream (myhtml)
GÅ
mybuffer = ny BufferedInputStream (fileinput)
GÅ
datainput = new Datainputstream (mybuffer);
4 Lag en løkke som leser filen linje for linje og skriver den til konsollen. Følgende kode leser data så lenge det ikke har nådd slutten av filen stream:
while (datainput.available ()! = 0) {
System.out.println(datainput.readLine())
GÅ
}
5 Lukk filstrøm. Hvis du vil frigjøre minne fra programmet, er det viktig å lukke filen og datastrømmer:
myHTML.close ()
GÅ
mybuffer.close ()
GÅ
datainput.close ();