Hvordan lese HTML-filer ved hjelp av Java

Lese HTML-filer i Java er ikke annerledes enn å lese tekstfiler. Med mindre formatet på filen er XML, lese en HTML-fil oppnås med en Java-fil objekt. Objektet importerer tekst fra filen og leser linje for linje. Du kan deretter bruke teksten for manipulasjon, eller du kan sende teksten til skjermen. Bruke filen objekt i Java for å lese filer er dyktig med noen få linjer med kode.

Bruksanvisning

1 Importer de nødvendige biblioteker. Bruke filobjekt krever bruk av Java-biblioteker som ikke automatisk importert når du oppretter en ny klasse eller prosjekt. Følgende kode viser deg de bibliotekene som trengs:
import java.io.BufferedInputStream

import java.io.DataInputStream

import java.io.File

import java.io.FileInputStream

import java.io.FileNotFoundException

import java.io.IOException;

2 Åpne filen og sette opp buffere. Filen objektet må plasseringen av HTML-fil på datamaskinen. Dette kan også være en fil på webserveren. Følgende kode setter en variabel for å åpne filen, og det skaper variabler som skal brukes for Filestream.
File myhtml = new File (\ "C: \\ myHTML.html \")

Fileinput fileinput = null

BufferedInputStream mybuffer = null

Datainput datainput = null;

3 Tildele filinformasjonen til variabler de opprettede. Buffer variabler laste informasjonen inn i minnet for raskere lesing ganger.
fileinput = new Fileinputstream (myhtml)

mybuffer = ny BufferedInputStream (fileinput)

datainput = new Datainputstream (mybuffer);

4 Lag en løkke som leser filen linje for linje og skriver den til konsollen. Følgende kode leser data så lenge det ikke har nådd slutten av filen stream:
while (datainput.available ()! = 0) {

System.out.println(datainput.readLine())

}

5 Lukk filstrøm. Hvis du vil frigjøre minne fra programmet, er det viktig å lukke filen og datastrømmer:
myHTML.close ()

mybuffer.close ()

datainput.close ();