Slik konverterer HTML til tekst i Java

Når du arbeider med Java, kan det være spesielt nyttig for raskt å konvertere eksisterende HTML-kode til brukbar Java-kode. Dessverre, manuelt konvertere fra HTML til Java er en tidkrevende prosess som krever mer busywork enn bok-smarts, fører til at mange programmerere til å bli raskt frustrert. Heldigvis, det er et gratis, open-source HTML-parser for Java som kan brukes til å automatisk konvertere HTML til Java uten problemer. Sette opp parser er ganske enkel, og det skal bare ta en kort stund å lære og mestre.

Bruksanvisning

1 Naviger til NekoHTML nedlastingssiden (se link under Ressurser).

2 Last ned den siste versjonen av nekoHTML parseren.

3 Pakk ut nekoHTML arkivet, deretter legge til filen "nekohtml.jar" til "CLASSPATH" fra den utpakkede nekohtml katalogen.

4 Naviger til Xerces Java parser nedlastingssiden (se link under Ressurser).

5 Last ned den siste versjonen av Xerces parser til den lokale harddisken.

6 Pakk ut "Xerces-J-bin.2.9.1" arkiv. Deretter legger filen "xercesImpl.jar" til "CLASSPATH" fra den utpakkede Xerces katalogen. Når begge .JARs er riktig lagt til CLASSPATH, bør du være i stand til å analysere noen HTML-kode ved behov.

Hint

  • Hvis du støter på problemer med å bruke parser, at du har pakket ut JAR-filene til riktig sted, og at filen banen i Java er riktig.