Hvordan trekke ut tekst fra HTML

En Hypertext Markup Language (HTML-fil) inneholder en rekke elementer, inkludert koder, script og tekst. I noen tilfeller må du isolere tekst fra HTML-dokument, slik at du kan bruke den i andre programmer, som for eksempel en artikkel eller publikasjon. Trekke ut tekst fra en HTML-fil er en oppgave som du kan fullføre i en av flere måter på datamaskinen.

Bruksanvisning

Fra nettleseren

1 Last HTML-filen i nettleseren av valget. Teksten tilgjengelig vises på skjermen som standard.

2 Klikk på "CTRL + A" for å velge all teksten på skjermen og deretter "Ctrl + C" for å kopiere teksten til datamaskinens utklippstavle.

3 Trykk "Ctrl + V" for å lime inn teksten fra HTML-fil til et annet program, for eksempel et Microsoft Word-dokument.

Fra HTML Editor

4 Last inn HTML i Notepad eller HTML-editor av valget. Notisblokk er et vanlig valg tilgjengelig på de fleste datasystemer for gratis.

5 Naviger til <body> -delen av HTML-filen. Klikk på linjen rett etter åpningen <body> -koden og velg alt opp til linjen rett før den avsluttende </ body> -koden.

6 Klikk på "CTRL + C" for å kopiere teksten og deretter laste inn en ny tomt Notisblokk-dokument. Trykk "Ctrl + V" for å lime inn HTML-teksten inn i det nye dokumentet.

7 Gå gjennom den nye Notepad dokumentet og slette koder (som <a href> eller <img> tags) slik at filen bare inneholder grunnteksten.

Bruke programvare

8 Last ned en extractor program til systemet. HTML Text Extractor, for eksempel, er kompatibel med Windows-systemer.

9 Last extractor program og skriv inn webadressen til websiden som inneholder teksten du trenger å trekke ut.

10 Klikk "Hentet Text" på verktøylinjen for å få tilgang bare teksten. Klikk "kopier" for å legge til tekst til utklippstavlen og deretter "Ctrl + V" for å lime det inn i et annet program.