Hvordan trekke ut tekst fra HTML
En Hypertext Markup Language (HTML-fil) inneholder en rekke elementer, inkludert koder, script og tekst. I noen tilfeller må du isolere tekst fra HTML-dokument, slik at du kan bruke den i andre programmer, som for eksempel en artikkel eller publikasjon. Trekke ut tekst fra en HTML-fil er en oppgave som du kan fullføre i en av flere måter på datamaskinen.
Bruksanvisning
Fra nettleseren
1 Last HTML-filen i nettleseren av valget. Teksten tilgjengelig vises på skjermen som standard.
2 Klikk på "CTRL + A" for å velge all teksten på skjermen og deretter "Ctrl + C" for å kopiere teksten til datamaskinens utklippstavle.
3 Trykk "Ctrl + V" for å lime inn teksten fra HTML-fil til et annet program, for eksempel et Microsoft Word-dokument.
Fra HTML Editor
4 Last inn HTML i Notepad eller HTML-editor av valget. Notisblokk er et vanlig valg tilgjengelig på de fleste datasystemer for gratis.
5 Naviger til <body> -delen av HTML-filen. Klikk på linjen rett etter åpningen <body> -koden og velg alt opp til linjen rett før den avsluttende </ body> -koden.
6 Klikk på "CTRL + C" for å kopiere teksten og deretter laste inn en ny tomt Notisblokk-dokument. Trykk "Ctrl + V" for å lime inn HTML-teksten inn i det nye dokumentet.
7 Gå gjennom den nye Notepad dokumentet og slette koder (som <a href> eller <img> tags) slik at filen bare inneholder grunnteksten.
Bruke programvare
8 Last ned en extractor program til systemet. HTML Text Extractor, for eksempel, er kompatibel med Windows-systemer.
9 Last extractor program og skriv inn webadressen til websiden som inneholder teksten du trenger å trekke ut.
10 Klikk "Hentet Text" på verktøylinjen for å få tilgang bare teksten. Klikk "kopier" for å legge til tekst til utklippstavlen og deretter "Ctrl + V" for å lime det inn i et annet program.