Hvordan lese en nettside ved hjelp av Python

Dette vil vise deg hvordan du skal lese en nettside fra en python script gitt en URL.

Bruksanvisning

1 Installer python byggmester herfra. Det er gratis.

http://www.python.org/download/releases/2.5.2/

2 Etter at du har installert Python kan du kjøre det fra startmenyen

Python 2.5 - IDLE (Python GUI)

3 Når programmet åpnes, ser det ut som notisblokk. Velg fil fra menyen øverst og Nytt vindu. Dette vil åpne et nytt tekstvindu som du kan lagre python kode til.

4 Hvordan lese en nettside ved hjelp av Python
Kopier oppfølging kode i det nye vinduet som nettopp åpnet.

import shutil
import os
import tid
import datetime
import math
import urllib
fra matrise import matrise

filehandle = urllib.urlopen ( 'http://www.loothog.com')

for linjer i filehandle.readlines ():

print lines

filehandle.close ()

5 Velg File - Save, og navngi filen alt du vil.

6 Trykk F5 for å kjøre koden din.

For å stoppe programmet fra å kjøre, klikk til første vinduet som åpnes, og velg fra menyen Shell - Restart Shell

7 Du kan lagre alle disse linjene i en tekstfil ved å endre koden til å se slik ut.

minFil = open ( 'test.html', 'w')
for linjer i filehandle.readlines ():

print lines
myFile.write(lines)

myFile.close ()
filehandle.close ()

8 Hvordan lese en nettside ved hjelp av Python


Kanskje du har noen aksjekurser som ser ut som dette
AAAC, D, 20071210,8.2,8.2,8.2,9.5,1000

og du vil få 9,5 tett pris, så kan du dele linjen opp av komma og tilgang kun 9.5 som dette

minFil = open ( 'test.html', 'w')
for linjer i filehandle.readlines ():

section = lines.split(',')
print str(sections[6].strip())
myFile.write(str(sections[6].strip()))

myFile.close ()
filehandle.close ()

Merk: str () konverterer nummeret til en streng og .strip () vil ta bort ekstra blanks på slutten.

Hint

  • Linjene etter "for linjer i filehandle.readlines ():" rykkes 5 mellomrom.