Hvordan lese en nettside ved hjelp av Python
Dette vil vise deg hvordan du skal lese en nettside fra en python script gitt en URL.
Bruksanvisning
1 Installer python byggmester herfra. Det er gratis.
http://www.python.org/download/releases/2.5.2/
2 Etter at du har installert Python kan du kjøre det fra startmenyen
Python 2.5 - IDLE (Python GUI)
3 Når programmet åpnes, ser det ut som notisblokk. Velg fil fra menyen øverst og Nytt vindu. Dette vil åpne et nytt tekstvindu som du kan lagre python kode til.
4
Kopier oppfølging kode i det nye vinduet som nettopp åpnet.
import shutil
import os
import tid
import datetime
import math
import urllib
fra matrise import matrise
filehandle = urllib.urlopen ( 'http://www.loothog.com')
for linjer i filehandle.readlines ():
print lines
filehandle.close ()
5 Velg File - Save, og navngi filen alt du vil.
6 Trykk F5 for å kjøre koden din.
For å stoppe programmet fra å kjøre, klikk til første vinduet som åpnes, og velg fra menyen Shell - Restart Shell
7 Du kan lagre alle disse linjene i en tekstfil ved å endre koden til å se slik ut.
minFil = open ( 'test.html', 'w')
for linjer i filehandle.readlines ():
print lines
myFile.write(lines)
myFile.close ()
filehandle.close ()
8
Kanskje du har noen aksjekurser som ser ut som dette
AAAC, D, 20071210,8.2,8.2,8.2,9.5,1000
og du vil få 9,5 tett pris, så kan du dele linjen opp av komma og tilgang kun 9.5 som dette
minFil = open ( 'test.html', 'w')
for linjer i filehandle.readlines ():
section = lines.split(',')
print str(sections[6].strip())
myFile.write(str(sections[6].strip()))
myFile.close ()
filehandle.close ()
Merk: str () konverterer nummeret til en streng og .strip () vil ta bort ekstra blanks på slutten.
Hint
- Linjene etter "for linjer i filehandle.readlines ():" rykkes 5 mellomrom.