Hvordan sette opp en parser
Tekst parsing verktøy finnes for systemadministratorer og webdesignere som trenger å søke enorme mengder tekst for å bestemme strukturen og organiseringen av datamaskinen, system skript eller mark-up dokumenter. Rask og skitne SED og Perl-skript bygget rundt regulære uttrykk er ofte nok for enkle jobber, men analyse av komplekse XML-dokumenter krever en mer robust verktøy, for eksempel programmeringsspråket Python er ElementTree bibliotek.
Bruksanvisning
1 Start en terminal sesjon eller, hvis du foretrekker det, åpner Python Integrated Development Environment, kjent som IDLE, som kan finnes i Python mappe på C-stasjonen (Windows) eller Programmer-mappen (Mac). Sjekk din versjon av Python ved å skrive python -V på kommandolinjen. ElementTree er en del av Python standard bibliotek som av Python 2.5. Hvis du har Python 2.4 eller tidligere, må du laste det ned fra hoved Python siden.
2 Bestem hvilken type data som er kodet i et XML-dokument ved å lese roten tag. På kommandolinjen, legger ElementTree og dens analysere funksjon med følgende kommando:
fra elementtree.ElementTree import parse
3 Finn filen du ønsker å analysere og notere sin vei i forhold til den av Python tolk, eller bare flytte filen til Dokumenter-mappen. Sett en variabel for filen, kan du lese den inn i minnet og oppdage hva slags data filen inneholder med følgende kommando:
treet = ElementTree (file = filnavn)
elem = tree.getroot ()
print elem
Dette vil avsløre hvilken type data som er kodet i XML-dokumentet.