Regular Expressions å matche et XML-element

Regular Expressions er en kraftig metode for å analysere tekst; Dette inkluderer å finne XML-elementer i koden. Når du har spesielt store filer av noe slag, finne tekst i dem manuelt kan være svært tidkrevende. Regular Expressions tillate deg å automatisere prosessen, i skriptspråk som Perl, for å spare tid. Regulære uttrykk er ikke begrenset til Perl, men hvert språk som implementerer dem har en litt annen syntaks.

enkel

Lag din vanlige uttrykk. For eksempel, hvis din XML element var "bokhandel" så du vet åpningen tag er "<bokhandel>" og for å matche det, din vanlige uttrykk ville se slik ut:

<Bokhandel>

Siden kampen må være nøyaktig, ikke din vanlige uttrykket ikke trenger å ta høyde for ulike variabler eller noe utenom det vanlige.

Sammenkoblede tagger

Lag et vanlig uttrykk som vil matche både start- og sluttkoder for ditt XML-element. Siden vi fortsatt bruker "bokhandel" her, ville det vanlige uttrykket ser slik ut:

<Bokhandel> | </ bokhandel>

Dette vil matche både åpning og lukking koder for ditt element.

varierte tagger

Lag et vanlig uttrykk som vil matche XML-elementer som deler lignende navn. Hvis du hadde en rekke "bokhandel" elementer for å matche, kan din vanlige uttrykket ser slik ut:

<Bokhandel [0-9] *>

Dette vil med noen åpning "bokhandel" elementer, inkludert de som har tall på dem. Hvis du ønsket å også matche slutter kodene, kan du utvide uttrykket:

<bokhandel [0-9]> | </ bokhandel [0-9]>

vage tagger

Lag et vanlig uttrykk som vil matche ethvert XML-element med en understrek. Det er en god idé å lage elementer beskrivende bruke tegnet "_" hvis du kan. Uttrykket vil se slik ut:

<[a] + [0-9] _ [a] + [0-9]>

Dette uttrykket vil matche enhver XML-element som har en understrekning, samt noen tall etter enten prefikset eller suffikset. Hvis du ønsket å lage et regulært uttrykk for å finne noen XML element i det hele tatt, kan du bruke:

<[A] + [0-9] *>

Dette uttrykket vil matche enhver XML element, også de med tall. Det er ingen måte å skille mellom XML-elementer og andre innebygde koder Men siden et XML-element kan bli navngitt noe som ikke begynner med et tall. Du må opprette en mer spesifikk vanlig uttrykk for å finne disse kodene. Dette kan gjøres hvis du bruker en navneskjema, som understrek eksempel tidligere, med alle XML-elementer.