Slik formaterer du en parser i et Java String

Parsing en streng betyr å analysere det for bestemte forekomster av tegn eller ord. Du kan analysere en streng i Java ved å opprette et skilletegn - et sett med tegn som kalles "tokens" som identifiserer hvor du skal bryte opp strengen - og deretter ringer Java "split" funksjon som en parser. Denne funksjonen bruker skille å bryte opp strengen og lagre resultatene i en streng array. Den delte funksjonen lar deg bryte strengen ved hver forekomst av et skilletegn, eller alternativt kan du angi et maksimalt antall pauser. Lær ins og ut av syntaks, noen ganger referert til som formatering, som gjør det mulig å utnytte denne kraftige funksjonen i Java.

Bruksanvisning

1 Skriv inn følgende kode:

String myString = "Dette er strengen jeg ønsker å analysere";

Denne koden skaper en strengvariabel kalt "myString" som du ønsker å dele med ditt parser.

2 Skriv inn følgende kode:

String delimiter = "[i]";

Dette skaper en streng som du vil bruke som skilletegn, noe som indikerer tegnene du vil bruke som tokens å bryte opp analyseres streng. I dette eksempelet bruker du bare en liten "i". Store bokstaver "I" vil ikke bli inkludert i analysen prosessen.

3 Skriv inn følgende kode:

String [] myParsedString = myString.split (skilletegn);

Denne linjen analyserer strengen, ved hjelp av skilletegn for å bryte den opp. De hakeparentes etter "String" indikerer at du ønsker å opprette en matrise for å lagre resultatene. Verdien av "myParsedString" etter henrettelsen er ( "Th", "s", "s str", "ng Jeg ønsker å analysere").

4 Skriv inn følgende kode:

String [] myParsedString = myString.split (skilletegn, 3);

Denne linjen analyserer strengen på samme måte som forhåndsvisninger eksempel, bortsett fra det begrenser rekke resultatet til tre verdier, ignorerer eventuelle forekomster av skilletegn etter den tredje. Verdien av "myParsedString" etter henrettelsen er ( "Th", "s", "s strengen jeg ønsker å analysere").

Hint

  • Du kan bruke så mange tegn som du vil ha som din skilletegn. For eksempel skrive "[aeiou]" bruker hver vokal som skilletegn, eller "[,,. () ?!]" Vil bruke de angitte skilletegn og et mellomrom. Hvis du setter et plusstegn (+) etter at hakeparenteser, og gjenta forekomster av samme skilletegn vil bli behandlet som en pause punkt. For eksempel, hvis "tre" er strengen, vil skilletegn "[o]" behandler de to o-tallet som separate, mens "[o] +" behandler dem som én.