Hvordan oppdage Flerbytetegn i Java

Når du arbeider med Java Strenger som inneholder flerbytetegn, er det nødvendig å bruke funksjoner som støtter multibyte-tegn og til å laste et passende tegnsett for å vise dem. Flerbyte kodinger som UTF-8, er nyttig når du trenger å lagre tegn i ikke-engelske språk, for eksempel japansk og kinesisk, som standard tegnsettet ikke støtter. Java String og karakter klasser kan inneholde flerbytetegn, men det er ingen enkel innebygd funksjon for å informere deg om de gjør eller ikke. For å oppdage flerbytetegn, må du manuelt sløyfe gjennom hvert tegn i String og sjekke om noen tegn inneholde mer enn en enkelt byte.

Bruksanvisning

1 Åpne Java-filen med en editor som NetBeans, Eclipse eller JBuilder X.

2 Erklærer variablene som er nødvendige for å detektere flerbytetegn ved å legge til følgende kode på toppen av funksjon:

char [] c_array;

String c_string;

byte [] c_byte_array;

boolsk resultat;

String str;

3 Initialisere "str" ​​variabel med en tekstverdi ved å legge til følgende kode i funksjon:

str = "sample string tekst";

4 Loop gjennom hver karakter, og sjekke om det er multibyte ved å legge til følgende kode i funksjon:

c_array = str.toCharArray ();

Resultatet = false;

for (char c: c_array)

{

c_string = Character.toString (c);

c_byte_array = c_string.getBytes ( "UTF-8");

if (c_byte_array.length> 1)

{

System.out.println("Detected a multibyte character.");

Resultatet = true;

gå i stykker;

}

}

if (! resultat)

System.out.println ( "Ikke oppdage eventuelle multibytetegn.");

Sløyfen konverterer hvert tegn i en streng. Den konverterer deretter String inn en byte array. Til slutt, sjekker den lengden av byte array. En lengde som er større enn en indikerer en multibyte karakter til stede i strengen.

5 Lagre Java-filen, kompilere og kjøre programmet for å søke en streng for multibytetegn.