Hvordan å oppdage en CJK Character i Java

Hvordan å oppdage en CJK Character i Java


Oppdager en kinesisk, japansk og koreansk, eller CJK, karakter i Java er enkelt med bruk av visse Java-klasser, for eksempel InputStreamReader og OutputStreamWriter. Disse to klassene sette inn og ut av Unicode fra lokale kodinger, inkludert Big5 og GB2312 kodinger. Kinesisk, japansk og koreansk språk er alle fra Øst-Asia og de er klassifisert som dobbeltbytetegnsett, eller DBCS, språk, noe som betyr at hver av disse språkene vil kreve en omfattende mengde biter til å representere sine dobbeltbyte-tegn.

Bruksanvisning

1 Åpne strengen av Java-kode som du skal validere for tilstedeværelse av CJK tegn. Pass på at du har lagt de nødvendige Java klasser til din Java-program. Bruk Java Swing programmet for å forsikre deg om at du har disse klassene installert.

2 Bruk følgende kode på din Java streng for å gjøre det returnere true hvis String "s" inneholder kinesiske tegn:

public boolean containsChinese (String s) {

for (int i = 0; i <s.length (); i ++) {

if (isJapanese(s.charAt(i)) {

return true;

}

}

return false;

}

3 Sett inn følgende kode i Java streng for å gjøre det returnerer true hvis char "c" er en dobbel-byte tegn:

public boolean isJapanese (char c) {

if (c> = '\ u0100' && c <= '\ uffff') return true;

return false;

// Enklere: retur c> '\ u00ff';

}

4 Bruk koden nedenfor til å lage din søknad returnere true hvis String "s" inneholder noen dobbeltbyte eller CJK tegn:

public boolean containsDoubleByte (String s) {

for (int i = 0; i <s.length (); i ++) {

if (isDoubleByte(s.charAt(i)) {

return true;

}

}

return false;

}

Hint

  • Det er mange tutorials for Java-programmer som du kan prøve gratis. Bli med ulike diskusjonsfora for å søke råd og veiledning fra erfarne Java-brukere.
  • For å vise tegnene på målspråket riktig, sørg for at nettleseren din har de nødvendige fontene for det. Nettleseren din må være HTML 4.0-kompatibel og støtter Basic Multilingual Plane, som er standardisert 16-bits tegnsett som gjenkjenner de fleste språk aktivt brukt i verden.