Hvordan oppdage CJK i Java

Hvordan oppdage CJK i Java


Siden Java programmeringsspråk er en mye brukt, åpen kildekode-teknologi, innlemmelse og integrering av fremmedspråk i programmet er ganske vanlig, for eksempel kinesisk, japansk og koreansk (CJK.) Disse språkene bruke spesielle tegn og bilder som skiller seg fra den engelske alfabetet bokstaver, derfor er det nødvendig å bruke en spesiell tredjepartsverktøy, for eksempel CJK Key programvare, for å dekode dem i Java. Påvisning av disse tegnene kan også gjøres ved å bruke visse Java-klasser: InputStreamReader og OutputStreamWriter.

Bruksanvisning

1 Last ned og installer Java Runtime Environment (JRE) til systemet fra Java.com. JRE vil gjøre deg i stand til å kjøre CJK Key programmet og laste Java applet automatisk, som vil be deg om å oppgi brukernavn og passord CJK. Du må registrere hvis du er en førstegangsbruker av KEY server.

2 Skriv inn ønsket påloggingsnavn, passord, virkelige navn og e-postadresse, og deretter trykke på "Send" for å fullføre KEY applet registrering. Du må også laste ned Microsoft CJK fonter å jobbe med kinesisk, japansk og koreansk. De nødvendige kinesiske skrifter nemlig Pinyin med Toner og kinesiske skrifttype, vil automatisk bli gitt av KEY programvare.

3 Skriv inn følgende koder for å automatisere oppdagelsen av CJK-tegn i Java-strenger.

Koden nedenfor vil returnere "true" dersom strengen S inneholder dobbeltbyte-tegn:

public boolean containsDoubleByte (String s) {

for (int i = 0; i <s.length (); i ++) {

if (isDoubleByte(s.charAt(i)) {

return true;

}

}

return false;

}

Følgende kode vil returnere "true" dersom strengen C er en dobbeltbyte-tegn:

public boolean isJapanese (char c) {

if (c> = '\ u0100' && c <= '\ uffff') return true;

return false;

// Enklere: retur c> '\ u00ff';

}

Hint

  • Du kan jobbe med andre prosjekter mens de venter på CJK Key server å installere, som tar ca 20-30 minutter å fullføre. Den komplette prøver av Java koding som kan brukes til å automatisere CJK tegn oppdagelsen er tilgjengelig på Seba Ulyssis 'nettsted.