Hvordan å kode UTF-8 i Python

Unicode UTF-8 er et tegn kodeskjema som kartnummerkoder til tegn. Hver karakter fra hver alfabetet, moderne og gamle alike, er representert i Unicode. Med den tredje utgaven av Python kom forbedret Unicode-støtte, noe som gjør at du kan sette inn Unicode-tegn i strenger ved hjelp av en escape-sekvens. Du kan også endre kodingen av en streng til Unicode ved hjelp av en enkelt kommando. Dette er mulig i Python 3 samt Python to.

Bruksanvisning

1 Åpne IDLE tekst editor som kommer pakket med Python språket.

2 Erklærer en streng ved å skrive dette på toppen av kildekoden siden:

str_0 = "text"

3 Konverter strengen til Unicode UTF-8 ved hjelp av kode-funksjonen og tilordne den til en annen streng. Du kan utføre begge disse operasjonene ved hjelp av en eneste linje med kode, som dette:

str_1 = str_0.encode ( 'utf-8')

4 Skriv ut det kodet streng med utskriftskommando, som dette:

print (str_1)

5 Kjør programmet ved å trykke på "F5". Programmet vil produksjonen Unicode-versjonen av strengen, som ser slik ut:

b'text '