Hvordan å kode UTF-8 i Python
Unicode UTF-8 er et tegn kodeskjema som kartnummerkoder til tegn. Hver karakter fra hver alfabetet, moderne og gamle alike, er representert i Unicode. Med den tredje utgaven av Python kom forbedret Unicode-støtte, noe som gjør at du kan sette inn Unicode-tegn i strenger ved hjelp av en escape-sekvens. Du kan også endre kodingen av en streng til Unicode ved hjelp av en enkelt kommando. Dette er mulig i Python 3 samt Python to.
Bruksanvisning
1 Åpne IDLE tekst editor som kommer pakket med Python språket.
2 Erklærer en streng ved å skrive dette på toppen av kildekoden siden:
str_0 = "text"
3 Konverter strengen til Unicode UTF-8 ved hjelp av kode-funksjonen og tilordne den til en annen streng. Du kan utføre begge disse operasjonene ved hjelp av en eneste linje med kode, som dette:
str_1 = str_0.encode ( 'utf-8')
4 Skriv ut det kodet streng med utskriftskommando, som dette:
print (str_1)
5 Kjør programmet ved å trykke på "F5". Programmet vil produksjonen Unicode-versjonen av strengen, som ser slik ut:
b'text '