Utvidet Character Guide ANSI

Utvidet Character Guide ANSI


The American National Standards Institute, eller ANSI, inneholder tegnsett 256 tegn, fra store og små bokstaver til tall, tegnsetting og aksenttegn. Det standardiserte grunntegnsettet som brukes av datautstyr, som definerer hvilke tegn som skal inkluderes og i hvilken rekkefølge for å inkludere dem. De første 128 tegnene i full ANSI sett, fra null til 127, utgjør ASCII-tegn, som inkluderer 32 kontrollsekvenser. Fra 128 til 255, den utvidede ANSI-tegn med aksent bokstaver, matematiske symboler og linje-tegning tegn.

før Standards

En verden av databehandling begynte med et Babel av tegnsett, hver enhet maker å definere sitt eget sett av input og kontrollsekvenser. Disse tidlige system brukte papir hullkort som deres datalagringsmedium. Stillingene på et kort som inneholdt eller manglet slag bestemt informasjonen den lagret. IBM, UNIVAC, FORTRAN, STRETCH: hver av disse systemene benyttet ulike karakter arrangementer og antall tegn. Uten en generell standard, disse enhetene manglet evnen til å kommunisere med hverandre.

ASCII

Den opprinnelige American Standard kode for Information Interchange, eller ASCII, begynte tegnsett i 1960 med datamaskinen pioner Bob Bemer, en IBM-ansatt som innså at punch-kortet kaos av konkurrerende tidlig operativsystemer holdt tilbake datamaskinen adopsjon. På den tiden, IBM selv brukt ulike ni-tegnkodinger blant sine produkter. Bemer leverte en kodesekvens forslag til ANSI, som til slutt godkjent en plan svært lik Bemer opprinnelige. Atten år senere ble IBM PC den første datamaskinen som brukes ASCII.

ASCII-tegn

Plassert innenfor et numerisk rutenett som strekker seg fra null til 128 begynner ASCII tegnsettet med et sett av 32 kontrollsekvenser, noen som ikke lenger ser utstrakt bruk og andre, for eksempel "ESC", som forblir en del av dagens databehandling. Den "Space" fungerer som tegnet 32, den 33. i settet, fulgt av ikke-alfabetiske tegn som hash mark, dollartegn, tegnet og tegnsetting. Tallene null til ni utgjør tegn 48 til 57, etterfulgt av mer tegnsetting og matematiske symboler. Den store bokstaver alfabetet vises fra 65 til 90, etterfulgt av flere ikke-alfabetiske tegn. Avrunding ut ASCII sett, 97 gjennom 122 holder små bokstaver alfabetet, etterfulgt av klammeparentes, røret symbol, tilde og "DEL", eller slette, karakter.

utvidede tegn

Den sanne ANSI tegnsett vier stillinger 128 til 255 til aksenttegn som brukes av de fleste europeiske språk, inkludert to-tegnkombinasjoner som kalles digraphs, og store og små vokaler og konsonanter. Sammen med pre-laget fraksjoner, ikke-engelsk tegnsetting, graden symbol og noen alfanumeriske superscripts, det inkluderer også de greske tegn og liknings symboler vanlig i matematikk, og et sett med tegn som brukes til å tegne enkelt- og dobbeltrom-styrte bokser som ligner rammene rundt HTML-tabeller.

Utover og sammen med ANSI

Sammen med den sanne ANSI tegnsett, definerer Microsoft Windows ANSI sett en variant med en forveksling lik navn og vesentlig lignende tegn. Det mangler ANSI line-tegning tegn og inkluderer andre skilletegn i stedet, blant dem to varemerke symboler, copyright symbol, en pre-laget ellipse punktet, bullet, em-dash og en-dash. Utover de tradisjonelle 256-tegns begrensninger ANSI, Unicode muliggjør tegnsett med tusenvis av symboler, imøtekommende nesten alle verdens språk, inkludert de som ikke bruker det latinske alfabetet, som for eksempel Asia og Midt-Østen språk.