Hvordan beregne Floating Point Precision

Hvordan beregne Floating Point Precision


En flytende punkt nummer er et nummer som er kodet i basen 32 format i binær datakode. Presisjonen av et flyttall refererer til tetthet av spesifikasjonen, eller antall signifikante sifre av informasjon som kan lagres med antall. Presisjonen av hver type av flyttall er den samme, fordi det samme antall biter som brukes for den samme funksjon, uavhengig av størrelsen av nummeret. De to vanligste variantene av flyttall er singler består av 32 biter og dobler består av 64 biter.

Bruksanvisning

32-Bit Enkeltfloating Point

1 Start med nummer 32 hvis du beregne presisjonen av en enkelt størrelse desimaltall. Siden et desimaltall består av en kombinasjon av 32 enere og nuller, er det nøyaktig 32 forskjellige biter av informasjon som kan være representert i et flyttall.

2 Trekk en bit å ta hensyn til den positive eller negative natur nummeret. Den 31. bit i et enkelt flyttall heltall blir brukt til å representere tegn på antall, positiv eller negativ. Alle gjenværende biter som brukes til å lagre resten av flyttall informasjon.

3 Trekk fra åtte biter fra de gjenværende 31 biter for å ta høyde for de som brukes for å bestemme eksponent av nummeret. Disse åtte bits benyttes til å bestemme posisjonen til det flyttall er desimaltall, men blir ikke brukt til å lagre målnummeret selv. Etter regnskap for biter som representerer eksponenten og tegnet av en enkelt flyttall, det er 24 flere ubrukte bits. Disse 24 bits brukes til å lagre nøyaktig numerisk informasjon; dermed har et enkelt flyttall 24 bits presisjon.

64-Bit Double Floating Point

4 Starter med tallet 64, som svarer til antallet av biter i en dobbel flyttall.

5 Trekk en bit å ta hensyn til den biten som lagrer positiv eller negativt fortegn informasjon. Dette gir 63 gjenværende ubrukte bits.

6 Trekk fra 10 bits til å gjøre rede for den delen av den doble flyttall som brukes til å lagre nummeret er eksponent informasjon. Denne beregningen gir 53 gjenværende biter, så en dobbel flyttall har 53 bits presisjon.