Hvordan bruke Googles Ngram Viewer for å finne historien til ord og uttrykk

Hvordan bruke Googles Ngram Viewer for å finne historien til ord og uttrykk


Google har lansert et verktøy de kaller en Ngram Viewer som har fått mye oppmerksomhet fra både teknologi guruer og ord elskere. Mange forfattere som Gene Weingarten i Washington Post, har kommentert vanedannende natur Ngram Viewer. En "n-gram" er et ord eller en setning av lengde n, der "n" representerer et lite antall. For eksempel, er en en-gram et eneste ord, mens en 3-gram er en tre-ord setning som "Roosevelt High School" eller "Kentucky fried chicken."

Bruksanvisning

1 Gå til Google Ngram Viewer på Google Labs. (Se Ressurser for en direkte link.)

Ved hjelp av den massive databaser av ord og uttrykk som Google har samlet fra sin samling av millioner av digitaliserte bøker, kan du raskt sammenligne populariteten til ulike ord og uttrykk, og grafen hvordan bruken av n-gram du velger har endret seg over tid.

Merk linken på nettstedet til «Om Google Books Ngram Viewer" hvis du ønsker mer bakgrunnsinformasjon om dette verktøyet.

2 Studer eksempel grafen for å bli kjent med Ngram innganger og utganger.

Googles eksempel grafiske diagrammer bruk, på trykk, av to mytiske byer, Atlantis og El Dorado. Grafen viser at El Dorado ble mye oftere nevnt enn Atlantis i midten av det 19. århundre. De to byene var like nevnt sent i det 19. århundre, og i det 20. århundre, ble Atlantis en mye mer vanlig begrep, mens El Dorado ble nevnt mye sjeldnere.

3 Lag din egen Ngram sammenligning ved å skrive inn søkeord i tekstboksen, atskilt med komma (ikke bruk anførselstegn rundt setninger).

Noen interessante søk inkluderer:

bil vs hest

truser vs bloomers

hot dog vs frankfurter

Harry Potter vs Huckleberry Finn

Main Street vs Wall Street

masseødeleggelsesvåpen vs atombombe

Du kan søke historien om en enkelt Ngram, eller sammenligne to, tre eller flere ord og uttrykk med hverandre. For eksempel historien om "trådløs" viser ordet topp når trådløs radio ble først populært i 1900, deretter topp igjen mer nylig som begrepet tok en ny betydning.

4 Skriv inn rekken av datoene du vil søke. Materialer i Google Books samling daterer seg tilbake til 1600-tallet og strekker seg frem til moderne tid.

5 Velg corpus. En "corpus" er en stor samling av tekstmateriale. Googles Ngram Viewer tilbyr et utvalg av corpuses på forskjellige språk (engelsk, fransk, kinesisk, spansk, tysk, russisk og hebraisk), samt noen finjustering alternativer (britisk engelsk eller amerikansk engelsk).

6 Velg en "utjevning" faktor. Som uttrykket antyder, "utjevning" jevner ut de resulterende grafer, som noen ganger viser skarpe pigger på grunn av uvanlig mange nevner i et enkelt år.

En utjevning verdi på "0" viser de faktiske verdiene i hvert år. En glatting verdi på "3" gjennomsnitt ut-verdier over et område på tre år, for å glatte ut grafen.

Prøv flere varianter av glatting verdier med søkene dine for å få en god følelse for hvordan det påvirker resultatene.

7 Klikk på "Søk massevis av bøker" for å generere n-gram grafen.