Min HTML Meta Robots Ikke Index

De fleste nettredaktører har på sine nettsider enkelte sider de ikke ønsker søkemotorer å indeksere. Den "noindex" HTML-metakode er en måte at webmastere kan fortelle søkemotorene ikke å inkludere en bestemt webside i indeksen. Store søkemotorene vil respektere webmaster forespørsel.

Hva søkemotorene indeksere

Når en søkemotor web-crawler først møter en nettside, ser det for en fil som heter "robots.txt". Denne filen forteller crawler hva kataloger og sider på nettstedet ikke skal gjennomgå. Robotsøkeprogrammet besøker deretter de andre sidene på nettstedet ved å følge nettstedets interne knytte ordningen. Alle sider som inneholder innhold søkemotor kan indeksere, vil vanligvis få indeksert mindre siden inneholder «noindex" meta tag.

Hvorfor søkemotorer indeksere sider webansvarlige ikke vil indeksert

Når du bygger et nytt nettsted, du ofte ikke vet hver side som du vil blokkere i "robots.txt" filen. Vanlige Website plattformer ofte inkluderer standardsidene som brukermanualer som en webmaster kanskje ikke engang vet er der. På grunn av dette, er sidene ikke er blokkert før søkemotoren kommer til syne. Det er også mulig at søkemotorer vil gjennomsøke området før en "robots.txt" filen er på plass fordi webmaster utilsiktet la søkemotorer vet at nettstedet finnes ved å koble til nettstedet fra et annet nettsted. Et annet vanlig problem er at webmastere vil sette Google Analytics på nettstedet for tidlig i site-building prosess. Dette informerer Google at nettstedet eksisterer og kan føre til Google for å sende søkemotor crawler til området for indeksering.

Bruke "Noindex" Meta Tag

Å fortelle søkemotorer ikke å indeksere en bestemt side på nettstedet ditt, sette inn følgende kode i "head" -seksjonen på sidens HTML-kode:

<META NAME = "robots" CONTENT = "NOINDEX">

Du kan legge til andre koder i samme linje for å gi ytterligere instruksjoner til robotene. For eksempel, hvis du også ønsker ikke crawlere å følge eventuelle koblinger på siden, kan du bruke følgende kode:

<META NAME = "robots" CONTENT = "NOINDEX, nofollow">

viktige hensyn

Hvis du vil fjerne en side fra søkeindekser, bruk "noindex" tag men ikke blokkere siden i "robots.txt" filen med en gang. Hvis du gjør det, vil søkemotorer ikke krype siden for å se den nye "noindex" tag og siden vil bo i indeksen lenger. Vent med å blokkere gjennomsøking av siden før du er sikker på at området ikke er indeksert i de store søkemotorene. For den raskeste fjerning av en side fra indeksen, Google og Bing både gi en måte for webansvarlige til å be om fjerning av en side. Du vil fortsatt trenger å bruke "noindex" på siden, men som søkemotor kan finne siden igjen senere.