Google Algoritme-opdatering, Mobile-First-indeksering, Indeksering af fejl, Favicons, søgekvalitet og AdSense

Ved hjælp af en omdirigeringserklæring i min htaccess-fil kan folk, der skriver følgende i adresselinjen ...

http://example.com/index.php 

... omdirigeres til ...

http://example.com/ 

Jeg har også et noindex, nofollow-metatag på alle siderne på mit websted.

Mit spørgsmål er, i betragtning af at omdirigeringsadfærd og metadata, googlebot indekserer min hovedside (dvs. index.php), hvis min robots.txt-fil er som følger ...

User-agent: Googlebot Allow: /index.php Disallow: / User-agent: * Disallow: / 

Hvis ikke, hvordan skal jeg ændre min robots.txt, så kun min hovedside indekseres i google og intet mere?

Tak på forhånd!

Hvis du omdirigerer til "/" men kun tillader "/index.php" at blive indekseret, vil intet blive indekseret. For dig er "/" og "/index.php" den samme side. Men for søgemaskinerne er de to separate webadresser. Ved at blokere "/", som er den eneste side, som brugerne tilsyneladende vil se, blokerer du hele dit websted.

Hvis du vil have finere kontrol over, hvad der er indekseret, skal du bruge metatags nævnt ovenfor og / eller bruge x-robots-tag HTTP-header til at kontrollere indeksering. Specifikt brug X-Robots-Tag: noindex på alle dine sider undtagen til index.php. Så er der ikke behov for at bruge robots.txt-filen. Jeg læste et sted, at HHTP-overskriften er mere effektiv og den foretrukne måde at blokere sider for at blive indekseret, men jeg kan ikke finde den artikel i øjeblikket.

John Conde forklarede allerede, at din nuværende løsning ikke fungerer (+1), da Googlebot kun evaluerer reglerne efter at være allerede omdirigeret og overholder Disallow: /følgelig for at blokere alle webadresser inklusive din rod / hovedside derefter.

Men specifikt for Googlebot kan du lette dens udvidelser til den officielle robots.txt-protokol (se sektion Mønster matching inden for Bloker eller fjern sider ved hjælp af en robots.txt-fil), sådan:

User-agent: Googlebot Allow: /$ Disallow: / 

Det $tegnet svarer til slutningen af ​​en URL, så Allow: /$ Direktivet tillader enhver URL, der begynder med dit domænenavn, efterfulgt af intet, dvs. tillader din rod / hovedside efter bliver omdirigeret fra index.php allerede.

Det Disallow: / direktivet blokerer alle andre webadresser som normalt derefter.

Jeg har netop testet dette med succes med robots.txt testværktøjet i Googles webmasterværktøjer (tilgængelig der via Crawleradgang under Websteds konfiguration), så du kan bekræfte dette selv med det samme - at undersøge dette uvurderlige udvalg af værktøjer / information relateret til SEO generelt og Google i særdeleshed anbefales alligevel!

Det er risikabelt. For at være sikker på, at Google indekserer din startside, skal du gøre dette:

User-agent: * Allow: /index.php Disallow: /a Disallow: /b ... Disallow: /z Disallow: /0 ... Disallow: /9 

Så din rod "/" matcher ikke tilladelsesregler.

Glem ikke at tilføje, hvis du har AdSense

User-agent: Mediapartners-Google Allow: / 

arbejdet for dig: Charles Robertson | Ønsker du at kontakte os?

nyttige oplysninger