Tipp: wie man Seiten aus Google effektiv ausschließt
Seite aus dem Suchindex ausschließen mit meta tag noindex. Eintrag in die robots.txt und ausschließen der Seite aus der sitemap.xml.

- Seite aus dem Suchindex
Du magst nicht, dass eine bestimmte Seite, die Tags, die Archive oder die Kategorien im Google Index auftauchen. Dafür gibt es vielfältige Gründe wieso man so etwas nicht mag. Ich zeige hier anhand der Impressum-Seite worauf man aller achten sollte, damit die Seite wirklich nicht im Google Index ist.
meta Tag noindex
Es gibt einige Plugins für WordPress, die es einfach ermöglichen Seiten usw. mit dem meta Tag noindex zu belegen. Dieser meta Tag sagt vorerst mal nur: Liebe Suchmaschine, diese Seite darfst du nicht in deinen Index aufnehmen. Fast alle großen Suchmaschinen halten sich daran. Die, die es nicht tun, sollte man via htaccess aussperren, aber dies ist eine andere Geschichte.
Nutzt Du keines dieser WordPress Plugins, dann kannst Du in die header.php Deines verwendeten Themes folgendes tippen:
<meta name="robots" content="<?php if(is_page('impressum')){echo'noindex,follow';}else{echo'index,follow,noodp';};?>" />
robots.txt
Also der meta Tag noindex wirkt nur, wenn diese Seite wo verlinkt ist, er hindert den Googlebot nicht daran, diese Seite zu crawlen. Mag man dies auch nicht so sollte man in der robots.txt dem Bot das durchsuchen dieser Seite verbieten:
z.b.: robots.txt öffnen und im Falle der Impressumsseite den Post Slug eruieren “/impressum/”.
Dann tippt man in die robots.txt.
User-agent: * Disallow:/impressum
sitemap.xml

- Seite aus der xml Sitemap ausschließen
Schickst Du Google auch noch eine .xml Sitemap so wäre es ratsam diese Seite dort zu entfernen. Sonst nutzt alles andere irgendwie nicht wirklich viel.
Und außerdem – nutzt Du auch noch Googles Webmastertool liest Du sonst ständig eine Warnung oder Fehlermeldung und dies nervt auf die Dauer gewaltig
Nutzt Du das sitemap Plugin von WordPress so kannst Du dort Archive, Kategorien und einzelne Seiten und Artikel ausschließen. Du brauchst dazu nur die ID der Seite oder des Artikels.
Admincenter==>Seite==>bearbeiten oder
Admincenter==>Artikel==>bearbeiten
mit der Maus über den Namen fahren und in der Statuszeile des Browsers die ID auslesen.
Fazit:
Eine Seite aus dem Index von Suchmaschinen: meta tag noindex, Eintrag in die robots.txt und diese Seite aus der .xml Sitemap ausschließen nicht vergessen.

Nun weiss ich endlich wie man das auch ohne Plugin hinkriegt
Ein Plugin ist aber trotzdem was praktisches, da man auch gleich je nach Wunsch Kategorien und Tags aussschliessen kann ohne x-befehle in sein Header zu schreiben. Was für Anfänger vielleicht noch wichtig zu wissen ist, dass der Impressum auch unter deinedomain.de/…/impressum abgelegt sein muss damit dies funktioniert und nicht mein-impressum oder ähnlich heissen darf. Oder liege ich da falsch?
Fish03.03.09 16:45 | # |
Danke für denn Tipp mit der header.php, so kann man für jede Seite eigene Richtlinien eintragen, das wusste ich noch nicht.
Man könnte so ja auch andere Head-Elemente je nach Seite anpassen.
Martin03.03.09 18:11 | # |
Hi Fish
ja man muss den Pos Slug nehmen, also die *sprechende Url* der Seite
Hi Martin
genau man kann pro Seite Angaben in der header.php machen -oder auch anderorts
lg
texto03.03.09 18:35 | # |
Nette Möglichkeit, nur wie kann ich zusätzlich zum Impressum eine Weitere Seite hinzufügen?
Ralf15.04.09 06:14 | # |
eine neue Zeile in der robots.txt und oben im header werden die Seiten mit || getrennt , die beiden Striche bedeuten für php *oder*
hier nur mehr der php Teil, das andere steht oben im Artikel!
texto15.04.09 07:36 | # |
gut zu wissen! vielen dank!
andre27.09.09 16:12 | # |
Danke, super Beitrag, hat mir mit meinem Sitemap-Problem in den Webmaster Tools weitergeholfen!
Texter München13.07.10 11:16 | # |
Würde gerne alles ausschliessen da die Site im aufabu ist und ständig im wandel geht dies auch?
Phil02.09.10 16:17 | # |