Tipp: wie man Seiten aus Google effektiv ausschließt

 Seite mit noindex,robots.txt und sitemap.xml aus dem Index ausschließen
Seite aus dem Suchindex 

Du magst nicht, dass eine bestimmte Seite, die Tags, die Archive oder die Kategorien im Google Index auftauchen. Dafür gibt es vielfältige Gründe wieso man so etwas nicht mag. Ich zeige hier anhand der Impressum-Seite worauf man aller achten sollte, damit die Seite wirklich nicht im Google Index ist.

meta Tag noindex

Egal welches CMS man verwendet oder ob gar keines. Mit folgender Anweisung im html Header einer Website schließt man diese von der Indexierung bei Suchmaschinen aus.

<meta name="robots" content="noindex, follow" />

Diese bedeutet: nimm die aktuelle Seite nicht in deinen Index, aber folge den Links auf dieser Seite.
Alle seriösen Suchmaschinen halten sich dran!

Für das CMS WordPress gelten nachfolgende Tipps:

Es gibt einige Plugins für WordPress, die es einfach ermöglichen Seiten usw. mit dem meta Tag noindex zu belegen. Dieser meta Tag sagt vorerst mal nur: Liebe Suchmaschine, diese Seite darfst du nicht in deinen Index aufnehmen. Fast alle großen Suchmaschinen halten sich daran. Die, die es nicht tun, sollte man via htaccess aussperren, aber dies ist eine andere Geschichte. ;-)

Nutzt Du keines dieser WordPress Plugins, dann kannst Du in die header.php Deines verwendeten Themes folgendes tippen:

Update 2011: hier gibts für WordPress noch mehr Tipps zu diesem Thema: NoIndex in WordPress richtig verwenden.


<meta name="robots" content="<?php if(is_page('impressum')){echo'noindex,follow';}else{echo'index,follow,noodp';};?>" />


robots.txt

Also der meta Tag noindex wirkt nur, wenn diese Seite wo verlinkt ist, er hindert den Googlebot nicht daran, diese Seite zu crawlen. Mag man dies auch nicht so sollte man in der robots.txt dem Bot das durchsuchen dieser Seite verbieten:

z.b.: robots.txt öffnen und im Falle der Impressumsseite den Post Slug eruieren „/impressum/“.

Dann tippt man in die robots.txt.


User-agent: *
Disallow:/impressum


sitemap.xml

 Seite mittels sitemap.xml aus dem Index ausschließen
Seite aus der xml Sitemap ausschließen

Schickst Du Google auch noch eine .xml Sitemap so wäre es ratsam diese Seite dort zu entfernen. Sonst nutzt alles andere irgendwie nicht wirklich viel. ;) Und außerdem – nutzt Du auch noch Googles Webmastertool liest Du sonst ständig eine Warnung oder Fehlermeldung und dies nervt auf die Dauer gewaltig ;)

Nutzt Du das sitemap Plugin von WordPress so kannst Du dort Archive, Kategorien und einzelne Seiten und Artikel ausschließen. Du brauchst dazu nur die ID der Seite oder des Artikels.

Admincenter==>Seite==>bearbeiten oder
Admincenter==>Artikel==>bearbeiten
mit der Maus über den Namen fahren und in der Statuszeile des Browsers die ID auslesen.

Fazit:

Eine Seite aus dem Index von Suchmaschinen: meta tag noindex, Eintrag in die robots.txt und diese Seite aus der .xml Sitemap ausschließen nicht vergessen.

Diesen Artikel einfach Bookmarken und viel Freud damit
10

10 Beiträge zu “Tipp: wie man Seiten aus Google effektiv ausschließt

  1. Kommentar Autor
    Fish
    Kommentar

    Nun weiss ich endlich wie man das auch ohne Plugin hinkriegt :-D Ein Plugin ist aber trotzdem was praktisches, da man auch gleich je nach Wunsch Kategorien und Tags aussschliessen kann ohne x-befehle in sein Header zu schreiben. Was für Anfänger vielleicht noch wichtig zu wissen ist, dass der Impressum auch unter deinedomain.de/…/impressum abgelegt sein muss damit dies funktioniert und nicht mein-impressum oder ähnlich heissen darf. Oder liege ich da falsch?

  2. Kommentar Autor
    Martin
    Kommentar

    Danke für denn Tipp mit der header.php, so kann man für jede Seite eigene Richtlinien eintragen, das wusste ich noch nicht.
    Man könnte so ja auch andere Head-Elemente je nach Seite anpassen.

  3. Kommentar Autor
    Monika
    Kommentar

    Hi Fish
    ja man muss den Pos Slug nehmen, also die *sprechende Url* der Seite

    Hi Martin
    genau man kann pro Seite Angaben in der header.php machen -oder auch anderorts

    lg

  4. Ping Top 10 der Woche 10/09 « Wochenrückblicke

  5. Kommentar Autor
    Ralf
    Kommentar

    Nette Möglichkeit, nur wie kann ich zusätzlich zum Impressum eine Weitere Seite hinzufügen?

  6. Kommentar Autor
    Monika
    Kommentar

    eine neue Zeile in der robots.txt und oben im header werden die Seiten mit || getrennt , die beiden Striche bedeuten für php *oder*
    hier nur mehr der php Teil, das andere steht oben im Artikel!

    
    <?php if(is_page('impressum') ||is_page('neuerpostslug')         ){echo'noindex,follow';}else{echo'index,follow,noodp';};?>" />
    
    
    
  7. Ping Wikio Freunde im eigenen Blog | Tim-Gramberg.de

  8. Kommentar Autor
    Texter München
    Kommentar

    Danke, super Beitrag, hat mir mit meinem Sitemap-Problem in den Webmaster Tools weitergeholfen!

  9. Kommentar Autor
    Fred
    Kommentar

    Vielen Dank für die Anleitung wie man Seiten aus dem Google Index ausschließen kann! Ich denke ich kriege das hin. Für den Fall dass ich es dennoch nicht schaffe: Wie sieht es denn aus mit Plugins hierfür? Können Sie mir da eins empfehlen? Oder geht das Ausschließen aus dem Google Index letztlich per Handbetrieb doch schneller und einfacher?

  10. Ping » Aufgrund der Robots.txt dieser Website ist keine Beschreibung für dieses Ergebnis verfügbar — SEO Blog • doFollow.de