SEO für WordPress – doppelter Content – Feeds mit noindex belegen

[]

WordPress erzeugt viel doppelten Content. Wie man dies verhindern kann. Wozu man es verhindern sollte. Wie WordPress seo tauglich machen. Wie kann man die Feeds vor den Serps schützen und was bedeuten all diese Worte:noindex,seo,serps uvm.

WordPress optimieren
WordPress optimieren
Die Abkürzung SEO bedeutet Suchmaschinenoptimierung auf Deutsch. Suchmaschinen mögen viel guten Inhalt, doch kommt ein und derselbe Inhalt unter vielen Internetadressen in die SERPS,dann mag das so gut wie keine der gängigen Suchmaschinen und schickt die doppelten Inhalte /Content in die sogenannten supplemental results (=zusätzliche Ergebnisse). Hat ein Internetauftritt, egal ob Blog,WordPress oder ein anderes, Typo3, Content Management System “Ich bin gut” uvm.. viel doppelten Content im supplemental result so schwächt dies die Seite sehr.

Jetzt kann man mit “noindex” verhindern, dass dieser doppelte Content überhaupt in die Suchergebnisse aufgenommen wird. Das gut bekannte “nofollow” verhindert, dass Suchmaschinen diesem Link folgen, in bewerten etc. aber ein mit “nofollow” versehener Link kann dennoch in den SERPS auftauchen!

WordPress ist für doppelten Content – wie fast jede Blogsoftware – prädistiniert.

Ich zähle hier einige Beispiele auf und vermute es gibt sogar noch mehr.

Die Blätterfunktion

Man zeigt 10 Beiträge auf der Startseite an, dann erscheint entweder :vorheriger Beitrag – nächster Beitrag, oder aber eine seitenweise Aufzählung der “aufgeblätterten” Seiten. Wie: Seite 1,2,3,4,… von 35 oder so ähnlich.

Dasselbe wiederholt sich bei jeder Kategorie, bei jedem Archiv und davon gibt es jede Menge:

Tages-,Monats-, Jahres-, Autorenarchive.

Die statischen Seiten von WordPress kann man auch teilen!

Die Unterkategorien und Hauptkategorien

Greift man nicht ein – die Loopspielereien hier auf texto.de zeigen dies vor – dann erscheint jeder Beitrag einer Unterkategorie auch beim Anklicken der Hauptkategorie in dieser!

tagging – tags – oder die Furcht vor der Beschränkung ;)

Taggen ist ja wunderbar. Jeder “tag”, also jedes Schlagwort erzeugt eine eigene Kategorie mit einer übersicht. Und weil tagging so einfach geht, wird es fast wahllos und oft überblickslos gemacht:

Beispiel:

Content Management System wäre das Schlagwort, also der “tag”.

Auf einmal gibt es noch : CMS, Content Management Systeme, CMSe.

Bereits vier Kategorien in denen garantiert ein und dieselben Beiträge abgespeichert werden. Dieser hausgemachte doppelte Content ist nur mit einem generellen

<meta name="robots" content="noindex, follow" />

Zwischen head und /head abstellbar. Es gibt viele Plugins, die tagging Systeme anbieten, wie man die einzelnen aufruft,damit man die richtigen Kategorien ausschließt ist beim jeweiligen Pluginautor sicher entweder nachlesebar oder erfragbar.

Wer das simple-tagging Plugin von sw-guide.de nutzt, muss im WordPress Admin auf “Tags” dann “Display Tags of the Current Post” beim Linkformat ein rel=”nofollow” einfügen.holgi24

Wie stellt man den doppelten Content durch die Blätterfunktion ab?

<?php if(is_home() && ($paged) || is_single()&& ($paged) || is_page()&& ($paged) || is_category()&& ($paged)||is_author()&& ($paged)||is_search()&& ($paged)||is_month()&& ($paged)||is_year()&& ($paged)){
echo '<meta name="robots" content="noindex,follow" />';
} else {
echo '<meta name="robots" content="index,follow" />';}?>

Dies zwischen head und /head in WordPress eingefügt – zu 99,99999% findet man dies in der header.php verhindert, dass die geblätterten Seiten in den Index der Suchmaschinen kommen, sichert aber,dass die Links auf den Seiten weiter verfolgt werden.

Was bedeuten obige kurze Zeilen:

Wenn es home (Startseite) ist und (&&) geblättert (paged) oder (||) wenn es ein Beitrag (single) ist und geblättert oder wenn es eine statische Seite (page) ist und geblättert oder wenn es eine Kategorie (category) ist und geblättert oder wenn es ein Autorenarchiv (author) ist und geblättert oder wenn es die Suchergebnisse(search) sind und geblättert oder wenn es ein Monatsarchiv (month) ist und geblättert oder wenn es ein Jahresarchiv (year) ist und geblättert, dann gib zurück (echo) meta name robots content noindex, follow, sonst gib zurück (echo) meta name robots content index, follow.

Kontrollieren!

Wer sowas einfügt und nicht kontrolliert, der rsikiert, dass er seine ganze Internetpräsenz aus den SERPS ausschließt.

Nach dem Einfügen sofort zur Startseite. Beim verwendeten Browser oben auf Ansicht/View ==>Quellcode/Sourcecode klicken und relativ weit oben muss das jeweils richtige im Quellcode stehen.

Mein Disclaimer:
Ich verwende obige Zeilen selber in meinen Blogs, aber der Teufel und Murphy sind enge Verwandte, daher wer dies verwendet macht es eindeutig auf eigene Gefahr.

Noindex wirkt – verdammt lange meist sogar. ;)

Die RSS Feeds aus den Suchergebnissen ausschließen

Ich fand da einige Tutorials zb bei SEO Egghead. Damit wurde ich selber nicht sehr glücklich. Genauso erging es mir bei Niall. Bei marketing studies fand ich dann einen Hinweis zu Gregg. Dessen Methode stell ich hier kurz vor und ich warne wieder: Auf eigene Gefahr.

Unbedingt nachher das Feed überprüfen, ob es noch “valide” ist, denn invalide Feeds werden von vielen RSS Reader nicht angenommen.

Im Root, dem Hauptverzeichnis von WordPress findet man die wp-rss2.php. WordPress Version ab 2.0 getestet!

Die ersten Zeilen sehen original so aus:

<!-- generator="wordpress/<?php bloginfo_rss('version') ?> DE-Edition" -->
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	<?php do_action('rss2_ns'); ?>
>

<channel>
	<title><?php bloginfo_rss('name'); ?></title>
	<link><?php bloginfo_rss('url') ?></link>

Da wird jetzt das in allen Feeds standardisierte allowIndex auf false gesetzt, dies sieht dann so aus:

<!-- generator="wordpress/<?php bloginfo_rss('version') ?>" -->
<rss version="2.0" 
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:r="urn:<?php permalink_single_rss() ?>"
	<?php do_action('rss2_ns'); ?>
>

<channel>
	<title><?php bloginfo_rss('name'); ?></title>
	<r:index allowIndex="false" />
	<link><?php bloginfo_rss('url') ?></link>

Hinzugefügt habe ich :

xmlns:r="urn:<?php permalink_single_rss() ?>"

Jetzt erkennt das Feed:Ah da gibts was ” r” worauf ich achten muss. (Alle technischen Erklärungen erspar ich mir. Programmierer wissen darum, die anderen interessierten bitte nachlesen also ergooglen. ;) )

Und dann:

<r:index allowIndex="false" />

Speichern, hochladen, validieren fertig.

Die robots.txt zur Verhinderung von doppelten Content.

Alles was in der robots.txt verboten wird, bedeutet: Du Suchmaschine du, all diesen Links darfst Du nicht folgen. Seriöse Suchmaschinen halten sich dran. Aber, wenn Dein Blognachbar Dein Feed verlinkt ist die Angabe in der robots.txt Makulatur (=für die Katz).

Wer mag hier ein Vorschlag:

User-agent: *
Disallow: /wp-
Disallow: /search
Disallow: /feed
Disallow: /comments/feed
Disallow: /feed/$
Disallow: /*/feed/$
Disallow: /*/feed/rss/$
Disallow: /*/trackback/$
Disallow: /*/*/feed/$
Disallow: /*/*/feed/rss/$
Disallow: /*/*/trackback/$
Disallow: /*/*/*/feed/$
Disallow: /*/*/*/feed/rss/$
Disallow: /*/*/*/trackback/$ 

Aber ich habe doch unterschiedliche titles und unterschiedliche meta description!

Ja, keine Frage wichtig. Doch seit gut Februar ist dies Google sowas von egal. ;) Doppelter Content wird damit nicht mehr verhindert.

viel Erfolg und Spaß und die besten Plätze in den Serps

Ich bin Buch-Autorin, WordPress-Fachfrau, Beraterin für SEO und online Marketing; Lösungen lieb ich genauso wie html5 und css3.
Außerdem bin ich WordPress Enthusiastin, bevorzuge Espresso und gute Schokolade,
Mit WordPress ist fast alles möglich, aber nicht immer sinnvoll. Dies pro Projekt herauszuarbeiten, das ist meine Passion.


46 Gedanken zu “SEO für WordPress – doppelter Content – Feeds mit noindex belegen”

  1. Danke für den Tipp mit dem Feed. Funktioniert das auch wenn man Feedburner nutzt? Hat da jemand eine Lösung?

  2. Danke für die Erklärung!

    Ich habe aber noch eine Frage zu dem SimpleTagging-Plugin. Wenn ich das oben genannte mache steht bei meinen Tag-Seiten im Quelltext “”. Wie müsste der Code denn lauten, damit dort auch “NOindex,follow” steht? Wäre super wenn du das noch erklären könntest! Beim Plugin selber habe ich schon “rel=nofollow” eingestellt, aber es wäre besser wenn die SuMa folgen, aber nicht indexieren würde. Geht das?

  3. Irgendwie hat das Script hier mein Posting nicht richtig angenommen. Da wo nichts in den Anführungsstrichen steht soll natürlich -index,follow- hin!

  4. Hi Steve
    ich brauche da mehr input.
    wie rufst Du so eine *simple tagging category* oder das Template denn auf?

    Beispiel eines anderen Plugins, da kann ich mit :

    
    <?php if (jkeywords_is_keyword()): ?>
    <meta name="robots" content="noindex,follow" />
    
    <?php endif; ?>
    

    folgendes erfragen: wenn das jeronomys keywords sind, dann mache dies oder jenes…

    aber mir fehlt bei dem simple tagging der richtige Teil:

    
    jkeywords_is_keyword()
    
    

    Code unter <pre> </pre>

    ;)

    aber meine ganzen Sicherheitsvorkehrungen sind hier aktiv, … mag einfach keine php Injection oder so hier haben…. :-)

    lg

  5. Hallo Steve,
    ja so sehen die URIs hier auf texto.de auch aus..
    http://www.texto.de/tag/wordpress-cms/

    Damit ich diese Adressen /URIs ansprechen kann, – ausnahmslos alle, egal was nach meinedomain.tld/tag/ auch kommt, brauche ich hier:

    jkeywords_is_keyword()

    wie heißt dies bei dem simple tagging Plugin ?

    oder Du läßt mich in Deinen Adminbereich mit Erlaubnis Templates zu editieren…email Formular habe ich hier ;)

    lg

  6. Bei der Blätterfunktion verstehe ich es nicht, warum ist denn da doppelter Content? Auf Seite 2 ist doch anderer Content wie auf Seite 3 oder 4. Oder stehe ich grad auf dem Schlauch?

  7. @texto
    Aha, ok. Und ich hab mich schon gewundert.
    Soll jetzt keine Schleichwerbung sein, wird jedoch im Blog mein wpSEO-Plugin eingesetzt, so kommt auf Wunsch auch beim Blättern ein anderer Titel, andere Description und sogar andere Keywords.

  8. Hi Sergej auch bei der Startseite?

    Die hat bei manchen Blogs bis zu 170 geblätterte Seiten!
    170 mal anderer title andere Keywords …
    lg

  9. Pingback: SEO Plugin für WordPress - Werbung und ein Danke

  10. Auch bei der Startseite. Man wähle einfach unter “Dynamischer Wert” > “Startseite” entweder “Titel der aufgelisteten Beiträge” oder aber auch “Ausschnitt aus dem ersten Beitrag”. Und schon werden Keywords oder Description dynamisch erzeugt – auf jeder der 170 Seiten anders.

  11. Steve lang hats gedauert hier die Lösung für simple tagging:

    <?php if (STP_IsTagView()) { echo ' <meta name=\"robots\" content=\"noindex, follow\"/> '; } ?> 
    
    

    lg

  12. Pingback: Artikel: SEO für Wordpress » Beitrag » BlogPimp

  13. Pingback: Chris' Blog

  14. Alles aus der robots.txt auszuschließen ist deshalb doof, weil die Suchmaschinen die Pfade IMHO dann nicht nur nicht indizieren, sondern erst gar nicht besuchen und somit die Links darin nicht weiterverfolgen.

  15. Hi Martin
    was aus der robots.txt ausgeschlossen ist kann sehr wohl indiziert werden, nämlich dann, wenn wer anderer drauf linkt.

    robots.txt ausschließen bedeutet nur:googlebot besuch das nicht mehr..nicht mehr und nicht weniger

    daher
    @Claudia
    denke ich auch, dass die tags per robots ausschließen nicht wirklich viel bringt.

    da helfen meta tags noindex follow eher

    lg

  16. Pingback: Google wirft mich aus dem Index? :: frank huncks blog

  17. Sebastian
    freut mich , wenn es half, bloß unter deinem ehemaligen Link finde ich gar kein WP – wie nutzt du dann diese Anleitung?

    lg

  18. Hi Texto,
    habe ein Verständnisprolem mit deinem Tip zum DC durch Blätterfunktion vermeiden.
    Du schließt geblätterete Seiten von der Indizierung aus, soweit so klar.
    Nur bläßt du doch damit deinen gesamten “alten” Content ins Nirvana weil dieser ja nur geplättert zu ereichen ist, oder irre ich mich da?
    Außerdem hast du immer noch ein DC Problem:
    Wird ein neuer Eintrag veröffentlicht so ist er ja auf der Startseite, im Monatarchiv sowie im Autorenarchiv zu finden. Natürlich ohne das geblättert wurde.
    Ich würde daher sagen man müsste alle Archive auf noindex setzen und nur das indizieren der Startseite inkl. geblätterete unterseiten erlauben. So müssten alle Einträge indiziert werden.
    Oder liege ich da total falsch?
    Grüße
    Alex

  19. Hi Alex

    so oder so.

    Nur 1. es blättert kaum wer

    2. Kategorien sind immer themenrelevanter und werden eher gefunden

    3. Alle Artikel sind über die Sitemap verlinkt.

    4. Durch die unterschiedliche Anzeige:1x die neuesten Artikel oben , einmal unten, einmal dies in der Sidebar einmal das, wird DC schon gut verhindert

    lg

  20. Pingback: Kommentar-Feeds entsorgen - kleine Spiele mit der robots.txt - Bandscheiben-Blog

  21. Hi texto,
    wenn ich die Seiten mit robots.txt aussperre, werden sie dann nicht über die sitemap.xml gefunden und gelesen?
    Grüße TomTom

  22. Pingback: ein-uwe.de » getunte Wordpress robots.txt

  23. Pingback: Doppelter Inhalt - Duplicate Content vermeiden « Suchmaschinen

  24. doppelten content durch blätterfunktion: also wie kontrolliert man den erfolg des php codes? sollten nicht kategorie-seiten dann mit einem noindex,follow versehen sein? ich seh überall nur index,follow. scheint also nicht so ganz zu funktionieren, oder seh ich da was falsch?

  25. korrektur:
    hab grad gesehen, dass dein code kleinen aber sehr fatalen fehler enthält, daher die fehlerhafte anzeige:
    vor ?> fehlt die zwingend vorgeschriebene leerstelle!!!

  26. Tolle Hilfen! Aber ich muss mal konkret fragen:

    Ich hab mein altes Blog nach dem Umzug auf mein neues bestehen lassen und jeden Beitrag mit “Beitrag wurde HIERHIN verschoben”. Hab ich nun trotzdem doppelten Content? Die Überschriften sind nämlich noch gleich!
    Oder würde hier einfach ein “Nofollow” nach dem HIERHIN-Link genügen?

    blogabfertigung.de

  27. bin durch suche DC in Google auf Deine Seite gekommen, und mußte feststellen, dass sich das Plugin WPSeo verstellt hatte. Nun habe ich dank Deines Denkanstoßes wieder alles richtig eingestellt. Leider bin ich bei den letzten PR updates von PR4 auf PR2 gerutscht. Ich hoffe, dass es nur der DC war.

  28. der PR der Hauptseite wird durch DC in den Unterseiten nur marginal beeinflusst. Das muß andere Gründe haben.

  29. Schade, dass ich diesen Beitrag nicht früher gelesen habe, vielleicht bekomme ich ja trotzdem eine Antwort.
    Was ich überhaupt nicht verstehe ist bei der ganzen DC-Diskussion der Erfolg der Bookmarkverzeichnisse. Diese Webseiten, z.B. Mister-Wong, leben doch nur von Tags und ranken teilweise sehr, sehr gut. Wobei Tags sogar teilweise einen sehr starken PR haben und über die Suchmaschinen Besucher vermitteln. Oder hat sich in der Zwischenzeit etwas entscheidendes geändert was ich verpasst habe? Nach dem gelesenen hier müßte Mister-Wong schon garnicht mehr existieren. Oder gibbet da Unterschiede?

  30. Hi Tom,
    wenn Du soviele Artikel hast wie Mr WOng Bookmarks ,dann hast du bei den einzelnen Tags auch nicht immer dieselben Seiten drin –
    ich kenn aber kaum ein Blog mit >100 000 Artikeln ;)

    lg

  31. Oh, das geht aber doch schneller als erwartet hier… ist nicht mehr so üblich. Bin begeistert. Vielen Dank für die Antwort.
    Das bedeutet also, wenn ich es richtig verstehe, je mehr Beiträge bzw. Artikel über ein Tag gefunden werden umso geringer ist die Wahscheinlichkeit für Suchmaschinen DC zu erkennen bzw. um so großzügiger sind sie zur jeweiligen Webseite? Je weniger Artikel ein Tag aufweist um so gefährlicher ist es? Hoffe ich hab es so richtig interpretiert. So, setz mach dann hin, trink einen Tee und warte mal auf Antwort.
    Toller Blog übrigens. Wollte es nur mal anmerken. ^^

  32. Hi Tom
    ich sitz beim PC trink Kaffee ;) bin ja nicht krank, dass ich Tee brauche und ja Du hast meine Antwort absolut richtig verstanden :zwinker:

    lg

  33. Pingback: Rss-Feeds und das Double Content Problem

  34. Danke für die Anleitung. Wollte in WordPress mein Impressum auf Noindex schalten, habe aber nirgends eine gescheite Anleitung gefunden.
    lg

  35. Ich habe gerade auf den Artikel gestoßen, zwar ist es etwas Älter, aber immer noch aktuell.

    Es ist ziemlich gut beschrieben, allerdings bin ich gerade auf der Suche nach einer Möglichkeit, nicht die Seite komplett für Indexierung zu sperren, sondern nur ein kleinen Bereich. Bei anderen Suchmaschinen habe ich sowas gefunden, z.B. für Yandex(russische Suchmaschine) kann man bestimmte Bereiche ausschließen, z.B. Werbeblock oder sonstiges. Für Google sieht es bis jetzt aber anderes aus.

    Es wäre schön, wenn man nicht nur auf Seitenebene es regeln könnte.

  36. Man sollte sich nicht soviel Gedanken um das Thema DC machen, Google ist nicht von gestern. Solange es auf der Domain bleibt ist alles OK, meine Meinung. Gruß Daniel.

  37. @ Seospot

    ich bin mir da nicht wirklich sicher…
    Wohler fühle ich mich, wenn ich möglichst wenig DC auf der Seite habe. Schaden kann es auf keinen Fall.

  38. Wie sieht es denn aus, wenn man das more-tag verwendet, also nur verkürzten Text ausliefert? Ich nutze beispielsweise einige RSS-Dienste, gibts da Erfahrungen?

  39. DC ist imho ein stark unterschätzes Problem. Ich habe es bei einigen Projekten bereits erlebt, dass Sie in den Serps stark gefallen sind, nachdem ich DC von Presseportalen etc eingebunden habe.
    Also ich würde da wirklich mit aufpassen und gescheite Lösungen suchen.

  40. Ganz lieben Dank für die tolle Anleitung.
    Ich bin gerade dabei ein Projekt etwas umzustellen und versuche dann die hier gegebenen Tipps umzusetzen.

    Ich werde mich dann wieder melden und von den Veränderungen berichten. Ich denke und hoffe aber das es schon spürbar wird.