Drupal Onpage Optimierung Teil 1 - Vermeidung von Duplicate Content
Einer der Gründe, warum ich meine Webprojekte mit dem CMS Drupal realisiere, ist die Möglichkeit sämtliche wichtige Faktoren der Onpage Optimierung zu automatisieren und das ohne irgendwelche Programmierkenntnisse. Nicht, dass ich nicht gern programmieren würde, aber bei Projekten im Web kommt es doch gerade auf eine zügige Umsetzung vorhandener Ideen an, das Rad neu zu erfinden kostet Zeit, die man schlicht nicht hat.
In dieser Serie möchte ich besonders Drupal-Anfängern erläutern, mit welchen Modulen und Einstellungen des CMS eine Möglichst suchmaschinenfreundliche Website aufgebaut werden kann. In den nächsten Tagen werden noch Artikel zu den Themen "Automatisierte URL-Struktur mit Pathauto", "Individuelle Seitentitel und das Meta-Tag Description", "Internen Verlinkung mit Alinks und Similar Entries" und "Allgemeine Tipps zum Einsatz von Drupal" veröffentlicht.
Den ersten Teil widme ich dem Problem von Duplicate Contenet, das in Drupal schnell entstehen kann, sofern man verschiedene Module miteinander kombinieren möchte.
Vermeidung von Duplicate Content in Drupal
Der Begriff "Duplicate Content" steht dafür, dass bestimmter Content einer Website unter verschiedenen URLs zu erreichen sind, aus Sicht einer Suchmaschine also Seiten doppelt vorkommen, Duplikate vorhanden sind, dies ist unbedingt zu vermeiden, da im schlimmsten Fall ein Ausschluss aus dem Index folgen kann.
Passieren kann das in Drupal z.B. dann, wenn die Module "Categories" und "Taxonomy" zugleich eingesetzt werden. Dann nämlich ist jede erstelle Seite unter "htttp://www.beispiel.com/categories/beispiel.html" und unter "htttp://www. beispiel.com/node/14" zu erreichen. Man muss sich also in der Planungsphase für eines der beiden Module entscheiden oder aber ständig für Korrekturen per Redirect sorgen, was nicht nur fehleranfällig ist, sondern auch für unnötige Last auf dem Server sorgt. Nach Installation jedes Moduls, dass sich in irgendeiner Weise auf die URL Struktur auswirkt, sollte zunächst geprüft werden, ob bestehende Seiten plötzlich unter neuen Adressen zu erreichen sind, aufgefallen ist mit dieses Problem auch bei den Modulen "Image" und "Views".
Neben Drupal-Typischen Problemen hat ein neues Projekt allerdings auch Standardprobleme, die bei jeder neuen Website autauchen.
Als erstes möchte ich das Problem betrachten, dass eine neue Website sowohl unter "http://www.beispiel.com", als auch unter "http://beispiel.com" zu erreichen ist, dies sind für Suchmaschinen natürlich zwei verschiedene URLs, was wir verhindern wollen. Das geht mit folgender Zeile in der Datei .htaccess im Rootverzeichnis des Apacheservers, bei diesem Beispiel wird der User, wenn er die URL "http:// beispiel.de" aufruft an die URL "http://www.beispiel.de" weitergeleitet:
RewriteCond %{HTTP_HOST} ^beispiel.de$ [NC]
RewriteRule ^(.*) http://www.beispiel.de/$1 [L,R=301]
Neben dem Eintrag in die .htaccess lässt sich dieses Problem auch mit dem Modul Path Redirect lösen, hier können die unterschiedlichsten Typen von Weiterleitungen angelegt werden. Die Funktion "301 Moved Permanently" diese Moduls hilft außerdem, wenn man in die missliche Lage geraten ist neue URLs für alte Seiten, die sich schon im Suchmaschinenindex befinden, zu haben. Dann kann hier eine Weiterleitung zur neuen URL angelegt werden, Google erkennt dies und speichert fortan die neue URL, ohne dass die Seiten aus dem Index fliegen. Der folgende Screenshot zeigt den Aufbau des Moduls:

Ein weiteres Problem ist das der Slashes am Ende einer URL, so ist die Seite "http://www.beispiel.com/beispiel.html" standardmäßig auch unter "http://www.beispiel.com/beispiel.html/" aufrufbar. Dies können wir mit dem Modul Global Redirect vermeiden, es leitet automatisch an die URL ohne Slash am Ende weiter. Außerdem sucht dieses Modul in der Drupal Datenbank nach doppelten URLs, die zum gleichen Content führen und leitet automatisch um, wenn vorhanden sogar zu einem sprechenden URL.
Ich hoffe ich konnte hiermit einen kleinen Einblick in die Möglichkeiten der verschiedenen Drupal Module bieten, die anderen Teilen folgen in den nächsten Tagen.
- Peter Soltau Blog:
- Anmelden um Kommentare zu schreiben
Hallo Herr Soltau, ich habe
Submitted by Hans (nicht überprüft) on 10. October 2009 - 13:53.
Hallo Herr Soltau,
ich habe auf Ihre Empfehlung den Modul "globalredirect-6.x-1.2.tar.gz" entpackt und installiert.
Ich möchte alle Links ohne Slash haben, wie Sie auch geschrieben haben.
Dürfte ich Sie bitte fragen, wie die Einstellung von diesem Modul bei Ihnen aussieht?
--->
Deslash:
Non-clean to Clean:
Remove Trailing Zero Argument:
Menu Access Checking:
Case Sensitive URL Checking:
<--
Ich danke Ihnen sehr.
MfG
Hans
Hallo Peter, anscheinend
Submitted by Detlef (nicht überprüft) on 1. November 2009 - 0:35.
Hallo Peter, anscheinend wolltest Du Hans helfen. Allerdings hast Du vergessen, Deine Einstellungen aufzuschreiben. Wäre es bitte möglich, Deine Einstellungen aufzuschreiben. Würde mich mal auch interessieren. Danke.