Die Kanonisierung von URLs ist eine der Basic-SEO-Optimierungen für jede Seite. Matt Cutts persönlich gibt diesen SEO-Advise in seinem Blog. Wie wichtig jedoch die permanente Überwachung der Indizierung bei Google ist, zeigte sich mir in den letzten Tagen bei der Abfrage nach den indizierten Seiten für ansus.de.

Google ist merkwürdig.

Die gezielte Abfrage nach indizierten Seiten von ansus.de bei Google mit Suche nach “index.php” liefert hier nur die eigentlich ungewollten index.php – Dateien. In diesem Fall tatsächlich duplicate content (www.ansus.de/babysitter/ und www.ansus.de/babysitter/index.php)

Dass es zu keinem Zeitpunkt einen Link auf die index.php-Datei gab, die Google indizieren könnte, verwundert nicht wirklich. Natürlich bleibt zu hoffen, dass sich die Bots schnellstmöglich an den expliziten Head-Hinweis “noindex, nofollow” halten….

Nun gibt uns Google neue Möglichkeiten, diese Form von duplicate content zu vermeiden. “Bestimmt eure kanonischen URLs” titelt der Webmaster-Blog von Google. Mittels <link rel=”canonical” href=”http://www.example.com/product.php?item=swedish-fish” /> kann die kanonische URL bestimmt werden. Google wird sich daran halten. Wir werden sehen.

Weiterführende Informationen bei Google, Golem, Yahoo!, Microsoft