Site-Abfrage liefert (absichtlich) unterschiedliche Ergebnisse

Geschrieben von Torsten Daus am 25.08.2009

Wer die Anzahl der indizierten Seiten einer Website herausfinden wollte, bediente sich in der Vergangenheit häufig der Site-Abfrage bei Google. Die zurückgegebenen Ergebnisse variierten jedoch zum Teil stark. So konnte eine Website 5.000 Ergebnisse wiedergeben, bereits Sekunden später 100.000 oder gar 800.000. Auch das Blättern durch die Google-Suchergebnislisten gab immer wieder unterschiedliche Ergebnisse zurück. Da die Ergebnisse so stark variierten, war der als “ungefähr” titulierte Wert wohl kaum die alleinige Ursache. Ein Mitarbeiter von Google rät im offiziellen Forum zu folgendem:

For information about the number of URLs indexed, I’d recommend submitting a Sitemap file with the preferred URLs through Webmaster Tools. There you can see the number of URLs (based on the ones that you submitted) that were actually indexed. This number is much more realistic than the rough approximation given in a site:-query (also keep in mind that the site:-query is a restrict, so it’s by design not a conclusive list of matching URLs).

That said, one of the most important elements in having many URLs indexed properly is to make sure that the content returned is unique and compelling. If for instance you are hosting the exact same content on multiple URLs, this can result in us only indexing one copy. Similarly, if we determine that the content is generally the same as available elsewhere, this can result in us not indexing as much as we might otherwise.

At any rate, focusing on the site:-query rough approximations will not lead to useful results.

Hope it helps!
John

Die Webmaster-Tools zu benutzen und eine Sitemap-XML hochzuladen ist sicher eine gute Empfehlung. Jedoch werden dort zur Zeit nur Ergebnisse angezeigt, die auch in der Sitemap vorhanden waren. Darüber hinaus bedarf dieser Service einer Authentifizierung, so dass die Abfrage von fremden Websites nicht möglich ist.

Gesteuerte Indizierung von Websites

Geschrieben von Torsten Daus am 27.11.2008

Gerade bei großen Portalen mit mehreren hunderttausend oder Millionen Webseiten ist eine gezielte Indizierung der einzelnen Seiten von enormer Bedeutung. Wir beobachten so heute bei vielen Portalen eine falsche oder zumindest nicht ideale Indizierung, die widerrum dazu führt, dass viel Traffic ungenutzt bleibt.

Eine der ersten Todos des Tages sollte es sein, die zuletzt indizierten Seiten zu begutachten und u.a. mittels site:xyz.de zu erfassen. (hierzu eignet sich auch die Einrichtung eines Google Alerts) Die Seiten sollten nun eingehend geprüft werden: Wichtig sind hier vor allem die üblichen Verdächtigen wie Title, H1, Description, etc. Um doppelten Content zu vermeiden, sollten die Parameter index, follow bzw. noindex, nofollow ganz gezielt eingesetzt werden. Ebenso muss auf ein nicht zu starkes Wachstum der indizierten Seiten geachtet werden. In den letzten Wochen stellen wir sehr häufig fest, dass falsche Protokolle indiziert werden. Also statt http:// https:// etc., obwohl diese Seiten weder verlinkt noch vorhanden sind. User, die auf diese so indizierten Seiten klicken, erhalten gerade auch in den neuesten Versionen vom IE und Firefox auffällige Browsermeldungen mit dem Tipp, diese Seite sofort wieder zu schließen. Dies heißt es zu verhindern…


Copyright © 2007 Torsten Daus. Weight loss