Crawling / Spidern

Die der Suchmaschine zugrundeliegende Datenbank hält eine Reihe von Adressen von Dateien vor (URLs, Uniform Resource Locators), deren Dokumente gelesen werden sollen. Die Adressen stammen aus folgenden Quellen: * Bereits im Index erfaßte Dokumente, die aber schon relativ lange nicht mehr geholt worden sind. Schließlich muß die Suchmaschine versuchen, mit inhaltlichen Änderungen der Seiten Schritt zu halten. * Adressen, die in heruntergeladenen Dokumenten gefunden wurden und noch nicht erfaßt waren. * Explizit auf entsprechenden Formularseiten (z.B. “Add URL” oder “Seite hinzufügen”) angegebene Adressen. Dies wird meist vom Ersteller der Seiten durchgeführt, immerhin möchte er über die Suchmaschine Besucher anlocken. Eine Reihe von Rechnern lädt nun mit diesen Adressen rund um die Uhr Dateien herunter und speichert sie in einer Datenbank. Die Dienstprogramme die dies ausführen bezeichnet man als Robots, Spider oder Crawler. Die Adressliste wird dann jeweils auf den neuesten Stand gebracht. Entweder wird vermerkt, daß die Datei erfolgreich übertragen wurde, oder ein Problem wird notiert, wenn etwa der Server nicht erreichbar ist. Bei einem Redirect, also einer permanenten Umleitung, wird die Adressliste auf den neuesten Stand gebracht. Nach einer gewissen Anzahl von Fehlversuchen entfernt die Suchmaschine eine Adresse aus ihrer Liste.

Doorway Pages

Posted by admin under SEO Spam Tags: , , , , , , , ,  •  Kommentare deaktiviert

Doorway Pages sind hoch optimierte Seiten, deren alleiniger Zweck es ist, bei den Suchmaschinen angemeldet und dort gut platziert zu werden. Daher kommt auch der Begriff Doorway: Die Seiten sollen einen Eingang in die zu promotende Website darstellen, über den der Nutzer von der Suchmaschine auf die eigene Seite kommt.

In der klassischen Ausführung haben diese Seiten keinen Inhalt, sondern wiederholen lediglich den Begriff, für den sie optimiert wurden, mehrfach; daher sind diese “Doorway Pages” im Prinzip für den Nutzer einer Site sinnlos. Sie werden deshalb auch nicht von der eigentlichen Website aus verlinkt und sind nur über Suchmaschinen zugänglich. Durch einfache Methoden der Link-Analyse erkennen heutige Suchmaschinen Doorway Pages recht einfach, so dass zumindest die einfache Form nicht mehr sinnvoll eingesetzt werden kann.

andere Bezeichnungen: Doorway Seiten, Doorwayseiten, Doorways, Brückenseiten, Gateway Pages, Gateway Seiten, Gatewayseiten (Quelle: suchmaschinentricks.de)