Linkbuilding

Linkbuilding bezeichnet gezielten, meist thematischen Linkaufbau. Also die schaffung von Backlinks die auf eine zu optimierende Webseite zielen. Je besser eine Domain von der verlinkt wird, in den Suchergebnissen steht und je besser Sie thematisch zu der Zielwebseite passt, desto mehr Linkpower hat der Backlink. Die Wertigkeit einer Domain wird anhand von Key-Performance-Indikatoren (KPI) ermittelt, diese sind z.B. Linkpopularität, Domainpopularität und IP-Popularität. Auch andere Faktoren wie die Anzahl der Indexierten Seiten sowie der technische Aufbau der Seite an sich, tragen zu der Suchmaschineneinstufung einer Webseite bei.

Indexierung von Inhalten

Die mittels Crawling ermittelten Dateien werden nun ausgewertet. Ein dem Format der Datei (also meist HTML, reiner Text oder PDF) entsprechender Parser zerlegt sie in ihre Einzelteile, also Metadaten wie Autor, Titel u.s.w. sowie den eigentlichen Text der Seite als Sequenz von Wörtern. Dabei wird oft auch beachtet, ob ein Wort besonders groß geschrieben oder fett ist, ob es Teil einer Überschrift oder eines Querverweises auf ein anderes Dokument ist. Alle Wörter werden nun in einem “invertierten Index” abgelegt. Dieser Index speichert für alle Wörter, die in mindestens einem Dokument vorgekommen sind, Paare von Dokumenten-Nummer und Position des Worts in diesem Dokument.

Tatsächlich werden noch weitere Informationen gespeichert, wie eben die bereits angesprochenen Metadaten oder die Formatierung der Wörter. Diejenigen Begriffe, mit denen auf ein anderes Dokument verwiesen wird tauchen eventuell ebenfalls im Index für dieses Dokument auf. Allerdings sind diese Details nicht nur von Suchmaschine zu Suchmaschine unterschiedlich, sie sind darüber hinaus undokumentiert. Die Betreiber der Suchmaschinen wollen sich nicht in die Karten sehen lassen.

Je nach Suchmaschine werden gewisse Begriffe gar nicht erst in den Index aufgenommen, sogenannte Stopwörter. Das sind sehr häufig vorkommende Wörter wie “the” im Englischen oder “ein” im Deutschen. Da sie in fast jedem Dokument der jeweiligen Sprache auftreten, wird ihnen keine Bedeutung zugemessen. Der Index wird durch das Weglassen außerdem deutlich kleiner. Trotzdem verzichten immer weniger Suchmaschinen auf Stopwörter. Für gewisse Anfragen sind sie eben doch von Interesse. Paradebeispiel ist der Shakespeare-Satz “To be or not to be”. Er besteht ausschließlich aus Stopwörtern, kann also nur gefunden werden, wenn sie in den Index aufgenommen worden sind.

Ein weiterer Vorbearbeitungsschritt ist das sogenannte Stemming. Dabei werden Begriffe auf ihren Wortstamm zurückgeführt. So werden “schöne”, “schöner”, “schönen” u.s.w. alle auf “schön” vereinfacht. Einerseits kann man so auch ähnliche Begriffe finden, andrerseits verliert man eine gewisse Genauigkeit.

Ein verwandtes Konzept bildet auch Synonyme aufeinander ab. Wer dann z.B. nach “stark” sucht, findet eventuell auch “kräftig”.

Schließlich wird auch die Sprache des Dokuments ermittelt, um Suchanfragen entsprechend einschränken zu können.

Crawling / Spidern

Die der Suchmaschine zugrundeliegende Datenbank hält eine Reihe von Adressen von Dateien vor (URLs, Uniform Resource Locators), deren Dokumente gelesen werden sollen. Die Adressen stammen aus folgenden Quellen: * Bereits im Index erfaßte Dokumente, die aber schon relativ lange nicht mehr geholt worden sind. Schließlich muß die Suchmaschine versuchen, mit inhaltlichen Änderungen der Seiten Schritt zu halten. * Adressen, die in heruntergeladenen Dokumenten gefunden wurden und noch nicht erfaßt waren. * Explizit auf entsprechenden Formularseiten (z.B. “Add URL” oder “Seite hinzufügen”) angegebene Adressen. Dies wird meist vom Ersteller der Seiten durchgeführt, immerhin möchte er über die Suchmaschine Besucher anlocken. Eine Reihe von Rechnern lädt nun mit diesen Adressen rund um die Uhr Dateien herunter und speichert sie in einer Datenbank. Die Dienstprogramme die dies ausführen bezeichnet man als Robots, Spider oder Crawler. Die Adressliste wird dann jeweils auf den neuesten Stand gebracht. Entweder wird vermerkt, daß die Datei erfolgreich übertragen wurde, oder ein Problem wird notiert, wenn etwa der Server nicht erreichbar ist. Bei einem Redirect, also einer permanenten Umleitung, wird die Adressliste auf den neuesten Stand gebracht. Nach einer gewissen Anzahl von Fehlversuchen entfernt die Suchmaschine eine Adresse aus ihrer Liste.

Probleme mit Frames

Posted by admin under SEO Optimierung Tags: , , ,  •  Kommentare deaktiviert

Framesets waren gerade wegen der site-übergreifenden Informationen (Navigation, Kopfzeile usw.) zu Beginn der grafischen Nutzeroberflächen von Websites sehr beliebt, doch heute sind derartige Strukturen komplett überaltert. Selbst wenn die einzelnen “Main”-Seiten durch die Suchmaschinen gefunden und indexiert werden, aus Marketing – Gesichtspunkten sollte man heute andere Formen der Site-Darstellungen wählen. Web 2.0 mag hier das aktuelle Stichwort sein; valide Seiten und letztlich barrierefreies Web.

Was sieht ein Suchmaschinen-robot auf einer Frames-Seite? Nichts! Denn die Seite mit der Frames-Definition hat keinen Inhalt und die aufgerufenen Unterseiten werden nicht verfolgt.

Was unter Umständen gefunden und katalogisiert wird, ist der NOFRAMES-Teil (z.B. findet ein Suchmaschine den Satz “Ihr Browser unterstützt keine Frames” 44300 mal im Netz). Der führt wiederum zu den einzelnen Seiten oder zu einer extra NOFRAMES-Version der Site.

Es gibt Techniken Framesets zumindest einigermaßen indizierbar für Suchmaschinen zu machen, es ist aber von der Nutzungs von Frames abzuraten.