Yahoo-Linkdaten unter der Lupe


Die Abfrage von Verlinkungen anderer Websites macht vieles leichter: Wer z.B. ein neues Dating-Portal startet, kann durchaus von den etablierten Portalen lernen. Welche Websites verlinken denn auf Sites wie www.friendscout24.de, www.ilove.de und www.parship.de? Da diese Seiten prinzipiell auch auf das eigene Portal verlinken könnten, verkürzen derartige Analysen die Suche nach guten Verlinkungsmöglichkeiten enorm.

Seit Jahren wird für die Analyse der Verlinkungen gerne die Suchmaschine Yahoo genutzt. Zwar kann man auch bei Google mit der Anfrage

link:www.domain.de (also beispielsweise: „link:www.contentmanager.de„) bzw.

link:www.domain.de/pfad/ (beispielsweise: „link:www.contentmanager.de/itguide/“)

abfragen, welche Seiten auf eine bestimmte Domain bzw. URL verlinken. Die von Google gelieferten Daten sind aber nicht sehr umfangreich und umfassen nur einen Bruchteil aller Verlinkungen. Das Google wesentlich mehr Verlinkungen kennt, zeigt der Blick in die Google Webmaster Tools. Die dort verfügbaren Daten sind extrem umfangreich – zeigen aber eben leider nur Links auf die eigenen Websites an. Der Blick auf die Verlinkung von Konkurrenten bleibt damit verborgen.

Der Zugriff auf Yahoo ist da – zumindest in Bezug auf fremde Websites – wesentlich bequemer. Über das Kommando

link:URL

erhält man sehr viele Verlinkungen für diese URL. In der Regel wird man das Kommando noch um -site:www.domain.de erweitern (also zum Beispiel „link:http://www.domain.de/ -site:www.domain.de“) um interne Links auszublenden. Auch das Kommando

linkdomain:www.domain.de

ist sehr interessant, weil es eben alle Links anzeigt, die auf eine bestimmte Domain verlinken. Dieses Kommando würde also sowohl Links auf die Startseite als auch Links auf tiefere Seiten innerhalb der Website anzeigen.

Kombinieren

Die Operatoren „link“ und „linkdomain“ darf man dabei beliebig kombinieren. Wer z.B. nach Linkseiten zum Thema Dating sucht, wird bei einer Suchanfrage wie „link:http://www.datingdomain.de“ von der Anzahl der Antworten erschlagen. Wer aber nach „link:http://www.datingdomain1.de/ link:http://www.datingdomain2.de/“ sucht, erhält nur Seiten, die auf beide Dienste verlinken. Die Chancen, hier eine Linkliste zu finden, sind dabei sehr hoch. Diese Anfrage kann man natürlich auch mit „linkdomain“ machen.

Auch kann man Suchbegriffe und Linkanfragen kombinieren. Wer also z.B. nach „flirt link:http://www.datingdomain.de“ sucht, erhält Seiten, in denen das Wort „flirt“ und ein Link auf die genannte Domain vorkommen.

Yahoo Linkdaten – Nur 1.000?

Der Nachteil der Yahoo-Abfrage – genau wie bei Google – liegt darin, dass man nur die ersten 1.000 Suchergebnisse abfragen kann. Bei vielen Websites ist das keine ernsthafte Beschränkung, aber wer Verlinkungen großer Portale (z.B. ebay, Amazon) analysieren möchte, stößt hier sehr schnell an Grenzen.

Es gibt leider keinen echten Weg, um mehr als 1.000 Suchergebnisse abzufragen, aber zumindest kann man sich mit einem Trick behelfen: Man führt viele Anfragen durch und führt die Ergebnisse zusammen.

Wer also möglichst viele Links einer bestimmten Domain erhalten möchte, kann z.B. viele Suchanfragen der Form „(Suchbegriff) link:www.domain.de -site:www.domain.de“ stellen. Wenn man diese Anfrage für sehr viele Suchbegriffe durchführt und die Ergebnisse zusammenführt, erhält man deutlich mehr als 1000 Suchergebnisse.

Automation

Das alles geht ab einem bestimmten Punkt natürlich nicht mehr manuell. Zwar kann man sich über den Yahoo! Site Explorer die Verlinkungsdaten im TSV-Format herunterladen (siehe Abbildung), aber für hunderte von Suchanfragen wird das dann doch sehr mühselig.

Yahoo! Site ExplorerYahoo! Site Explorer

Glücklicherweise gibt es von Yahoo eine Schnittstelle(neudeutsch: API), über die man automatisiert Anfragen stellen und Suchergebnisse erhalten kann. Die Suchparameter werden der API dabei als URL-Parameter übergeben, z. B.

http://api.search.yahoo.com/WebSearchService/V1/webSearch?appid=TOKEN&query=link:http://www.suchradar.de/&results=100&start=1

Einzige Voraussetzung für derartige API-Abfragen ist ein so genanntes Token, das man kostenlos bei Yahoo erhält und über den Parameter „appid“ übergibt.

Die Suchergebnisse kommen dann im XML-Format zurück (siehe Kasten „XML-Code“). Das Parsen dieser XML-Ergebnisse ist dadurch relativ einfach. Die API ist – obwohl schon seit mehreren Jahren im Betrieb – nicht immer sehr zuverlässig, so dass man hier schon robust programmieren muss.

So kommt es manchmal vor, dass eine leere Ergebnisseite geliefert wird oder dass die erste und die zweite Ergebnisseite Überschneidungen haben.

XML-Code

Die von Yahoo bereitgestellten Ergebnisse werden im XML-Format geliefert. Das folgende Code-Beispiel zeigt nur einen kleinen Ausschnitt der gelieferten Parameter und wurde stark verkürzt:

<?xml version=“1.0″ encoding=“UTF-8″ ?>

<ResultSet type=“web“ totalResultsAvailable=“

1780″ totalResultsReturned=“100″ firstResultPosition=“ 1″>

<Result>

<Title>SMX München – Ausstellung, 8-9 April, 2008</Title>

<Summary>Nach sehr erfolgreichen Veranstaltungen u.a. in New York, London und Stockholm … WebCertain’s Ziel ist es, Wachstum für Kunden zu generieren, die sich …</Summary>

<Url>http://searchmarketingexpo.com/munich_archive/2008/network.shtml</Url>

<ClickUrl>http://searchmarketingexpo.com/munich_ archive/2008/network.shtml</ClickUrl>

</Result>

</ResultSet>

Ergebnisse überprüfen

Dennoch ist die Yahoo-API ein hervorragendes Tool, um automatisiert Linkabfragen durchzuführen. Blind vertrauen sollte man den Ergebnissen aber auf keinen Fall. Bei einem Testlauf mit ca. 90.000 gelieferten URLs haben wir überprüft, wieviele der URLs wirklich einen Link auf die angefragte Website enthielten. Das Ergebnis zeigt, dass es sinnvoll ist, die URLs jeweils herunterzuladen und zu überprüfen, ob sich auf der jeweiligen Seiten ein für Suchmaschinen sichtbarer Link befindet:

  • 21,9% der Links konnten auf der jeweiligen Seiten nicht gefunden werden, d.h. dass sie entweder nicht (mehr) existierten oder als nofollow markiert waren.
  • 1,1% der Links befanden sich auf Seiten, die über einen Robots-Meta-Tag (noindex oder nofollow) verfügten.
  • 5,6% der Seiten konnten nicht abgerufen werden (i.d.R. 404, Server down oder Domain nicht mehr existent).
  • 71,4% der Links konnten gefunden werden (Seite konnte geladen werden, kein noindex/nofollow als Robots-Meta-Tag, Link konnte gefunden werden und war nicht als nofollow markiert).

Die Tatsache, dass Yahoo auch Links aufführt, die Nofollow-Links sind oder bei denen die Seite selber einen Meta-Robots-Tag „noindex“ oder „nofollow“ hat, sorgt oft dafür, dass die gelieferten Linkzahlen wesentlich besser aussehen als in der Realität. Oftmals zeigt Yahoo zwar an, dass es eine vier-, fünf- oder sogar sechsstellige Anzahl an Links gibt. Nach der Überprüfung bleibt davon aber oft wenig übrig, weil die Links z.B. von nur einer geringen Anzahl unterschiedlicher Domains kommen und zudem vielleicht als Nofollow-Links ausgeführt sind.

Fazit

Die Yahoo-Linkdaten sind eine sehr große Hilfe bei der Suche nach guten Linkseiten. Insbesondere die Abfrage über die kostenlose Yahoo-API vereinfacht das Sammeln der notwendigen Daten. Wichtig ist aber vor allem, dass die gelieferten Linkseiten auch überprüft werden, da Yahoo auch Links liefert, die von Suchmaschinen gar nicht gewertet werden.

Weitere Artikel:

Zurück zu Contentmanager.de

Bildquellen

  • magnifying-glass-626174_640: Pixabay
Previous Spektrum der Intranets: Suchprobleme auch im Intranet von Google?
Next Web-Design und Usability 2.0 - Die 10 Regeln der Gastfreundschaft

No Comment

Leave a reply

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

11 − sieben =