Erkennung von unnatürlichen Link-Netzwerken
Netzwerke
Na, das klingt doch spannend - oder? Nein? Doch! Immerhin hängen etliche Fragen daran, die in Foren gerne gestellt werden: Kann meine Domain aus dem Index fliegen, wenn ein "Böser" einen Link auf sie setzt? Oder umgekehrt: Kann es mir schaden, wenn ich einen Link auf eine zweifelhafte Site setze? Darf ich meine Domains untereinander verlinken? Und noch viele andere...
Vorab eine kleine Klarstellung: Ein Netzwerk muss nicht a priori "böse" sein. Es obliegt Google, das zu beurteilen.
Das Netzwerk im Netzwerk finden
Viele stellen sich die Erkennung von Netzwerken ungefähr so vor: Der Google-Bot läuft durch das Labyrinth und zieht eine mehr oder weniger lange Schnur hinter sich her. Kommt er bei einer Tür herein und sieht bei einer anderen Tür das Ende der Schnur weglaufen - dann schnappt die Falle zu.
Das Problem dabei ist die Länge der Schnur: Ist sie zu kurz, würde Google nur die kleinen Webbastler-Vereine erwischen, die großen Netzwerke blieben ungeschoren. Ist die Schnur zu lang, würde das halbe Internet abgestraft werden.
Hier ein anderer Ansatz, der mehr Erfolg verspricht. Natürlich weiß ich nicht, wie Google das wirklich macht, aber es ist davon auszugehen, dass es so ähnlich gemacht wird.
Als Datenbasis braucht man eine Liste in dieser Form:
Block1 | Linkstärkezu | Block2 |
Block1 | Linkstärkezu | Block5 |
Block2 | Linkstärkezu | Block5 |
Ein Block wird meistens eine Domain sein, bei umfangreichen Domains kann aber zB ein Forum ein eigener Block sein: Ein Block ist einfach etwas, was vermehrt Links von außen bekommt + alles unterhalb. Fraglicher ist, was Linkstärke ("LinkPower") ist: Alle PageRanks aufaddiert wäre zu simpel, aber vielleicht die N-te Wurzel daraus oder ähnlich; sicher aber eine logarithmische Größe.
Das Universum nach dem Urknall:
Ich habe hier eine 2-dimensionale Berechnung + Darstellung gewählt, weil man es schlichtweg besser verstehen und abbilden kann, eine dimensionslose Berechnung würde wesentlich schneller sein. Die Kreuze sind die Zentren von 2 verschiedenartigen Netzwerken.
Zunächst bekommt jeder Block eine zufällige Startposition. Dann lassen wir das Universum wieder kollabieren:
Die Linkstärke wirkt ähnlich der Gravitation auf die Blöcke; sie bewegen sich aufeinander zu. Anders als in der Physik spielt die Entfernung aber keine Rolle, und sie wirkt nur auf den Link-gebende Block - schließlich kann der empfangende Block nichts dafür, dass er einen Link bekommt.
Bezogen auf die Zahlen oben: Block1 bewegt sich auf Block 2 und auf Block 5 zu, während sich Block 2 ebenso auf Block 5 zubewegt. Dieses kleine Netzwerk würde sofort "verklumpen" - und zwar an Block 5.
Das Schöne an dieser Rechnung: Sie funktioniert auch, wenn das alles nicht offensichtlich ist, etwa wenn Links über 20 Ecken gehen und Millionen von Domains mitspielen:
Ich habe es anhand von Testdaten (200 Domains, 2000 Links) mal durchgerechnet:
Blau und Gelb: Domains die eher zufällig untereinander und zu allen anderen Links haben. Blau: wenig Links in/out, Gelb: viele Links in/out
Grün: Domains, die untereinander leicht verbunden sind, aber mehrere starke Zentren haben. Das könnten zb Domains zum Thema Webdesign sein, die wenig Links untereinander, einige zu Kunden und Freunden, aber fast immer Dr. Web, Zen-Garden und weitere übliche Verdächtige in den Linklisten haben.
Magenta: Ein böses Spam-Netzwerk: Die Satelliten setzen nie Links reziprok, sondern immer über mehrere Ecken, die Hauptdomain ist nur lose und unauffällig von den Satelliten verlinkt.
Wie ist das zu interpretieren:
In den unteren 2 Bildern sieht man deutlich, worum es geht: Das obere bildet eine lockere Wolke. Google erkennt hier: Das sind Seiten, die thematisch zusammengehören. Im unteren Bild sieht man keine Wolke, sondern einen "Klumpen". Google muss gar nicht wissen, welche der Seite die "eigentlich Böse" ist, es reicht, alle Links von diesen Seiten nicht mehr zu werten. Unabhängig, welche Konstruktion genau dahinter steckt: Damit ist das künstliche Netzwerk tot.
Interessant: Die blauen = Seiten, die gar nicht dazugehören. Sie sind reingefallen, weil sie kaum Links nach aussen haben und ein einziger "Ausrutscher" bewirken kann, dass auch sie mitgerissen werden. Dass keine grünen dabei sind: Auch klar: Unter vielen Links wirkt sich ein einziger nicht so aus.
Und jetzt: Die Fragen zur Antwort
Kann meine Site abgestraft werden, wenn ich einen Link auf eine "böse" Site setze?
Ja. Umso mehr, je weniger Links du insgesamt hast. Ein falscher Link unter 100en hat keine spürbaren Auswirkungen, ein Linktausch mit einem "Netzwerker" kann aber ausmachen, dass deine Site zu dessen Netzwerk gerechnet wird - und eventuell mit rausfliegt.
Kann ich aus dem Index fliegen, wenn jemand auf meine Site linkt?
Jein. Normalerweise nicht. Wenn du aber auf jemanden linkst, der wieder auf jemanden linkt.. usw... kann sich die Schlinge - mit dir drin - zuziehen. Ein zweiter Fall wäre, wenn du aus einem Netzwerk einen sehr starken Link bekommst (kaufst), dieses Netzwerk aber selbst weitgehend "inzüchtig" ist.
Darf ich meine Domains untereinander verlinken?
Ja. Aber achte darauf, dass jede der Domains auch auf weitere - verschiedene Domains - linkt. Idealerweise auf ein paar der bekannten Sites, aber besonders auch auf kleinere und mittlere Sites, die wiederum Links zu anderen haben.
Fragen, die du gar nicht gestellt hast:
Warum gibt es so viele Web-Verzeichnisse?
Weil sich in der Masse der Links ein Spam-Netzwerk gut verstecken lässt. Nicht dass jedes Verzeichnis solchen Zwecken dient, aber manches hat ein solches Ausgedinge: Ein entsprechendes Verzeichnis kann jedes Spam-Projekt stabilisieren.
Äh - und kann mir ein Link aus einem Web-Verzeichnis schaden?
Nein. Außer es gehört zu dir und du hast nur deine Seiten drin stehen.
Und umgekehrt - ein Link zu einem Verzeichnis, auch wenn es nicht ganz sauber ist?
Kaum, da müsstest du schon wirklich Pech (und keine anderen Links) haben.
Und wie ist das mit "reziproken Links" (A>B, B>A)?
Das ist eine interessante Frage - danke, dass du sie gestellt hast!
In obiger Rechnung wirkt die "Gravitation" nur einseitig. Bei reziproken Links wirkt sie beidseitig. Es würden sich also leichter und schneller Cluster bilden. Es hängt aber stark davon ab, wie oft - und vor allem wie intensiv - du so etwas machst. Ein Backlink zu einem Webverzeichnis wird sicher nicht schaden, aber - falls du Webdesigner bist: Du (nur) zu allen deinen Kunden und deine Kunden gleich von der Startseite wieder zurück: lass es lieber.
Mögliche Missverständnisse:
Es geht hier darum zu zeigen, dass und wie Netzwerke erkannt werden können. Wenn deine Site zu einem Netzwerk gerechnet wird, muss das nicht unbedingt negative Folgen haben - es könnte sich bis zu einem gewissen Grad auch positiv auswirken, zB wenn sich im selben Netzwerk auch Authoritys aufhalten. Es könnte aber auch sein, dass ein gewichtiger Block gekickt wird (etwa nach einem Spamreport) und eine ganze Masse kleinerer Blöcke mitreisst.
Kommentare:
Interessante Überlegung, und wenn man das durchdenkt wird einem wiklich vieles etwas klarer. Ich kann mir vorstellen dass G00gle das so ähnlich macht. Vielleicht auch Facebook. Da habe ich mir schon oft überlegt, wie die zu den Vorschlägen kommen.
OssipAntworten
Es funktioniert hier bei uns im Saarland eher noch über "Ei ich kenne jemand, der kann das" und das ist immer noch besser als Google-Ranking. So haben wir unsere Firma aufgebaut. Aber WB ist halt immer noch das beste CMS und googlisiert durch die reziproken Links, hier muss ich verbessern: es ist B
Antworten
also, wenn man die netzwerke natürlich aussehen lässt, wird es nicht erkannt und bestraft. aber das kostet so viel arbeit, die man in den content stecken kann und dann die natürlichen empfehlungen nach sich ziehen.
Antworten
fazit: ehrlich währt am längsten