In welchem Zusammenhang stehen Wörter zueinander?
Keyword-Stemming und Auswahl der Suchbegriffe
Speziell im Zusammenhang mit AdSense ist es für Google - aber auch für andere Suchmaschinen - wichtig zu wissen, was das "Thema" einer Website ist, statt einfach nur die Zeichenketten zu zählen. Damit in Zusammenhang steht auch das Stemming, also das Erkennen des Wortstammes und der Ableitungen/Zusammensetzungen davon.
Wenn auf einer Website sowohl von "Onlinetool" als auch "Online-Tool" und "Onlinetools" die Rede ist, sind das - wenn man nur die Zeichenketten berücksichtigt - 3 verschiedene Begriffe. Erkennt die Suchmaschine aber, dass es sich um ein und denselben Begriff handelt, kann sie die Seite besser einem Thema zuordnen.
Die zugrunde liegenden Regeln sind im englischen einfacher und auch der Sprachraum ist größer. Deswegen wird Stemming für englische Seiten schon lange verwendet, bei deutschen Seiten ist Google noch vorsichtiger. Es darf ja auch nicht vergessen werden, dass etwa Einzahl und Mehrzahl eines Begriffes nicht das selbe bedeuten: ein einzelnes "Buch" ist nicht dasselbe wie ein Stapel "Bücher". Also: Wer die Mehrzahl sucht, wird wohl die Mehrzahl meinen.
Suchmaschinen gehen daher nicht so weit, abgeleitete Begriffe gleich zu werten, allerdings werden die Wortvorkommen einander zugerechnet. Kommen auf einer Seite oft die Begriffe "Chipkarte" (EZ) UND "Chipkarten" (MZ) vor, wird die Site für beide Wörter relevanter angesehen als für jedes allein.
In der Praxis scheint es derzeit so zu sein, dass diese Zurechnung etwas einseitig funktioniert: Enthält ein Wort seinen Stamm, wird es auch dem Stamm zugerechnet, umgekehrt aber nicht. Will heißen: Eine Seite, die den Begriff "Chipkarten" (MZ) enthält, wird gegebenenfalls auch beim Suchbegriff "Chipkarte" angezeigt, aber nicht umgekehrt. Die gesuchte Zeichenkette muss also vollständig enthalten sein. Auch ist beim Wort "Chipkarte" die Pluralbildung sehr simpel, die Suchmaschine ist sich hier recht sicher.
Bei Begriffen mit einfacher Plural-Bildung ist daher im Zweifelsfall der Mehrzahl der Vorrang zu geben, besonders dort, wo entweder/ oder sein muss; im URL oder im Title.
Aus meiner Erfahrung mit dem Online-Tool webeye weiß ich, dass Stemming recht heikel sein kann: Die deutsche Sprache hat so ihre Tücken und wer sich zuweit hinauslehnt, kann recht "ulkige" Fehler produzieren. Derartige Peinlichkeiten kann sich eine Suchmaschine nicht leisten, deswegen wird Stemming nur im Hintergrund und nur auf der "sicheren Seite" angewendet.