techlogs Webscience

Metadaten, pfui? Metadaten, hui!

von Steffen Staab, 20. Dezember 2009, 20:25

Metadaten sind Daten über Daten. Im Hyperspace des World Wide Webs kann man fast seit Anbeginn mittels eines Tags, <meta>, Aussagen darüber anbringen, was in einem Hypertext steht, was aber nicht angezeigt werden sollte. Dies sollte es ermöglichen, nicht den Hypertext selbst als bestmögliche Beschreibung einer Webseite zu verwenden, sondern etwas kürzeres und genaueres.

Schade nur, dass diese Möglichkeit von Spammern dazu benutzt wurde, Suchmaschinen auf die falsche Fährte zu locken.

<meta>Auto, Motorrad, Urlaubsreise, Megan Fox</meta>

Im <meta>-Abschnitt wurde oft alles mögliche untergebracht, was versprach, Blicke auf die Seite zu führen, nur keine wahren Informationen. Die Suchmaschinenbetreiber reagierten prompt. Alle Informationen im <meta>-Abschnitt wurden quasi seit Anbeginn aller Web-Suchmaschinen konsequent ignoriert.

Dr. Peter Mika von Yahoo Research Barcelona hat nun die Metadaten auch für Suchmaschinen wiederbelebt. SearchMonkey heisst sein System. Seine Überlegung war einfach, aber clever: Wenn Spammer die Metadaten benutzen können, um die Nutzer auf eine falsche Seite zu locken, dann werden sie das tun. Deswegen ignorieren alle Suchmaschinen die Metadaten immer noch, wenn es darum geht, zu bewerten, wie relevant eine Webseite für ein Schlagwort ist. Wenn ich nach "Urlaubsreise" suche, dann möchte ich eben nicht fälschlicherweise auf eine Seite geführt werden, die mir in Wirklichkeit etwas anderes verkaufen will. Wenn aber die Suchmaschine mit den üblichen anderen Kriterien herausgefunden hat, dass mein Suchwort "Urlaubsreise" für diese Webseite relevant sein könnte, dann kommen die Metadaten ins Spiel. Der Webseitenbetreiber kann jetzt nämlich die Metadaten benutzen, um zu beschreiben, wie seine Webseite in der Ergebnisübersicht dargestellt werden soll. In der Ergebnisübersicht konkurrieren auf einmal Webseiten ohne Metadaten und einer unkontrollierten Zusammenfassung durch die Suchmaschine mit den Webseiten, deren Zusammenfassungen mittels Metadaten der Webseiten-Betreiber optimiert wurden.

Das Resultat: Laut Yahoo erzielen Webseiten mit entsprechenden Metadaten - bei konservativer Zählung - eine 15% höhere Click-Rate, wenn sie es einmal geschafft haben unter die ersten zehn Ergebnisse zu kommen. 15% Zuwachs, das ist in der Web-Werbung ein Millionengeschäft. Darüberhinaus richtet sich die Bewertung der Suchmaschinenbetreiber nach den verwendeten Worten im Text, nach den Empfehlungen durch Hyperlinks von anderen Seiten, und - nach den Anzahl der Clicks, die eine Seite erfährt. Das bedeutet, dass eine höhere Clickrate aufgrund von Metadaten zu einem besseren Ranking durch die Suchmaschinen führt und dass wieder zu einer höheren Clickrate, usw.

BestBuy.com berichtet deswegen sogar noch von viel besseren Zahlen. Seit September 2009 benutzt BestBuy.com Metadaten, um Preisangeboten zu seinen Elektronikprodukten den Suchmaschinenbetreibern mitzuteilen. Seitdem sei der Traffic um 30% gestiegen!  

BestBuy verwendet hierfür die GoodRelations mit RDFa, um seine Metadaten zu beschreiben. RDFa ist ein Metadatenformat des World Wide Web Consortiums für das Semantic Web, das sich gut in HTML-Seiten einbetten lässt. GoodRelations ist ein einfaches Vokabular mit maschinenverstehbaren Querbeziehungen, eine Ontologie (im Sinne der Informatik, nicht im Sinne der Philosophie). Prof. Dr. Martin Hepp von der Bundeswehruniversität München hat GoodRelations entwickelt, um Produktdaten in das Semantic Web zu bringen. Er hat auch anhand einer Testseite herausgefunden, dass Google mit seinen RichSnippets nun eine ähnliche Strategie verfolgt wie Yahoo mit seinem SearchMonkey-System.

Nachdem Google nun an Bord ist, ist das Rennen um die Metadaten in vollem Gange. Wer nutzt die früher verpönten Metadaten am geschicktesten, um seine Verkäufe zu erhöhen? Die sprichwörtliche Garage wartet nun darauf, dass ihre Besitzer das Metadaten-Google gründen.



antworten

Artikel kommentieren
 authimage

Kommentare

  1. Martin Hepp Informationen zu Goodrelations
    20.12.2009 | 23:51

    Vielen Dank für die Erwähnung von GoodRelations - hier alle Infos für Developer:

    Project Main Page: http://purl.org/goodrelations/

    Vocabulary: http://purl.org/goodrelations/v1

    Developer's Wiki: http://www.ebusiness-unibw.org/wiki/GoodRelations

    Cookbook mit Beispielen:
    http://www.ebusiness-unibw.org/...pes_and_Examples

  2. Martin Huhn kein Betreff
    22.12.2009 | 09:28

    Das ist ein sehr interessanter Beitrag. Nun muß ich nur noch die Zeit finden, um mich damit ausführlich zu beschäftigen.

  3. Martin Huhn @ Hepp
    22.12.2009 | 09:29

    Vielen Dank für die Links.

  4. Steffen Staab Semantische Suchmaschinenoptimierung
    23.03.2010 | 13:54

    Nun als Service: Semantische Suchmaschinenoptimierung
    http://leobard.twoday.net/stories/6252913/

  5. Austrotrabant Metadaten, revamped?
    20.07.2010 | 10:45

    Ich bin Jurist, man sehe mir also den unpräzisen Sprachgebrauch nach.

    Worin besteht jetzt genau der Unterschied zwischen den "alten" und den "neuen" Meta-Tags?
    Kann im Rahmen der RDFs selbst verhindert werden dass es wiederum zu Missbrauch kommt, oder liegt es auch weiter bei der Suchmaschine die Relevanz ohne Einbeziehung dieser Daten zu ermitteln, während diese sich dann ausschließlich auf die Darstellung der Daten auf der SERP auswirken?

    Und wenn die Darstellung "besser" ist, steigt die CTR und dieser wirkt sich dann auch auf die zukünftige Reihung aus.

    Korrekt?

    Wie gesagt, leider nur ein (interessierter) Laie.

    Mit besten Grüßen,

    Austrotrabant

Artikel kommentieren
szmtag