techlogs Webscience

BibSonomy: Publikationsmanagement 2.0

von Andreas Hotho, 22. Januar 2010, 11:20

Forscher und Daten

Nun ist es schon eine Weile her, dass das neue Blog hier eingerichtet ist und noch immer habe ich es nicht geschafft einen etwas ausführlicheren ersten Artikel zu schreiben. In den letzten Jahren habe ich mich viel mit Teilen des Web 2.0 beschäftigt. Eine von mir immer wieder in Vorträgen gern verwendete Landkarte des nun nicht mehr ganz so neuen Web 2.0 zeigt übersichtlich die verschiedenen Gebiete. Dabei gibt es eine große Breite, angefangen von den sozialen Systemen wie MySpace und Facebook über Wikis, Tagging und Blogs, bis hin zu Second Life. Das Web 2.0 im allgemeinen ist aber nicht Thema dieses Artikels. Vielmehr habe ich mich in meiner Arbeit auf einen Teil dieser neuen Landschaft gestürzt, auf die so genannten Social-Bookmarking- oder auch Collaborative-Tagging-Systeme, wobei ich heute auf ein System näher eingehen will. Dabei haben wir Forscher eine Reihe ganz unterschiedlicher und interessanter Fragen zu Tagging-Systemen, auf die wir zusammen mit den Kollegen in den letzten Jahren versucht haben, eine Antwort zu finden. Allerdings braucht man dazu die Daten dieser Systeme, manchmal sogar am besten von mehr als einem System.

Daten zu beschaffen ist für Forscher nicht immer ganz leicht und falls man zu viele Daten besitzt, kann das leicht sehr unangenehm werden, wie im Fall von SchülerVZ, wobei die rechtlichen Aspekte auch eine spannende Frage sind, die ich in einem der nächsten Artikel einmal ansprechen werde. Um effektiv die Phänomene solcher Systeme untersuchen zu können, brauchen wir Forscher aber Daten. Die Anbieter von Web 2.0 Systemen (also die Industrie) haben die Daten und wir - die Forscher - haben sie in der Regel nicht. Eine einfache und spannende aber auch sehr aufwendige Lösung ist das Entwickeln eines eigenen Systems. Der Bereich Publikationsmanagement bietet sich hierfür als Domäne an, da wir Forscher uns hier gut auskennen und auch sehr effektiv Anforderungen definieren können.

Das von uns entwickelte System heißt BibSonomy. Es steht allen Forschern frei zur Verfügung. Ziel ist es nicht nur einen weiteren Web 2.0 Dienst zur Verfügung zu stellen, sondern als Forscher auch auf eine Plattform für wissenschaftliche Experimente Zugriff zu haben. Das System erlaubt das Verwalten und Taggen (Verschlagworten) von Bookmarks (Web-Lesezeichen) und Publikation. Es wird mittlerweile vier Jahre alt und ich blicke zusammen mit meinen Kollegen aus der Gruppe in Kassel auf spannende Jahre der Forschung aber auch der Systementwicklung zurück. Heute werde ich ein paar grundlegende Funktionen sowie die Vorteile bzw. die Attraktivität solcher Systeme beschreiben. In den kommenden Blogeinträgen werde ich mehr auf dahinter liegenden Phänomene die man in Taggingsystemen beobachten kann eingehen und so auch den Bezug zur Web Science deutlicher machen.

Ein Taggingsystem

Auf den ersten Blick sieht BibSonomy anderen Bookmarkingsystemen sehr ähnlich. Auffallend sind die zwei zentralen Spalten, die Bookmarks und Publikationen getrennt darstellen. Nach der Anmeldung bekommt jeder Nutzer eine eigene Seite (hier z.B. meine) die alle seine gesammelten Einträge anzeigt. Das Sammeln wird durch so genannte Bookmarklets unterstützt. Das sind kleine JavaScript-Schnippsel, die in allen Browsern funktionieren. Ein Plugin, welches nur für den Firefox-Webbrowser existiert, integriert das Verwalten von Bookmarks besser und bietet eine erste Unterstützung beim Sammeln von Publikationen. Der Unterschied zum klassischen Verwalten von Bookmarks ergibt sich wie folgt: Beim Einstellen eines neuen Bookmarks oder einer neuen Publikation ins System werden diese nicht in einen Ordner einsortiert sondern mit frei wählbaren Schlagwörtern (Tags) beschrieben. Mit Hilfe dieser Schlagwort kann man später die Einträge wiederfinden. Die grundlegenden Funktionen sind damit beschrieben. Man kann einen Eintrag abspeichern und wieder aufrufen. Die Organisation der gespeicherten Einträge erfolgt mittels Tags, die sich einfach erstellen lassen, die aber gerade bei sehr vielen Einträgen auch Grenzen haben. Die Tags unterstützen den Nutzer bei der Suche und Navigation im System. Weitere Unterstützung für Neueinsteiger in die Welt des Taggings bieten z.B. unsere Tutorials.

Warum nutzen viele Nutzer Tagging-Systeme?

Taggingsysteme sind nicht ohne Grund sehr populär. Sie bieten häufig eine Reihe von Vorteilen. Man kann jederzeit von überall auf der Welt auf seine Bookmarks und Publikationen zugreifen. Das Verschlagworten mittels Tags ist sehr einfach und zwingt den Nutzer nicht, sich für einen Ordner zu entscheiden, wie das sonst nötig ist (Wer von uns hat nicht schon mal eine Datei gesucht, von der er wusste, dass Sie auf dem Rechner ist, aber das Verzeichnis wollte einem einfach nicht mehr einfallen?). Die breite Nutzerbasis und die Links zu anderen Nutzern machen das Stöbern im System spannend und man entdeckt schnell neue und interessante Einträge - in einer eher unerwarteten Art - man kann also nicht behaupten, man hätte gezielt danach gesucht. Das liegt wohl auch daran, das viele Gleichgesinnte solche Systeme nutzen und so für andere Nutzer spannenden Inhalt einstellen. Ein weiterer Aspekt, der in eine ähnliche Richtung geht, sind die Zusammenfassungen der Daten in Form von Tag-Clouds, z.B. für alle Tags des Systems um einen Überblick zu bekommen, eine Seite mit aktuell beliebten Einträgendes Systems oder die Integration der Daten durch gängige Formate wie RSS in andere Systeme. Dadurch lassen sich die gesammelten Einträge leicht ins eigene Blog oder die eigene Webseite integrieren.

Wie unterstützen wir Wissenschaftler bei der Arbeit in BibSonomy?

Starten wir beim Sammeln von Literatur. Die für das Schreiben eines Aufsatzes benötigte Literatur findet man immer häufiger im Web. Hat man dort eine Referenz gefunden, übernimmt man die Daten in die eigene Literaturliste, was ein mühsamer Prozess ist. Das Abtippen aber auch das manuelle Kopieren der einzelnen Einträge einer Publikation ist mühsam. BibSonomy bietet hier einen so genannten Scraping Dienst an, der automatisch die Daten aus bekannten Systemen (z.B. Digitalen Bibliotheken wie ACM) übernimmt und die Referenzinformation damit vollständig kopiert. Der Dienst wird bei Nutzung des Bookmarklets für Publikationen automatisch verwendet. Mittels einer großen Anzahl von Exportfiltern kann man dann diese Information in das richtige Format bringen und z.B. während des Schreibens in Word integrieren.

Durch die Integration der Daten in verschiedene Content-Management-Systeme wie z.B. Typo3 lassen sich leicht eigene Publikationslisten für das Web erstellen und durch sehr geringen Aufwand pflegen. Auch Seiten für Gruppen sind möglich. Mit Hilfe der von uns angebotenen REST-API, einer Schnittstelle für externe Programme, haben wir das Literaturverwaltungsprogramm JabRef mit BibSonomy gekoppelt. Damit kann man alle Daten von BibSonomy mit JabRef synchronisieren und hat so auch offline leicht Zugriff auf die eigenen Referenzen.

Es gibt noch eine ganze Reihe an Funktionen, die den Rahmen dieses Beitrags sprengen würden. Aktuelle Informationen gibt es auf unserem BibSonomy Blog.

Wie unterstützt BibSonomy die Forschung an solchen Systemen?

Mit der Antwort zu dieser Frage möchte ich den heutigen Beitrag beenden. Viele unserer Forschungsergebnisse sind mittlerweile als neue und wie wir denken nützliche Funktionen ins System eingeflossen. So gibt es ein neues Ranking, beim Tagging wird man durch Empfehlungssysteme unterstützt und im Hintergrund läuft ein Framework zum automatischen Erkennen von Spam, welches Verfahren des Maschinellen Lernens nutzt. Leider gibt es durchaus den einen oder anderen Nutzer, der das System ganz regulär nutzt aber trotzdem vom Framework als Spammer eingestuft wird - eine kurze Mail an uns reicht und wir gehen der Sache nach.

Um Forschern eine Chance zu geben, auch Experimente in einem laufenden System durchführen zu können, haben wir in den letzten zwei Jahren die ECML PKDD Discovery Challenge organisiert. Der Höhepunkt war in diesem Jahr die Online Challenge bei der 14 Recommendersysteme in das laufende BibSonomy-System integriert wurden und online gegeneinander antreten mussten. Das Gewinnersystem wurde als Ergebnis der Challenge dauerhaft ins System integriert. Dieses Beispiel zeigt, dass BibSonomy nicht nur nützlich ist, sondern auch Forschern für Experimente dienen kann.

Weiterhin stellen wir alle öffentlichen Daten Forschern für Forschungszwecke in einem Dump zur Verfügung. Wer also eigene Analysen machen möchte, sei hiermit dazu herzlich eingeladen. Da nur mit einer großen Nutzerbasis die gemachten Analysen wertvoll sind, hoffe ich, dass ich mit diesem Artikeln auf ein spannendes Web 2.0 System aufmerksam machen konnte. Testen Sie BibSonomy und falls Sie Fragen, Anregungen und auch Kritik haben, melden Sie sich einfach beim BibSonomy-Team.


antworten

Artikel kommentieren
 authimage

Kommentare

  1. Martin Huhn Nutzer von BibSonomy
    27.01.2010 | 15:21

    Nun bin ich endlich mal dazu gekommen den Beitrag zu lesen. Hört sich interessant an. Ist das Tool denn für jeden offen? Wobei ich nicht weiß, ob ich unbedingt möchte, daß jeder meine bookmarks sehen kann. Wie sieht es überhaupt mit den Nutzern aus? Sind das überwiegend Studenten/Wissenschaftler aus dem Informatikbereich - also Fachkollegen - oder auch jederman, der so gerade übers Internet angesurft kam?

  2. Andreas Hotho Re: Nutzer von BibSonomy
    27.01.2010 | 15:31

    Das Tool ist frei verfügbar. Wir planen auch, den Code demnächst unter Open Source Lizenz zur Verfügung zu stellen.

    Was die Sichtbarkeit der Bookmarks angeht, so gibt es eine Rechte- und Gruppenverwaltung. Man muss also nicht alles öffentlich machen ;-).

    Was die Nutzer angeht, so sehen wir in der letzten Zeit Nutzer mit sehr unterschiedlichen Themen im System. Einen gewissen Fokus der Nutzer zum Web 2.0 und zur Informatik findet man aber schon noch. Die meisten Nutzer sind aber vermutlich Wissenschaftler, die das System zum Sammeln von Publikationen nutzen.

  3. Michael Blume Schöne Landkarte
    06.02.2010 | 22:57

    Habe gerade die Landkarte angeschaut - und geschmunzelt! Zufällig hatte ich gerade einen Post zu Fantasy-Rollenspielen eingestellt - auf den Seiten der Techlogs und in einer Diskussion von Web 2.0 hatte ich nun aber wirklich kein augenzwinkerndes Fantasy-jpg erwartet! War eine pfiffige und gut gemachte Überraschung mit Wiedererkennungs-Faktor, danke! :-)

  4. Martin Huhn kein Betreff
    23.03.2010 | 11:40

    Ich habe mich jetzt mal für BibSonomy angemeldet. Ich konnte auf die Schnelle nichts finden. Kann man die Browser Lesezeichen importieren oder muß man die Webseiten alle aufrufen und dann bei BibSonomy neu hinzufügen?

  5. Andreas Hotho import
    23.03.2010 | 20:38

    @Martin, in den Settings gibt es einen Import für Firefox-Bookmarks. Ich hoffe, das hilft.

    Viele Grüße
    Andreas

  6. Martin Huhn Import
    24.03.2010 | 08:48

    Hallo Andreas,

    zuerst habe ich Deinen Kommentar aus dem Spam befreit und dann das Lesezeichen im html-Format exportiert und dann in BibSonomy importiert. Hat alles geklappt.

Artikel kommentieren
szmtag