Software erkennt heiße News

Software erkennt heiße News an Wikipedia
Viele gleichzeitige Änderungen zeigen wichtige Ereignisse auf
 
Wikipedia-Bearbeitung: das könnte wichtig sein (Foto: Sarah Stierch, flickr.com)

Hamburg/Brüssel/Washington (pte002/15.04.2013/06:05) – Ein internationales Forscherteam um den deutschen Google-Mitarbeiter Thomas Steiner hat eine Software entwickelt, die anhand von Wikipedia-Einträgen erkennt, was aktuell heiße Nachrichten sind. Dazu beobachtet der in einer Live-Demo vorliegende "Wikipedia Live Monitor" http://bit.ly/wikimonitor die Änderungen, die an Artikeln vorgenommen werden. Denn viele gleichzeitige Bearbeitungen in verschiedenen Sprachversionen sind ein Zeichen, dass es wirklich eine weltbewegende Neuigkeit gibt – wie ein regelrechter Bearbeitungs-Krieg nach dem Tod Michael Jacksons 2009 gezeigt hat.

Nach Angaben von Steiner gegenüber pressetext gibt es verschiedene Ideen, wie die neue Software in Zukunft eingesetzt werden könnte. Die wohl offensichtlichsten sind, Daten für ein News-Ranking heranzuziehen oder die Klassifizierung von Nachrichten zu erleichtern. Aber auch andere Anwendungen wie eine "Storification" von News durch Verbindung von Social Media mit Wikipedia-Inhalten wären denkbar.

Bearbeitung zeigt Aufreger

Die Idee hinter der Software ist eigentlich einfach. Gibt es eine aktuelle Nachricht, die wirklich viele Menschen bewegt, führt das im Informationszeitalter auch dazu, dass es sehr schnell zu vielen Bearbeitungen passender Wikipedia-Einträge kommt. Nach dem Jackson-Tod beispielsweise haben etliche User praktisch gleichzeitig versucht, seinen Wikipedia-Eintrag um Todeszeitpunkt, Umstände des Todes und andere Details zu ergänzen. Die Software beobachtet also die Änderungs-Aktivität bei diversen Sprachversionen der Wikipedia und identifiziert anhand von gleichzeitigen Bearbeitungen äquivalenter Artikel in diversen Sprachen mögliche Kandidaten für heiße News.

Vergangenen Freitag konnte pressetext beobachten, wie schnell das funktioniert, denn da gab es die Auslosung für das Halbfinale der UEFA Champions League. Anhand der vielen Änderungen an Wikipedia-Artikeln zur Fußball-Eliteliga hat der Wikipedia Live Monitor binnen kürzester Zeit auf ein heißes Thema geschlossen. Freilich war hier vorab klar, dass es ein heißes Thema gibt. Interessanter dürfte die Software für unerwartete Ereignisse sein, wobei den Forschern zufolge ein zusätzliches Erfassen von Wikipedia-Klassifizierungen sinnvoll wäre. Denn wird beispielsweise jemand aus der Kategorie "lebende Personen" gestrichen, ist das ein Hinweis auf einen aktuellen Todesfall.

Abschätzen, was wichtig ist

Das System erlaubt dem User schon jetzt, Vorgaben zu machen – beispielsweise, wie viele Bearbeitungen von äquivalenten Artikeln es geben muss und wie viele verschiedene Nutzer die Änderungen vornehmen müssen, ehe das System etwas als "Breaking News"-Kandidaten einstuft. Dabei geht es Steiner zufolge darum, dass einzelne Nutzer sinnvolle Abschätzungen bekommen, was aus ihrer Sicht wichtig genug und somit relevant ist. Gerade mit geplanten Erweiterungen würden sich noch zusätzliche Möglichkeiten eröffnen – beispielsweise, dass ein angebundenes System automatisch mit dem Liveschalten passender Storys auf einen Promi-Storyfall reagiert.

Das ist vorerst aber noch Zukunftsmusik, doch glauben die Entwickler an das Potenzial des quelloffenen Wikipedia Live Monitors, den sie Mitte Mai auf der World Wide Web Conference http://www2013.org näher vorstellen werden. So habe die Software gegenüber dem Ansatz, aktuell wichtige Nachrichten automatisch an Postings auf sozialen Netzwerken zu erkennen, den Vorteil, dass es selten zu "False Positives" – einem Einstufen unwichtiger Nachrichten als große News – kommt. Wirklich Wichtiges werde aber ebenso gut erkannt und das letztlich mit viel weniger Rechenaufwand.