Wenn Algorithmen für uns denken

Die Angst ist groß, das muss man schon mal sagen. Die sogenannten Geistesarbeiter werden überflüssig, werden durch Computer ersetzt. Zeitungsberichte werden durch sie geschrieben

und ganze e-Book-Schmöker auf Amazon – im Stundentakt. Mehr noch: Bewaffnete Drohnen werden künftig die Entscheidung über Leben und Tod berechnen.

Eine Internetseite auf der man viele Meldungen aus aller Welt zusammengefasst lesen kann ist newstral.de. Es gibt nicht nur Tageszeitungen und Magazine sondern auch die Headlines aus wichtigen Blogs. Da kommt schon ganz schön etwas zusammen. Man kann einzelne Seiten ausschließen oder nur regionale Nachrichten herausfiltern und lesen. Passend zum eigenen Standort gibt es den Ausschnitt einer Karte mit entsprechender Nachricht.

Wehrführer bestätigt

Ich sitze in Berlin und bekomme ziemlich regelmäßig die Berliner Mitte als Kartenausschnitt: Unter den Linden, Brandenburger Tor, Reichstag. Eine wenig erstaunt war ich bei der Nachricht dazu: „Wehrführer im Amt bestätigt“ – das kann sich ja nur um eine Zeitreise handeln. Beim genaueren Hinsehen: „Pellworms Wehrführer im Amt bestätigt“ Ok, das Schlimmeste ist nicht eingetreten, aber was ist daran regional Berlin?

Ausschnitt der Newstral Website mit Karte

Ausschnitt der Newstral Website mit Karte

Es handelt sich um eine Meldung über die Pellwormer Feuerwehr aus den Husumer Nachrichten. Deren Mitglieder trafen sich, um den Chef zu wählen. Wo trafen sie sich? Im Gasthof „Unter den Linden“. Jetzt kommt Licht in die Sache. Offensichtlich für den Algorithmus die einzige geografisch verwertbare Information. Die Nennung des Ortes Pellworm (in den Formen Pellworms und Pellwormer) wurde nicht als geografische Information erkannt.

Tags: Unter den Linden, Malta

Um auswertbare Information zu haben, Metainformationen möglicherweise, ist es üblich Tags zusetzen, die den Text ergänzen. In diesem Falle hatte die Nachricht zwei Tags Unter den Linden und Malta. Wie wir zu Unter den Linden kommen dürfte klar sein, aber woher stammt Malta? Im Text gibt es neben vielen Namensnennungen auch einen Malte. Und ich befürchte, dass dieser durch Stemming zu Malta wurde. Stemming ist eine durchaus üblich Methode und unterschiedliche Wörter auf einen einheitlichen Wortstamm zurück zu führen. Dabei schneidet man am Ende einfach etwas ab, das was man für die Endung hält.

Ausschnitt der Husumer Zeitung (Website)

Ausschnitt der Husumer Zeitung (Website)

Das große Hasensterben auf Pellworm

Diese Beispiel zeigt, wie gleich zweimal Algorithmen versagen. Hier hätte es einer Prüfung bedurft und das wird in der nächsten Zeit auch so bleiben. Automatische Auswertungen bringen wichtige Erkenntnisse, aber manchmal auch nur Mist.

  • An die Stelle meinen herzlichen Glückwunsch an Jens-Uwe Jensen zur Wiederwahl als Wehrführer.
  • An alle Big Data Anwender: Bitte die Ergebnisse kontrollieren.
  • Und als P.S. Das große Hasensterben auf Pellworm – darum sollten wir uns jetzt kümmern! (Screenshot oben links)
Dieser Eintrag wurde veröffentlicht in Data von Frank. Setze ein Lesezeichen zum Permalink.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.