Der Anteil von Vegetariern an der Bevölkerung eines Landes

Das kleine Datenprojekt Sie kennen das: Mit Kollegen beim Bier – tolle Ideen, Projekte und was man nicht alles machen könnte. Das beste daran: Alles ganz einfach, ich habe da was im Internet gesehen. Dann kommt der nächste Tag und irgend jemand kann sich sogar noch an die ganz einfachen Projekte erinnern. Die Visualisierung von Daten macht viele Sachverhalte anschaulicher und transparenter und im besten Falle gewinnt man beim Bearbeiten der Daten noch ein paar neue Erkenntnisse. Wie könnte ein kleines Beispiel für Daten-Visualisierung aussehen?

Content gesucht – für eine Website zum Thema Vegetarismus/ Vegan(-ismus?)

Angeblich werden ja diese Vegetarier immer mehr. Aber wie viele sind denn da? So als Anteil an der Bevölkerung eines Landes? Das müsste doch auf die Schnelle heraus zu finden sein, dann ein Weltkarte und die Prozente rein – „fertich ist die Gartenlaube!“ Oder nicht? „Der Anteil von Vegetariern an der Bevölkerung eines Landes“ weiterlesen

Was macht eigentlich ein data scientist?

[slideshare id=16190193&w=427&h=356&sc=no]

Ist schon irgendwie Schade (und bezeichnend), dass der Autor sich anscheinend für die Verwendung des Begriffs Big Data entschuldigt. Besonders interessant finde ich die Unterscheidung zwischen Datenanalyse (eher Business-orientiert) und Data Science (eher Daten erkundend) auf Folie 32.

Silenc – Visualisierung von Lauttilgungen

Schon etwas älter, aber immer noch sehr schön: Visualisierung des Wegfalls von Lauten in verschiedenen Sprachen.

[vimeo http://www.vimeo.com/39114742 w=400&h=300]

Und scheint gar nicht „so …“ schwer – nur mit grep *hust*.
Gefunden übrigens bei Flowing Data von Nathan Yau. Und hier wär‘ dann das Original: Copenhagen Institute of Interaction Design und der Macher Kenneth Aleksander Robertsen.

Der Blick in die Zukunft

Wahlen und die Zeit unmittelbar davor sind die Stunde der Statistiker. Besonders bei einem Kopf-an-Kopf-Rennen wie bei den US-amerikanischen Präsidentenwahlen wird häufiger nachgefragt und überlegt, wo Fehler in der Berechnung sein könnten. Nach der Wahl zeigt sich nun auch, wo die Statistiker recht hatten und wo sie sich verrechnet haben. Zwei große deutsche Zeitungen (Die Zeit, FAZ) berichten über Nate Silver. Er konnte diesmal die Ergebnisse aller Bundesstaaten vorhersagen. Geglaubt haben es wahrscheinlich die Wenigsten. Mit einer ausreichend großen Datenbasis und etwas Mathematik kann man eine sehr gute Voraussage abgeben. Doch woher kommen diese Daten? Richard Gutjahr schreibt in seinem Blog über „Obama und den Datenbergbau„. Es geht nicht nur um die Erfassung verschiedener Daten, sondern auch um die Verbindung dieser Daten.

Unregelmäßige Verben – Jetzt reichts!

Jetzt reichts mir! Es heißt: gib nicht gebe! Nein, nicht gebe deine Stimme ab. Nicht, gebe Darlehen.

Ausschnitt einer Website mit Werbebanner
Gib!!! Nicht Gebe. Von mir kriegt ihr nüscht, erst richtch schreim.

Es nervt einfach! Es gibt unregelmäßige Verben und die kann man auch benutzen. Aus e wird i. Imperativ Singular (Aufforderung, Einzahl), endet mit einem Ausrufezeichen! Um beim nächsten esse gibt es auf die …

Update: Der Duden-Newsletter (21. September 2012) beschäftigt sich auch mit diesem Thema: „e/i-Wechsel bei starken Verben“. Leider gibt es keine Vorschau des aktuellen Textes (bzw. ich habe keine gefunden), aber hier geht’s zu Anmeldung. Ich zitier mal:

Bei fast allen starken Verben, die im Infinitiv ein e bzw. ä oder ö haben, wechselt historisch bedingt der Stammvokal in bestimmten Formen zu i. Die davon betroffenen Formen sind die 2. und 3. Person Singular Präsens sowie der Imperativ Singular. Deshalb sagen wir das Eis schmilzt (von schmelzen), das Licht erlischt (von erlöschen), lies bitte lauter (vonlesen), wirf das weg (von werfen) etc.

Deutsche Inhalte im Internet – Zur Debatte um das Leistungsschutzrecht

Frau Leutheusser-Schnarrenberger verteidigt das geplante Leistungsschutzrecht (LSR).  Die private Nutzung sei ausdrücklich ausgenommen und Zielgruppe sind Google und Co., die (Zitat heise)

Adressaten des Gesetzentwurfs seien zuallererst Suchmaschinenbetreiber und Nachrichtenaggregatoren, darunter große internationale Akteure, die ihre Angebote mit Inhalten deutscher Verlage anreicherten.

Ich unterstelle mal, dass die Masse der Inhalte auf Deutsch veröffentlicht (sic!) wird. Über das Interesse an der deutschen Sprache bin ich wirklich erstaunt und vielmehr noch, dass sich damit so viel Geld verdienen lassen soll (das Geld was jetzt Google macht, mit dem Klauen und so …). Ich versuche mal herauszufinden, wie verbreitet die deutsche Sprache im Internet ist. Unter http://www.internetworldstats.com findet man die zehn häufigsten Sprachen im Internet.

Ausschnitt aus der Website von http://www.internetworldstats.com, die Top 10 der Sprachen im Internet
Ausschnitt aus der Website von http://www.internetworldstats.com, die Top 10 der Sprachen im Internet

„Deutsche Inhalte im Internet – Zur Debatte um das Leistungsschutzrecht“ weiterlesen

Datamining – Kooperation von Schufa und Hasso Plattner Institut

Nachdem der NDR als Erster die Zusammenarbeit zwischen Schufa und Hasso Plattner Institut meldete, brach in den deutschen Medien eine Welle der Empörung los. Der Grundtenor war: Wie können die das machen?! Schnüffellei! Nicht erlaubt! Böse! Die Empörung kannte keine Grenzen. Und natürlich wurde wieder der Terminus der Datenschnüffellei bemüht. Nur wenige Kommentare bemühten sich um eine sachliche Darstellung. Diese lautet letztendlich, dass die frei zugänglichen Daten eben von allen gesehen und genutzt werden können.  Und damit ist die Geschichte auch schon am Ende. Wer öffentlich in die (Netz-) Welt hinaus schreit was er gerade tut, gut findet oder kauft, der muss damit rechnen das es andere bemerken. Im Falle des Internets werden die Äußerungen nun auch noch archiviert. Bei Facebook für immer (?), bei Twitter nur für eine bestimmte Zeit.

Was ist neu und was ist evil?

Was sorgt nun für den großen Aufreger? Das eine Auskunftei öffentlich zugängliche Daten nutzt? Das sie diese mit ihren eigenen vergleicht und Schlüsse zieht? Ich weiß es nicht. Wer die Meldung als erstes verbreitet, der hat natürlich auch eine Art Deutungshoheit über die Information. Ohne die Originalmeldung vom NDR zu kennen, vermute ich, dass der NDR dieser eine negative Interpretation mitgegeben hat. Danach rollte die Meldung über die Ticker und die Mehrheit der Journalisten wollten mit einem Aufreger Quote machen – das unterstelle ich mal. Heute, nach einem Tag gab das Hasso Plattner Institut die Einstellung des Projekts bekannt. Grund: „So könne das Projekt nicht „unbelastet“ und „mit der nötigen Ruhe“ durchgeführt werden (Quelle: Spiegel Online)“.

Chance zur Aufklärung vertan

Was bleibt? Auf Druck der Medien wurde ein Forschungsprojekt eingestellt – ohne sachliche Grundlage – also sozusagen niedergebrüllt. Ein Sieg der Dummheit. Nach dem das Projekt in den Fokus der Öffentlichkeit geraten ist, hätte man es medial begleiten können, endlich mal die so oft geforderte Transparenz ausüben können, indem man den Leuten auf die Finger schaut und nach Ergebnissen fragt. Der abstrakte und negativ besetzte Begriff Datenschnüffellei hätte mal mit Fakten gefüllt werden können. Wer findet denn eigentlich was über wen? Lassen sich da wirklich neue Erkenntnisse gewinnen oder werden da nur Belanglosigkeiten kultiviert und potenziert? Möglicherweise würden die Nutzer der Internetdienste besser überlegen welche Daten sie preisgeben (Diebe planen Einbrüche mit Facebook und Foursquare)?
Hätte alles sein können. Statt dessen werden die Firmen und Universitäten in Zukunft sehr viel vorsichtiger sein, wenn sie solche Projekte durchführen. Also auf Deutsch: Sie werden es geheim halten. Dafür danke liebe Journalisten und Redakteure! Danke dafür, dass ihr weiter für „Todesfalle Facebook“ sorgt (Der Dank geht an viele Journalisten, aber ausdrücklich nicht alle.)

Zum Abschluss ein paar Links:

Mediengenerierte Wirklichkeit – Eröffnung des Flughafens Berlin Brandenburg

Heute ist die Verschiebung der Eröffnung des Flughafens Berlin Brandenburg großes Thema in den Berliner Medien. Groß scheint die Überraschung, dass die Eröffnung nicht termingerecht erfolgt. Über das tatsächliche Baugeschehen kann ich nichts sagen. Im letzen Jahr und speziell seit Jahresanfang entstand bei mir  jedoch der Eindruck, die Medien in Berlin (Zeitungen, TV, Radio) würden einseitig, gezielt positiv auf die Eröffnung des Flughafen hinschreiben (Flughafengesellschaft sieht Eröffnungstermin nicht gefährdet. „Alles ist im Zeitplan ). Keine Kritik, noch bis vor wenigen Wochen war alles ok, null Problemo, Eröffnung wie geplant. Heute weint die Hauptstadtpresse, Wowereit und Platzek sind stinksauer. „Die Häme der Netzgemeinde“ titelt der Tagesspiegel und beschreibt die Reaktionen auf Twitter zur Verschiebung.

RSS-Feed des Berliner Tagesspiegels

Eindeutiger Tenor des Artikels: Die miese Netzgemeinde macht sich über die armen Politiker und Flughafenbauer lustig. Unerhört, dass die jetzt eine eigene Meinung haben und auch noch so laut, dass sie nicht zu überhören ist. Niemand glaubt nun mehr die perfekt abgeschrieben PR-Storys aus den Medien. Verdammt …  „Mediengenerierte Wirklichkeit – Eröffnung des Flughafens Berlin Brandenburg“ weiterlesen