Breitband²

Big Beautiful Data

09.02.2013
Ob Mensch oder Smartphone, Auto oder Industriesensor: Sie alle produzieren ständig Daten.
Ob Mensch oder Smartphone, Auto oder Industriesensor: Sie alle produzieren ständig Daten. In einer Welt, in der bald jeder Kühlschrank Internetzugang hat, wachsen die Datenberge in schwindelerregende Höhen. Das IT-Unternehmen IBM hat geschätzt, dass wir täglich 2,5 Quintillionen Bytes neuer Daten produzieren, das gesamte Informationsvolumen verdoppelt sich alle zwei Jahre. Immer mehr mobile Endgeräte, 500 Millionen Tweets am Tag, ungezählte Petabyte Daten aus den Windkanal-Tests der Autoindustrie: Längst gelten Daten als das neue Öl und Daten-Wissenschaftler als Zahlenzauberer und Gurus. Aber so einfach lassen sich der so genannten «Big Data» ihre Geheimnisse nicht entlocken.
»Big Data ist wie Teenagersex: Jeder spricht darüber. Keiner weiß wirklich, wie es geht. Alle denken, dass die anderen es tun, also behauptet jeder, dass er es auch tut.»
zitiert Datenwissenschaftler DJ Patil seinen Kollegen Dan Ariely.
Und wie beim Teenagersex sehen einige die Sache mit Sorge. So erklärte Verbraucherministerin Ilse Aigner auf der Konferenz «Big Data - Goldmine oder Dynamit?» anlässlich des «Safer Internet Day» am Dienstag:
»Der entscheidende Punkt ist letztlich, dass bei so großen Datenmengen die Daten anonymisiert werden müssen. Und dabei reicht es nun mal eben nicht zum Beispiel den Namen und die Telefonnummer, wie beim Handy, allein abzuschalten. Allein die Ortungsfunktion kann dazu führen, dass sie den Standort identifizieren beziehungsweise die Wohnung, wenn sie abends hier zum Beispiel immer auffindbar sind.«
Tatsächlich können auch gut gemeinte Ziele der Echtzeit-Datenauswertung unerwünschte Nebenwirkungen haben. Die Stau-Vorhersagen würden durch Sensoren an Autos immer besser. Doch dann ließe sich auch ein exaktes Bewegungsprofil der Fahrer anlegen.
Wie erfolgreich Datenanalysen sein können, zeigt ein Fall, der im letzten Jahr durch die Presse ging: Die amerikanische Einzelhandels-Firma Target schloss aus dem Kaufverhalten eines Teenagers auf deren Schwangerschaft, noch bevor ihr Vater davon wusste.
Die Forscherin Dana Boyd fragt nach der Ethik im Umgang mit Big Data. Denn viele Daten heißt nicht gleich gute Daten.
Wo überschreitet die Datenanalyse die Grenze zur Überwachung? Wem gehören - und wem nützen - eigentlich die vielen Daten? Und wenn uns nur noch vorgesetzt wird, was unser Datenprofil zulässt, werden wir nicht auch entmündigt?
Über Chancen und Risiken großer Datenmengen spricht Philip Banse mit dem Sozialforscher Benedikt Köhler und dem Daten-Wissenschaftler Michael Kreil.



Michael Kreil
ist Data Scientist und entwickelt Daten-Konzepte und Anwendungen. Seit September 2011 ist er technischer Entwickler bei der Datenagentur OpenDataCity.
Twitter | Blog | Talk
Benedikt Köhler
studierte Soziologie, Ethnologie und Psychologie. Er hat das Twitter-Tracking-Tool Brandtweet geschrieben und forscht bei der Agentur d.core zu Social Media, Big Data und Data Mining.
Twitter | Blog | Talk




Karte: Michael Kreil/OpenDataCity. CC-BY-3.0 >>größere Ansicht



Links und Lektüre:
Deutschlandfunk: Das Petabyte Zeitalter
Heise: So schön können Daten sein
Handelsblatt: Wer hebt das Datengold?
Beautiful Data: 10 hot big data startups to watch in 2013
Netzpolitik: Das Unbehagen im Datenhaufen: Big Data und Datenschutz müssen kein Gegensatz sein
Wired: Beware the Big Errors of 'Big Data' - Danke @eg_mast3r!
Culture Digitally: Algorithms
Fach-Journal «Big Data»



Bild oben: 49333515@n03/6751068515/">Visualisierung von 4000 Nutzern und 22000 Emails über sechs Jahre, Michael Kreil - OpenDataCity, CC-BY 3.0