Menschliches Verhalten in Bits und Bytes

Dass sich bei den Branchengrößen die Daten ballen, sei das Problem, meint Banse. © picture alliance / dpa / Oliver Berg
Moderation: Susanne Führer · 13.06.2013
Aus den Datenbergen, die Google, Facebook oder Microsoft den Geheimdiensten überlassen, lässt sich mit Algorithmen Verhalten sogar vorhersagen, erläutert Philip Banse. Wer das eigene Big-Data-Risiko minimieren will, sollte auf alternative Anbieter und Methoden ausweichen, so der Netzexperte.
Susanne Führer: Tja, irgendwie regen sich jetzt zwar alle auf über den amerikanischen Geheimdienst NSA. Aber eine kleine Diskussion gestern bei uns in der Redaktion hat gezeigt, was genau diese NSA nun sammelt und was sie wie genau mit diesen vielen Daten anstellt, das wissen dann doch nicht alle.

Und deswegen wird uns das jetzt mein Kollege, der Netzjournalist Philip Banse, mal ganz klar erklären – hoffentlich. Morgen, Philip!

Philip Banse: Schönen guten Morgen!

Führer: Also: Wir wissen, dass die NSA auf alle diese großen amerikanischen Internetdienste zugreift, auf Google, auf Yahoo, auf Facebook, auf Apple, auf Microsoft – aber was genau speichern die da?

Banse: Nach Berichten, nach Recherchen der "Washington Post" und des "Guardian" sind das vor allem E-Mails, aber natürlich auch alles sonst, was diese sozialen Netzwerke und diese Anbieter eben von uns gespeichert haben. Also E-Mails, Chatprotokolle, Videos, Fotos, Logins, Verhalten auf diesen sozialen Netzwerken, was wir mit wem besprechen, aber natürlich auch Telefonate, Skype-Telefonate – nicht die Inhalte, aber wann und mit wem, und wie oft, und dazu, das ist so das Parallelprogramm oder ergänzend zu Prism eben diese Entdeckung auch, dass die NSA, der größte Geheimdienst der Welt oder der geheimste eben, von Verizon, einem großen Telefonanbieter in den USA, über drei Monate zumindest, täglich alle Metadaten von Telefonaten seiner Kunden abliefern musste, also wer mit wem wann telefonierte, das sind so im Großen und Ganzen das, was man bisher weiß.

Führer: Das klingt ja auf der einen Seite beängstigend, auf der anderen Seite ja doch nicht so schlimm. Also ich meine, die speichern zwar, dass ich was maile, aber nicht, was ich gemailt habe, und wenn sie das nun von allen machen, frage ich mich, ich meine, mit diesen riesigen Datenmengen, da kann doch kein Mensch was mit anfangen.

Banse: Kein Mensch nicht, aber Computer sehr wohl. Das Prinzip, das nennt man Big Data. Das bedeutet, Big Data ist das Phänomen, dass wir mittlerweile quasi das komplette menschliche Verhalten so genau digitalisiert haben wie nie zuvor.

Durch Twitter, soziale Netzwerke, wird quasi alles, jede Stimmung, jede Bewegung, jede Äußerung in Bits und Bytes abgebildet, und das sind nie gekannte Datenmassen, die aufgrund neuester Rechnertechnik eben in Echtzeit durchforstet werden können. Und es gibt … eine zentrale Technik dafür ist, das sind eben Algorithmen. Die nehmen sich diese riesigen Datenberge, die kein Mensch mehr überblicken kann.

Und Algorithmen sind eigentlich nichts anderes als von Menschen programmierte Filter, die sagen, aus diesem Riesendatenberg von Telefondaten, such mir bitte raus, wer öfter als zehnmal mit dem Menschen XY an der und der Stelle von dem und dem Ort telefoniert hat, und dann guckst du bitte in der Fotodatenbank, ob du eine Gesichtserkennung machen kannst und feststellen kannst, ob dieser Mensch zu denselben Zeiten an diesen und diesen Orten war, als diese und diese Gespräche dort geführt worden, und dann hat man die Identität des Menschen. Diese maschinell, also von Menschen, programmierten Filter durchforsten diese riesigen Datenberge nach Mustern, und aus diesen Mustern lassen sich halt zum Beispiel auch Vorhersagen über die Zukunft treffen.

Wenn wir als Menschen jeden Morgen unser Haus verlassen und zu einem ganz bestimmten Ort jeden Morgen fahren, dann kann man sehr schnell daraus errechnen, dass das wohl der Arbeitsort ist, und man kann auch sehr schnell Vorhersagen treffen über die Zukunft, wie wir uns in Zukunft verhalten. Der Supermarktanbieter Target hat in den USA die Schwangerschaft von einer Kundin vorhergesagt, weil sie eben Produkte gekauft hat, die in der Regel von Menschen gekauft wurden, die wenige Zeit später auch Windeln gekauft haben.

Also ich glaube, darüber machen wir uns keine Vorstellung, was man alleine aus diesen Metadaten, aus diesen Verhaltensdaten, aus diesen Stimmungsdaten für Aussagen treffen kann über uns, unser Verhalten, über Netzwerke, wer wichtig ist in einem Netzwerk, wen man ausschalten muss, um Netzwerke kaputtzumachen, Kommunikation zu stören und eben auch unser Verhalten sehr genau vorherzusagen.

Führer: Kurz zum Schluss, Philip Banse, kann ich dem irgendwie entgehen, also jetzt mal abgesehen davon, dass ich aufs Internet verzichte, was in bestimmten Berufen, glaube ich, unmöglich ist?

Banse: Na, das Problem, das ist sehr deutlich geworden, sind die Datenberge an wenigen Stellen, auf die Staaten sich natürlich Zugriff verschaffen. Natürlich gibt es Möglichkeiten, das Risiko zu minimieren. Man kann Facebook nicht nutzen, und so was wie Friendica, so ein alternatives Netzwerk nutzen, wo die Server nicht zentralisiert sind.

Und man kann sich selber Server aufsetzen, man kann sich eigene E-Mail-Server aufsetzen, das ist auch keine hundertprozentige Sache und auch extrem kompliziert, man kann seine E-Mails verschlüsseln – das sind alles Sachen, die man machen kann, man kann alternative Suchmaschinen wie DuckDuckGo zum Beispiel verwenden, die keine Aktivitäten mitschreiben, aber eine Lösung ist das sicherlich nicht. Es minimiert das Risiko, es minimiert den Datenberg etwas, aber eine Lösung ist es nicht.

Führer: Danke, das war Philip Banse, für diese Erklärung.
Mehr zum Thema