Sozialwissenschaften

Mit Big Data auf den Spuren des IS

Ein Anhänger des IS mit der Flagge der Miliz © afp

Von Vera Linß | 28.05.2015

Warum schließen sich junge Menschen den IS-Terroristen an? Solche und ähnliche Fragen untersuchen Sozialwissenschaftler neuerdings mit Hilfe großer Datenmengen aus dem Netz. Doch die Forschungsmethode birgt auch Gefahren.

Hinrichtungen vor laufender Kamera, Folter, Zerstörung von Kulturgütern – mit unglaublichen Gräueltaten bestimmt der "Islamische Staat" seit einem Jahr unsere Schlagzeilen. Die Brutalität und das Ausmaß der Gewalt kamen für die Öffentlichkeit überraschend. Informatiker vom "Qatar Computing Research Institute" in Doha wollten deshalb wissen, warum junge Menschen die Terrororganisation unterstützen. Grundlage ihrer Analyse waren die Twitter-Kommentare von arabischsprachigen IS-Anhängern. In deren Tweets der letzten Jahre fanden sie Erklärungen für deren Hinwendung zum Terror, sagt Ingmar Weber, einer der Forscher.

"Ein Thema, das sich klar herauskristallisiert hat, ist, dass viele Leute, die heute ISIS unterstützen, früher die Revolution in Ägypten 2011 unterstützt haben und dann nachträglich über den Militärputsch erbost waren, als Mohammed Mursi nicht mehr Präsident war. Da steckt viel Frust dahinter."

Jeder ist ein potentieller Proband, ohne davon zu wissen

In die Untersuchung der Informatiker aus Katar sind 57.000 Twitter-Konten mit über drei Millionen Tweets eingeflossen. Zuerst haben die Forscher die IS-Anhänger an deren Wortwahl identifiziert. Für "Islamischen Staat" nutzen diese das Kürzel "ISIS", während die Gegner den kürzeren Hashtag "IS" verwenden. Dann haben sie mit Hilfe eines Algorithmus nach Unterschieden gesucht in den Äußerungen der IS-Befürworter und der Gegner. Auf diese Weise konnten Korrelationen hergestellt werden. Ingmar Weber:

"Da hat dann ein sogenannter Klassifizierungsalgorithmus gelernt, dass zum Beispiel ein Hashtag, das Unterstützung für Mohammed Mursi ausdrückt, ein Zeichen ist, dass diese Person später ISIS unterstützen wird. Oder dass ein Hashtag, das Unterstützung für das Militär in Ägypten ausdrückt, ein Zeichen dafür ist, dass dieser Nutzer ein ISIS-Gegner sein wird."
Mit ihren Daten-Analysen springen Wissenschaftler wie Ingmar Weber da ein, wo klassische Sozialforschung ihre Grenzen hat. Aufgrund der großen Datenmengen etwa lassen sich detailliertere Aussagen über Einzelaspekte gesellschaftlicher Entwicklungen treffen und neue Zusammenhänge herstellen. Vorteilhaft ist auch, dass Daten quasi unverfälscht erhoben werden können. Das heißt, jeder ist ein potentieller Proband, ohne davon zu wissen.

Genau hier aber liegt eine der Gefahren der Computational Social Science. Denn aus den öffentlichen Daten können nicht nur Prozesse beschrieben, sondern auch Profile von Menschen erstellt werden, auch wenn diese das nicht wollen. Das ist nicht nur in politischen Zusammenhängen relevant. Auch privat kann dies dem Ansehen schaden.

Kein Ersatz für die klassische Sozialwissenschaft

Der Soziologe und Datenwissenschaftler Benedikt Köhler warnt vor den Folgen, etwa wenn Datenquellen miteinander kombiniert werden. Wie 2013 in New York geschehen, als die Stadt Datensätze von Taxi-Fahrten veröffentlichte. Bereits im Netz vorhanden: Bilder von Taxi fahrenden Promis.

"Dann hat eben einer mal gesagt, diese beiden Datensätze kann ich ja zusammen nehmen. Ich habe hier ein Bild, wie eine Schauspielerin an einem bestimmten Ort zu einer bestimmten Uhrzeit in ein Taxi steigt und dann habe ich diesen Datensatz, wo die ganzen Taxi-Fahrten drin sind. Also weiß ich, wo diese Person hinfährt. Und letztlich sieht man ganz genau, wer wo verkehrt und wer vielleicht um 2 Uhr in der Nacht aus einer Rotlichtgegend ein Taxi nach Hause ruft."

Problematisch daran ist, dass Menschen damit in Schubladen gesteckt und vorverurteilt werden können. Gerade auf politischer Ebene kann dies drastische Konsequenzen haben. Deshalb muss der Umgang mit öffentlich vorliegenden Daten präzise geregelt werden. Eine Herausforderung, die sehr komplex ist und ein tieferes Verständnis davon erfordert, wie die Aufarbeitung großer Datenmengen funktioniert. Eine Anonymisierung etwa reicht nicht aus, da sogenannte Meta-Daten wie Orts- oder Zeitangaben sehr aussagekräftig sind. Benedikt Köhler plädiert für klare Standards.

"Vor allem braucht man eine Art Algorithmen-Ethik, die diese ganzen Methoden durchgeht, also was man jetzt veröffentlicht und was man vielleicht in so einem Datensatz auf irgendeine Weise zensiert und oder verwischen muss, dadurch, dass man white noise dazu gibt. Zum Beispiel Fahrten, die es gar nicht gab, die aber ein durchschnittliches Verhalten widerspiegeln. Da gibt´s ja durchaus ein paar Möglichkeiten."

Neben den Risiken gibt es aber auch Grenzen der Daten gestützten Sozialforschung, wie Ingmar Weber vom "Qatar Computing Research Institute" einräumt. Bei der Suche nach den Motiven für die Unterstützung des IS-Terrors wurde sein Team zwar fündig. Allerdings blieb man zwangsläufig an der Oberfläche, erklärt Weber.

"Wenn man mit jemandem direkt spricht und ihn befragt: Warum unterstützt du denn ISIS? Was denkst du denn über dies und jenes? Dann lernt man halt viel mehr über die wahren Gründe. Qualitative Untersuchungen, zum Beispiel durch Umfragen oder Interviews, lassen sich nie ganz ersetzen."

Und auch Prognosen lassen sich damit nur vage erstellen. Der von den Forschern in Katar genutzte Algorithmus etwa bezieht sich auf ein Twitter-Nutzungsverhalten, das sich jederzeit ändern kann. Deshalb ist Computational Social Science kein Ersatz, sondern Ergänzung zur klassischen Sozialwissenschaft.