Gute Daten – schlechte Daten? Daten in der empirischen Sozialforschung im Vergleich
Auch wenn prozessproduzierte Massendaten (sogenannte „Big Data“) etwa in Form von staatlichen Verwaltungsdaten eine mehr als zweihundertjährige Tradition haben, hat sich deren Verfügbarkeit in den letzten Jahrzehnten dramatisch gesteigert: Nicht nur die Forschungsdatenzentren, sondern auch historische Datenarchive und eine Vielzahl universitärer Projekte arbeiten daran, bisher unerschlossene alte Datensammlungen ebenso wie neue digitale Daten zunehmend für die Forschung zugänglich zu machen. Damit erweitern sich Möglichkeiten für die Sozialwissenschaften, soziale Phänomene sowohl aus aktueller als auch historischer Blickrichtung zu analysieren.
Damit stellt sich aber die Frage, welche methodologischen Stärken und Schwächen diese Big Data etwa gegenüber Survey-Daten haben. In diesem Rahmen hat die empirische Sozialforschung bereits in den 1970ern darauf hingewiesen, dass auch Massendaten sozial konstruiert sind und damit eigene methodologische Probleme mit sich bringen, die bei der Analyse reflektiert werden müssen. Ein Vorschlag zu dieser Reflexion ist das Konzept der „Datenkunde“ (als Alternative zur „Fehlerkunde“ im Survey-Prozess), verbunden mit der Forderung, dass vor der Auswertung eines Datenbestands analysiert werden muss, wie die Datenproduktion durch organisationale Regeln, Alltagspraktiken der Datenproduzenten sowie Verhalten der Klienten überformt wird, um daraus die spezifischen Verzerrungen der Population bzw. Stichprobe sowie den Fehler in den Daten zu identifizieren.
Am Beispiel der Messung der Korruption illustriert der Beitrag den Mehrwert einer Datenkunde. Hierzu werden verschiedene Datenbestände (Survey-Daten, amtliche Statistik, EU-, NGO-, Firmen-Daten, Nachrichten, Twitter, Facebook) für 13 Länder (Deutschland, USA, Großbritannien, Frankreich, Schweden, Spanien, Rumänien, Türkei, Britische Jungferninseln, China, Eritrea, Marokko, Mexiko) miteinander verglichen.
Nina Baur ist Professorin für „Methoden der empirischen Sozialforschung“ am Institut für Soziologie der Technischen Universität Berlin.