Zum Hauptinhalt
03
Dez
2019

Big Data für die Forschung nutzbar machen: RatSWD veröffentlicht Empfehlungen und Gutachten

Vor dem Hintergrund der zunehmenden wissenschaftlichen Bedeutung von Big Data-Quellen diskutiert der RatSWD die rechtlichen und strukturellen Herausforderungen ihrer Nutzung. Er leitet Empfehlungen an Forschende und Politik ab. Aufbauend auf einem Rechtsgutachten der Forschungsstelle RobotRecht, das Teil des Positionspapiers ist, liegt ein Fokus auf Web Scraping-Verfahren.
Um die Interessen von Wissenschaft und Unternehmen zusammenzubringen, könnten unabhängige Treuhandstellen Forschenden einen verbesserten und nachhaltigen Datenzugang ermöglichen. Die Besonderheiten der Forschung mit (personenbezogenen) Big Data sollte in der Datenstrategie der Bundesregierung verankert werden.

Cover Big Data

Mit seinem aktuellen Bericht adressiert der Rat für Sozial- und Wirtschaftsdaten (RatSWD) Herausforderungen bei der Nutzung von Big Data in der Wissenschaft und veröffentlicht seine Empfehlungen an Forschende und (Wissenschafts-)Politik. In den Sozial-, Verhaltens- und Wirtschaftswissenschaften besteht ein zunehmendes Interesse an der Nutzung von Big Data, die insbesondere im Rahmen digitalisierter Kommunikation und des Konsumverhaltens zunehmend anfallen. Solche Daten zeichnen sich durch große Fallzahlen, nicht beeinflussende Erhebungsverfahren sowie die Möglichkeit zur Echtzeitanalyse und Beobachtung sozialer Interaktionen aus. Um ihr wissenschaftliches Potenzial erschließen zu können, müssen Forschende jedoch vielfältige rechtliche und strukturelle Herausforderungen beachten – soweit sie überhaupt einen Zugang zu den Daten erhalten.

Forschenden, denen individuell ein Zugang zu Big Data-Quellen von Unternehmen gewährt wurde, wird häufig der Zugang zu unternehmensstrategisch bedeutenden Variablen oder Beobachtungen verwehrt. Sie können die verwendeten Daten oftmals nicht an andere Forschende weitergeben und unterliegen dem Risiko, dass der Datenzugang vor Abschluss eines Forschungsprojekts einseitig aufgekündigt wird. Darüber hinaus können potenzielle Interessenskonflikte oder Einschränkungen in der Publizierbarkeit von Forschungsergebnissen resultieren; eine Datennachnutzung, z.B. für Replikationsstudien oder eigenständige Fragestellungen, wird zumeist verwehrt.

Viele Forschende nutzen Web Scraping-Verfahren, um selbst an Daten aus dem Internet zu gelangen. Hierbei werden vorhandene Software-Schnittstellen genutzt oder aber die für das menschliche Auge entwickelten Webseiten massenhaft ausgelesen. Da mit der Verwendung dieser Datenerhebungsmethoden häufig rechtliche Unklarheiten einhergehen, hat der RatSWD ein Rechtsgutachten bei der Forschungsstelle RobotRecht der Universität Würzburg eingeholt, das die einschlägigen Rechtsfragen des Datenzugangs, der Daten(nach)nutzung und Datenarchivierung aufarbeitet. Das Gutachten wird mit dem Bericht veröffentlicht.

Um das Problem fehlender Zugänge zu Big Data-Quellen systematisch und nachhaltig zu lösen, empfiehlt der RatSWD die Einrichtung von unabhängigen Treuhandstellen. Diese sollen zwischen den Interessen von Forschenden und Unternehmen, welche Big Data vorhalten, vermitteln. Hierzu nehmen Treuhandstellen Daten von Unternehmen entgegen und ermöglichen Forschenden anschließend deren unabhängige datenschutzkonforme Analyse. Der RatSWD begrüßt daher, dass das jüngst veröffentlichte Eckpunktepapier einer Datenstrategie der Bundesregierung das Konzept der Treuhandstelle als Instrument aufgreift, um „das freiwillige Teilen von Daten zu verstärken“. Der RatSWD empfiehlt, bei der weiteren Ausarbeitung der Datenstrategie die Besonderheiten der Forschung mit (personenbezogenen) Big Data zu berücksichtigen.

Der vollständige Bericht samt Gutachten im Anhang steht auf der Webseite des RatSWD zum freien Download zur Verfügung: