Twittern für die Forschung
Twitter-Nachrichten, Instagram-Bilder und andere Spuren des digitalen Lebens entstehen jeden Tag fast überall auf der Welt. Sie sind nicht nur für uns und unser direktes Umfeld interessant, sondern ermöglichen auch der Forschung, wichtige Fragen zu beantworten. Diese Daten sind jedoch unstrukturiert und unterscheiden sich grundlegend von anderen Datenquellen. In einer Handreichung beschreibt der Rat für Sozial- und Wirtschaftsdaten (RatSWD) die Herausforderungen beim Umgang mit unstrukturierten Daten.
Unstrukturierte Daten sind für die Forschung besonders wertvoll, da sie das menschliche Leben und Verhalten im Alltag abbilden können. Da die Daten unkontrolliert entstehen und kein festes Datenformat haben, entstehen hierdurch spezifische Fehlerquellen, die sich von denen klassischer Survey-Studien unterscheiden können. Der RatSWD macht in seiner Handreichung auf die Herausforderungen bei der Erhebung, Aufbereitung und Analyse von unstrukturierten Daten aufmerksam. Studierende und Forschende der Sozial-, Verhaltens- und Wirtschaftswissenschaften werden für mögliche Fehlerquellen sensibilisiert und können Schlüsse für ihre eigene Arbeit ziehen.
Total Error Framework (TEF) für Big Data als Grundlage der Handreichung
Orientiert am TEF für Big Data erarbeitete eine Arbeitsgruppe des RatSWD Leitfragen zu den potenziellen Fehlerquellen bei der wissenschaftlichen Arbeit mit unstrukturierten Daten. Bei einem Workshop mit Expert:innen aus unterschiedlichen Disziplinen wurden diese Fragen diskutiert. Anhand der Ergebnisse beschreibt der RatSWD in der Handreichung die Herausforderungen bei der Erhebung und Nutzung unstrukturierter Daten und schafft eine Grundlage für Qualitätsstandards.
Die vollständige Veröffentlichung steht auf der Webseite des RatSWD zum freien Download zur Verfügung: https://www.konsortswd.de/publikation/unstrukturierte-daten/
Der Rat für Sozial- und Wirtschaftsdaten (RatSWD) berät seit 2004 die Bundesregierung und die Regierungen der Länder in Fragen der Forschungsdateninfrastruktur für die empirischen Sozial-, Verhaltens- und Wirtschaftswissenschaften. Im RatSWD arbeiten zehn durch Wahl legitimierte Vertreterinnen und Vertreter der sozial-, verhaltens- und wirtschaftswissenschaftlichen Fachdisziplinen mit zehn Vertreterinnen und Vertretern der Datenproduktion zusammen.
Der RatSWD ist Teil des Konsortiums für die Sozial-, Verhaltens-, Bildungs- und Wirtschaftswissenschaften (KonsortSWD) in der Nationalen Forschungsdateninfrastruktur (NFDI). Er versteht sich als institutionalisiertes Forum des Dialoges zwischen Wissenschaft und Datenproduzenten und erarbeitet Empfehlungen und Stellungnahmen. Dabei engagiert er sich für eine Infrastruktur, die der Wissenschaft einen breiten, flexiblen und sicheren Datenzugang ermöglicht. Diese Daten werden von staatlichen, wissenschaftsgetragenen und privatwirtschaftlichen Akteuren bereitgestellt. Derzeit hat der RatSWD 42 Forschungsdatenzentren akkreditiert und fördert deren Kooperation.