Offenes Datenaustauschformat
Offenes, nicht-proprietäres Format für den Austausch von Forschungsdaten und Metadaten für den Einsatz mit den gängigen Statistikprogrammen.
Unser „Offenes Datenaustauschformat“ bietet eine innovative Lösung für die Datenverarbeitung und den Datenaustausch in der Forschung. Das Ziel des Projekts ist die Entwicklung eines offenen, nicht-proprietären, mehrsprachigen und mit zusätzlichen Informationen angereicherten Datenformates, das mit den gängigen Statistik-Programmen genutzt werden kann und gleichzeitig Zugang zu den Metadaten ermöglicht. Dabei setzen wir auf den Einsatz von Metadaten, um die Organisation des Forschungsprozesses zu optimieren und die Anforderungen der FAIR-Prinzipien zu erfüllen.
Angebote für FDZ
Das offene Datenaustauschformat bietet eine effiziente Möglichkeit, ein einheitliches Datenformat zu erstellen, das von einer Vielzahl von Nutzer:innen verwendet werden kann, weil Importfilter zur Verfügung stehen bzw. Leicht bereitgestellt werden können. Damit entfällt für Datenproduzierende die Notwendigkeit, mehrere Formate für unterschiedliche Benutzeranforderungen zu erstellen, was eine optimierte Datenverarbeitung gewährleistet. Zudem besteht die Möglichkeit, die Daten mit zusätzlichen Informationen anzureichern, was bisher aufgrund Software spezifischer Beschränkungen schwer realisierbar war und damit die Datendokumentation zu verbessern. Das Format hat auch Vorteile für die Langzeitarchivierung, da die Daten unabhängig von proprietärer Software genutzt werden können.
Angebote für Forschende
Das „Offene Datenaustauschformat” ermöglicht Datennutzenden die Verarbeitung und Analyse von Daten in verschiedenen Softwareumgebungen und bietet somit eine effiziente und flexible Arbeitsweise, ohne die Abhängigkeit von kostenpflichtiger Software. Dazu müssen Datennutzende ihre Nutzungsgewohnheiten nicht ändern. Zusätzlich können mehr Informationen als üblicherweise über die herkömmlichen Datenformate zur Verfügung gestellt werden, z. B. Link zu Datenportal, der direkt über Statistiksoftware erreichbar ist. Mit der Verbreitung des Offenen Datenaustauschformates eröffnen sich Datennutzenden neue Möglichkeiten und sie haben Zugriff auf eine breitere Palette von Datensätzen.
- R-Paket ist verfügbar: https://git.soep.de/opendata/r-package-opendataformat
Es ermöglicht den Import des Open Data Formats in ein R-Datenframe sowie den Export von Daten aus einem R-Datenframe zurück in das Open Data Format. Darüber hinaus haben Nutzer*innen die Möglichkeit, detaillierte Metadaten zum Datensatz und den Variablen mühelos über den RStudio Viewer oder einen Webbrowser abzurufen. Diese intuitive Vorgehensweise erlaubt eine reibungslose Erkundung und effiziente Nutzung der Datensatzinformationen in der bevorzugten Arbeitsumgebung.
- Stata-Paket ist verfügbar: https://thartl-diw.github.io/opendf
Das Stata-Paket ist speziell darauf ausgelegt, die nahtlose Nutzung des Open Data Formats innerhalb der Stata-Umgebung zu erleichtern. Ähnlich wie das R-Paket ermöglicht es das Importieren von Daten aus dem Open Data Format in einen Stata-Datenframe und das Speichern eines Stata-Datenframes (.dta) im Open Data Format. Darüber hinaus können Benutzer*innen einfach auf Metadateninformationen sowohl auf Datensatz- als auch auf Variablenebene zugreifen.
- Anwendungsfall: SOEP-Daten im Open Data Format
SOEP-Core ist das Herzstück des Sozio-oekonomischen Panels, einer umfassenden Langzeitstudie privater Haushalte in Deutschland, die vom Deutschen Institut für Wirtschaftsforschung (DIW Berlin) durchgeführt wird. Kürzlich sind die Scientific Use Files des Sozio-oekonomischen Panels (SOEP) im neuen Open Data Format (opendf) bereitgestellt worden. Anleitungen zur Nutzung der SOEP-Daten im opendf finden Sie hier: Arbeiten mit SOEP-Daten im Open Data Format — SOEPcompanion 1.0.0 Dokumentation.