Zum Hauptinhalt

CODI – Automatisierte Kodierung offener Angaben

Textantworten auf offene Fragen effizient und qualitätsgesichert in standardisierte Kategorien fassen.

Offene und halboffene Antwortformate in (sozial-)wissenschaftlichen Umfragen dienen vor allem der Operationalisierung von Konstrukten, die sich aufgrund von zu unspezifischen oder zu zahlreichen Kategorien nicht sinnvoll über vorgegebene Antwortoptionen im Fragebogen erfassen lassen. Ein typisches Beispiel sind Angaben zur beruflichen Tätigkeit. Das vom Forschungsdatenzentrum des Leibniz-Instituts für Bildungsverläufe (FDZ-LIfBi, Bamberg) entwickelte CODI-Tool stellt eine Infrastruktur für die automatisierte Ad-Hoc-Kodierung derartiger Textinformationen bereit.

CODI für Forschende

In zahlreichen quantitativen Erhebungen kommt man als Forscher:in nicht umhin, Fragen mit offenen bzw. halboffenen Antwortformaten zu implementieren. Das Analysepotenzial der auf diese Weise gewonnenen Informationen hängt in hohem Maße von der nachträglichen Klassifizierung der Texteinträge in entsprechende Standardvariablen ab (z. B. KldB, ISCO, ISEI für Berufe). Der zentrale „Übersetzungsprozess“ ist die Kodierung der in Textform vorliegenden Angaben in ein geeignetes Kategorienschema. Angesichts von Schemata mit hunderten oder gar tausenden Kategorien ist eine manuelle Kodierung nicht nur enorm zeit- und ressourcenaufwändig, sondern auch fehleranfällig. Das webbasierte und datenbankgestützte CODI-Tool bietet Forschenden eine Möglichkeit, diese Kodierung auf Basis von teilautomatisierten Algorithmen effizienter zu gestalten. Zur (Mehrfach-)Kodierung von Textantworten werden gemäß einer vorab konfigurierten Kodierrichtlinie und dem vorhandenen Material in der Datenbank automatisch generierte Vorschläge erzeugt. Darüber hinaus lassen sich innerhalb des Tools die vorgenommenen Kodierungen zur Qualitätssicherung validieren und eine Dokumentation zum Kodierprozess anfertigen.

CODI für Forschungsdatenzentren

Zahlreiche Forschungsdatenzentren (FDZ) ermöglichen der Wissenschaft die Nachnutzung von Datenbeständen aus größer angelegten, quantitativen (Panel)Studien. Diese Datenbestände werden teilweise an den FDZ selbst aufbereitet und dokumentiert, teilweise werden sie den FDZ von Primärforschenden zur Kuration und Bereitstellung überlassen. Enthalten diese Daten offen abgefragte Informationen, so kann das CODI-Tool dafür eingesetzt werden, diese Texteinträge nachträglich in geeignete Kodierungen zu überführen und daraus entsprechende Standardklassifikationen abzuleiten. Über die Anbindung an eine bereits bestehende oder eine eigens etablierte Datenbank lassen sich auch große Mengen offener Angaben durch die FDZ effizient und nachvollziehbar über teilautomatisierte Routinen kodieren. Auf diese Weise leistet CODI einen Beitrag zur Anreicherung von Datenbeständen und damit zur besseren Erschließung der Analysepotenziale.

Kontakt