Explore. Create. Share.

Die digiGEBF21 Data Challenge in Kooperation mit dem FDZ am IQB

Wir lieben Daten! Für unsere Studien sammeln wir sie, wir wandeln sie um und werten sie aus. Und wir archivieren sie, nachdem sie ihren Zweck erfüllt haben. Und dann? Wir erheben oft umfangreiche Daten von Schüler*innen, Lehrkräften, Eltern, Studierenden usw., aber schöpfen in der Regel das Untersuchungspotential dieser Daten nicht aus. Unsere Daten, die von Forschungsdatenzentren gesammelt werden, sind also regelrechte Datenschätze, die nur darauf warten vielleicht eines Tages gehoben zu werden.

Mit der digiGEBF21 Data Challenge wollten wir alle interessierten digiGEBF21 Teilnehmer*innen herausfordern, einen solchen Datensatz kennenzulernen und zu nutzen.

Gemeinsam mit dem FDZ am IQB stellten wir vom 29. März bis zum 20. Juni 2021 das Campus File der PISA Plus-Daten allen digiGEBF21 Teilnehmer*innen zur Verfügung und luden herzlich ein, kreativ zu werden. Die Fragestellung lautete:

Explorieren Sie die Daten der Studie PISA Plus 2012-2013 für eine selbstgewählte Fragestellung und erstellen Sie eine Visualisierung, etwa eine Grafik oder eine Animation, die Sie mit der digiGEBF21 Community über unsere Virtual Venue teilen und diskutieren können.

Der Weg ist das Ziel! Die Data Challenge richtete sich an alle, die Spaß an der Arbeit mit empirischen Daten haben.

Die Beiträge der Data Challenge wurden über die digiGEBF21 Tagungshomepage in einer für die Öffentlichkeit zugänglichen Galerie ausgestellt. Somit wurden auch andere darüber informiert, welche Fragestellung sie wie behandelt haben. Darüber hinaus haben alle digiGEBF21 Teilnehmer*innen nicht nur die Gelegenheit erhalten, sich detaillierter über die einzelnen Beiträge zu informieren und sie mit zu diskutieren, sondern auch Ihren Lieblingsbeitrag zu küren. Die Beiträge mit den meisten Likes sind haben wir nach Abschluss der Data Challenge auf der Tagungshomepage ausführlich vorgestellt. 

FAQs

  1. Was ist PISA Plus 2012-2013
  2. Was ist ein Campus File?
  3. Ich habe etwas Spannendes während der Data Challenge entdeckt – was nun?
  4. Musste man als Einzelperson teilnehmen?
  5. Was gab es für Voraussetzungen?
  6. Wo finde ich den Datensatz?

Was ist PISA Plus 2012-2013?

Die internationale Haupterhebung des Programme for International Student Assessment (PISA) im Jahr 2012 wurde in Deutschland um eine Längsschnittkomponente mit einem zweiten Messzeitpunkt erweitert. Nach der regulären Erhebung in 2012 wurden dieselben Schüler*innen ein Jahr später in der zehnten Klassenstufe erneut getestet. Die Daten bieten somit die Möglichkeit, Veränderungen nach einem Schuljahr abzubilden und Bedingungen, die den Kompetenzerwerb beeinflussen können, längsschnittlich zu betrachten.

Der PISA Plus-Datensatz zeichnet sich nicht nur durch Leistungsvariablen zur Mathematik-, Lese- und naturwissenschaftlichen Kompetenz zu zwei Messzeitpunkten aus, sondern umfasst auch eine Reihe von Fragebogenangaben von Schüler*innen, Lehrkräften und Schulleiter*innen zu individuellen Merkmalen (z. B. Motivation, Ängstlichkeit, Interesse) und Merkmalen der Lernumgebung (z. B. kognitive Aktivierung, disziplinäres Klima, Schüler-Lehrer-Beziehung).

Insgesamt umfasst die Stichprobe des Campus Files Angaben von n = 4545 Schüler*innen aus n = 254 Klassenräumen in n = 134 Schulen. Die Skalendokumentation des Campus Files gibt Ihnen einen umfassenden Einblick in die Variablenauswahl und ihre Ausprägungen.

Nähere Informationen zu PISA Plus 2012-2013 und den in dem Projekt erfassten Daten finden Sie auf den Seiten des Zentrums für internationale Bildungsvergleichsstudien (ZIB) und des FDZ am IQB.

Was ist ein Campus File?

Campus Files sind anonymisierte synthetische Datensätze, die auf Grundlage einer realen Datenbasis erstellt wurden. Sie eignen sich hauptsächlich für den Einsatz in der universitären Lehre sowie für studentische Forschungsprojekte (z. B. Seminararbeiten, Bachelorarbeiten). Im PISA Plus-Campus File wurden alle Hintergrundmerkmale (z. B. Alter, Geschlecht, Zuwanderungshintergrund, sozialer Hintergrund) in den Daten vollständig synthetisch erzeugt. Das heißt, Merkmalsausprägungen auf diesen Variablen wurden nach einem Zufallsverfahren auf die Personen im Datensatz verteilt und weisen keine direkte Übereinstimmung zu den zugrundeliegenden realen Daten auf. Die synthetische Datengenerierung wurde dabei so durchgeführt, dass Zusammenhänge zwischen den Variablen im Vergleich zu den zugrundeliegenden realen Daten weitgehend bestehen bleiben.

Weitere Informationen zu den Campus Files des FDZ am IQB finden Sie hier.

Ich habe etwas Spannendes während der Data Challenge entdeckt – was nun?

Haben Sie für Ihre Fragestellung Feuer gefangen? Das Analysepotenzial von synthetischen Datensätzen wie dem PISA Plus-Campus File ist natürlich begrenzt und das von Ihnen ermittelte Ergebnis wird sich in den „echten“ Daten vielleicht nicht exakt so wiederfinden lassen. Kontaktieren Sie dennoch gern das FDZ am IQB und beantragen Sie die Nutzung des (umfangreicheren) Scientific Use Files.

Musste man als Einzelperson teilnehmen?

Nein. Man konnte die Data Challenge zwar allein bestreiten, aber in einem Team, das unterschiedliche Sichtweisen und Erfahrungen mit sich bringt, kann der Austausch nicht nur Spaß machen, sondern auch sehr lehrreich und bereichernd sein.

Was gab es für Voraussetzungen?

Für digiGEBF21-Teilnehmer*in galten keine besonderen Voraussetzungen, um sich an der Data Challenge zu beteiligen. Das bereitgestellte Campus File stellte die PISA Plus-Daten in Importformaten für R (.rda), SPSS (.sav) und Stata (.dta) sowie eine umfangreiche Skalendokumentation zur Verfügung. Die Wahl der Auswertungs- und/oder Visualisierungssoftware war Ihnen überlassen.

Wo finde ich den Datensatz?

Ein paar Tage nach Ihrer Anmeldung erhielten Sie von datachallenge@dipf.de weitere Informationen sowie einen Zugangslink zum Campus File.

Unabhängig von der Data Challenge kann der Datenzugang auch allgemein über das FDZ am IQB beantragt werden: https://www.iqb.hu-berlin.de/fdz/Datenzugang/CF-Antrag/