KI im Fach Geschichte - Wie künstliche Intelligenz bei der inhaltlichen und sprachlichen Beurteilung von Schülerantworten genutzt werden kann
Historisches Denken ist mehr als eine Ansammlung chronologisch erzählter Daten und Fakten, sondern Schüler:innen sollen lernen, mit Narrativen (z.B. in Schulbüchern) kritisch umzugehen und auf Fragen an die Vergangenheit quellen- und evidenzbasierte Antworten zu geben. Historisches Denken ist also untrennbar mit der Sprache verbunden. Daher werden die Kompetenzen historischen Denkens häufig in offenen Aufgabenformaten erfasst. Um eine objektive, reliable und valide Beurteilung der Texte in Forschungsprojekten sicherzustellen, ist der Nachweis einer Interrater-Reliabilität notwendig. Diese ist in groß angelegten Studien mit einem hohen Ressourcenaufwand verbunden. Daher gingen wir in einem interdisziplinären Projekt von Geschichtsdidaktik, Computerlinguistik und Empirischer Bildungsforschung der Frage nach, ob und wie künstliche Intelligenz in Form computerlinguistischer Methoden für die Auswertung von Schülerantworten im Fach Geschichte genutzt werden können und adressierten als Forschungsfragen, (1) ob mit Hilfe von Automatic Content Assessment die Richtigkeit von Schülerantworten und (2) ob mit Hilfe von Linguistic Complexity Assessment die sprachliche Komplexität der Schülerantwort automatisiert beurteilt werden kann. Die Studie nutzt die Daten von 141 Schülerantworten bezogen auf sieben Fragen zu der Massendemonstration in Leipzig am 9.10.1989, die den Verlauf der Friedlichen Revolution in der DDR entscheidend beeinflusste.
ReferentInnen: Jun.-Prof. Dr. Christiane Bertram (Universität Konstanz), Zarah Weiss (Universität Tübingen), Lisa Zachrich (Universität Tübingen) & Dr. Ramon Ziai (Universität Tübingen)