Prüfen im Wandel mit Künstlicher Intelligenz
30.04.2025
Wie Lehrende Lernziele und Prüfungen zukunftsorientiert gestalten und wissenschaftliche Integrität fördern.

Die rasante Entwicklung künstlicher Intelligenz verändert die Berufswelt und das Lernen an Hochschulen in erheblichem Maße. Lernziele, Aufgaben und Prüfungsformen bedürfen einer Anpassung: erstens, weil Studierende KI im Studium nutzen und zweitens, weil Arbeitgeber*innen zunehmend erwarten, dass Mitarbeiter*innen KI-Werkzeuge effektiv und ethisch verantwortungsvoll einsetzen können.
Manche Aufgaben werden zwar kaum durch KI-Einsatz unterstützt, so beispielsweise laborpraktische Aufgaben oder Aufgaben, die motorische Leistungen verlangen. Wenn KI jedoch bei einer Aufgabe helfen kann, müssen Lehrende sich fragen, in welchem Maße diese Kompetenz von Studierenden noch erlernt werden muss. Sofern die Aufgabe auch noch ohne KI beherrscht werden muss, können nur überwachte Prüfungen genutzt werden. Andernfalls sollten Prüfungen entworfen werden, die KI-Nutzung integrieren, um Studierende auf die Anforderungen einer zunehmend digital-gestützten Berufswelt vorzubereiten (siehe Abbildung 1).
Mit einem möglichen KI-Einsatzes ist eine Verschiebung der zu prüfenden Lernziele verbunden. Häufig können nämlich selbst kostenfrei zugängliche generative KI-Modelle die Verarbeitung von Routineaufgaben und reines Faktenwissen abdecken. Hochschulprüfungen sollten daher verstärkt Fähigkeiten abfragen, die über die reine Informationswiedergabe hinausgehen. Entsprechend rücken Kompetenzen wie kritisches Denken, Problemlösekompetenz, Kreativität und Transferleistungen in den Vordergrund.
Die schnelle Entwicklung von KI führt dazu, dass Lernaufgaben und Prüfungsformate sich kontinuierlich anpassen müssen, um zukunftsfähige und aussagekräftige Prüfungsergebnisse zu erzeugen. Es ist eine dynamische Entwicklung zu erwarten.
KI-integrierte Prüfungsaufgaben nutzen
Um den kompetenten Einsatz von KI zu prüfen, können Aufgaben in Prüfungen eingebaut werden, die mit KI-Unterstützung gelöst werden. Mögliche Aufgaben könnten sein:
- Prompts formulieren und optimieren,
- KI-Output kritisch analysieren,
- Resultate verschiedener KI-Tools vergleichen,
- KI-Output mit anderen wissenschaftlichen Quellen vergleichen und
- Datenanalysen mit KI-Unterstützung durchführen.
Zugehörige Bewertungskriterien werden unter anderem
- der kompetente Einsatz von Prompts,
- die effiziente Vorgehensweise,
- der Abgleich mit wissenschaftlichen Quellen und
- die kritische Beurteilung von KI-Ergebnissen
sein. Auch das digitale Prüfen wird in diesem Zusammenhang noch wichtiger.
Authentische Aufgaben stellen
Eine weitere Möglichkeit besteht darin, in der Lehre verstärkt authentische Aufgabenstellungen zu nutzen, die einen Realbezug oder eine offene Problemstellung enthalten. Studierende analysieren etwa ein aktuelles Fallbeispiel aus der Praxis oder lösen ein Problem, das Kontextwissen erfordert, welches über frei verfügbares Internetwissen hinaus geht. Zu diesen Aufgabestellungen zählen auch Projektarbeiten oder , bei denen Studierende eigene Daten erheben oder ein Produkt entwickeln (An et al., 2025). Wichtig ist, dass die Aufgabe zwar lösbar, aber komplex genug und wenig standardisierbar ist – somit können mit Hilfe einer KI höchstens Teilaspekte liefern, aber nicht die komplette Leistung. Fallstudien
Überwachte Prüfungen für Aufgaben, die auch zukünftig ohne KI beherrscht werden müssen, einsetzen
Jedes Fach beinhaltet Wissen und Kompetenzen, die Studierende erlernen müssen. Dies können Kompetenzen sein,
- die KI (noch) nicht beherrscht oder
- Kompetenzen von Expert*innen, die auch zukünftig benötigt werden oder
- Fähigkeiten, um die Qualität von KI-Output beurteilen zu können.
Sind diese Kompetenzen Gegenstand von Lernzielen und Prüfungen, dann sollte die Prüfung ohne Hilfsmittel erfolgen und der Einsatz von generativer KI zur Lösung der Aufgaben verboten werden.
Grundsätzlich empfehlenswert sind hier Prüfungen vor Ort, ohne oder mit beschränktem Zugang ins Internet. So kann geprüft werden, ob die Studierenden in der Lage sind, die geforderten kognitiven Prozesse mit dem gewünschten Ergebnis zu erbringen. Entsprechend des müssen die Studierenden auf diese Prüfungsszenarien in der Lehre vorbereitet werden, indem sie ihre Kompetenzen ohne KI erwerben. Hierzu empfiehlt es sich, die entsprechenden Aufgaben in der Lehrveranstaltung ohne KI-Unterstützung zu üben (Spannagel, 2023a). Wo ausreichend Personalkapazität vorhanden ist, sollte in Präsenzübungen gearbeitet werden. Dort kann besser überprüft werden, dass auf den Einsatz von KI verzichtet wird. Constructive Alignment
Unbeaufsichtigte Prüfungsformen: Haus- und Abschlussarbeiten, Berichte und Essays
Aktuell erweisen sich unbeaufsichtigte Prüfungsformen dann als problematisch, wenn KI-Nutzung nicht erlaubt ist. Kein KI-generierter Inhalt kann mit Plagiatssoftware rechtssicher erkannt werden.
Entsprechend geht die zentrale Befürchtung Lehrender dahin, dass die Studierenden mit Hilfe von KI im Studium schummeln und zentrale Forderungen wissenschaftlicher Integrität nicht eingehalten werden.
Prüfungsformate wie Haus- und Abschlussarbeiten, Essays oder schriftliche (Open-Book-)Klausuren sind besonders anfällig für eine unregulierte KI-Nutzung (Salden, Lordick & Wiethoff, 2023; Spannagel, 2023a), besonders in Fächern, die viel auf Grundlage von Texten arbeiten. Im Umgang mit unbeaufsichtigten Prüfungsformaten werden derzeit verschiedene Strategien diskutiert und folgend dargestellt.
Lösungsansatz 1: KI-Nutzung erlauben und Dokumentation verlangen
- Lehrende können Studierenden grundsätzlich erlauben, generative KI bei der Erarbeitung ihrer Produkte zu erlauben.
- Studierende sollen verwendeten KI-Output kenntlich machen und die Zusammenarbeit mit KI dokumentieren (). Empfehlungen dazu
- Sie übernehmen Verantwortung für alle Ergebnisse.
In diesem Szenario müssen Studierende mit wissenschaftlichen Standards vertraut sein. Und Studierende müssen Lerngelegenheiten haben, in denen sie einen aktiv mitdenkenden Nutzungsmodus einüben, wenn Sie KI verwenden. Die eigenständige Denk- und Arbeitsleistung muss im Vordergrund stehen.
Lehrende sollten Erwartungen und Regeln hinsichtlich der KI-Nutzung transparent darlegen, damit Studierende sich beim KI-Einsatz sicher fühlen.
Lösungsansatz 2: schriftliche und mündliche Anteile verknüpfen
- Eine Möglichkeit für diese unbeaufsichtigten Prüfungsformen besteht darin, sie durch mündliche Aufgaben zu ergänzen (Hanke, 2023). Ein Beispiel wäre die Interaktion in Lehrveranstaltungen oder in Verteidigungen von Abschlussarbeiten.
- Möglicherweise könnte auch eine Kombination aus schriftlichen und mündlichen Prüfungen je nach Anforderungsniveau der Aufgaben erfolgen (Mohr et al., 2024; Spannagel, 2023a).
Im mündlichen Teil können Studierende, die sich ausreichend mit dem Thema auseinandergesetzt haben zeigen, dass sie ein tiefes Verständnis erworben haben. Allerdings erfordert dieser Ansatz ausreichend Personalkapazität. Bei Bedarf müssen Prüfungsordnungen angepasst werden, beispielsweise würde eine Masterarbeit wie eine Verteidigung als mündliche Prüfung abgenommen.
Lösungsansatz 3: Zur Unterstützung des Lernens durch Portfolioprüfung und formatives Feedback
Grundsätzlich lohnt sich die Auseinandersetzung mit der Frage, welches Ziel mit der Verwendung von Hausarbeiten als Prüfungsform eigentlich verfolgt wird (Hanke, 2023).
- Soll damit der Lernprozess unterstützt werden, indem eigene Gedanken und Erkenntnisse schreibend nach außen gebracht werden und damit in einen wissenschaftlichen Diskurs eingetreten wird?
- Oder soll die Schreibkompetenz überprüft werden?
- Sind vielleicht sogar beide Lernziele?
Besonders eine Vermischung von Hausarbeiten als Lernprozess und Prüfungsprodukt sollte hinterfragt werden (Hanke, 2023; vgl. auch Salden, Lordick & Wiethoff, 2023, zur Unterscheidung von formativen und summativen Lern- und Prüfungsaufgaben).
Liegt das Lernziel darin, das Lernen und den Erwerb von Schreibkompetenz zu fördern, sollten Prüfungen stärker auf die Prozessqualität ausgerichtet sein (Friedrich & Tobor, 2023), sofern entsprechende Personalkapazitäten zur Verfügung stehen. Lehrende erhalten dabei Einblicke in den Erstellungsprozess wissenschaftlicher Arbeiten (Gimpel, 2023; Spannagel, 2023a; Weßels, 2022). Feedback von Lehrenden, KI oder kriteriengeleitetes Peerfeedback zu Zwischenschritten begleitet diesen Prozess. Das Feedback wird wiederum in die eigene Arbeit eingebaut. Als Prüfungsform kann das Portfolio gewählt werden. Hier dokumentieren Studierende ihre Arbeit und begründen, z.B.
- Welche Überarbeitungsschritte wurden warum und wie vorgenommen?
- Welche Prompts haben sie genutzt
- Oder welches Feedback von Lehrenden, Mitstudierenden oder der KI wurde eingearbeitet?
Auch die Reflexion eigener Erkenntnisse in einem Lerntagebuch kann in das Portfolio integriert werden.
KI-Tools könnten auch Teile des Prozesses übernehmen, die eigentlich Studierende machen sollen. Lehrende sollten jedoch darauf vertrauen, dass Studierende ein Eigeninteresse daran haben, diese Kompetenzen zu entwickeln – nicht zuletzt, weil sie diese in der späteren beruflichen Praxis benötigen.
Neue Bewertungskriterien und veränderte Gewichtung
Aus der veränderten Prüfungspraxis leitet sich ab, dass neue Bewertungskriterien für die studentische Eigenleistung entwickelt werden müssen. Diese lassen sich direkt aus den Anforderungen ableiten, die Studierende beim sach- und fachgerechten wissenschaftlichen Arbeiten mit KI bewältigen müssen, um erfolgreich qualitativ hochwertige Texte zu erstellen. Beispiele für Bewertungskriterien beim Einsatz von KI-Tools könnten sein:
- Einzigartige Eigenleistungen, die über das Zusammenfassen von Literatur hinausgehen, z.B. theoretische, empirische oder technische Inhalte, Analysen eigener Daten, Messreihen.
- Einbezug persönlicher Reflexion, z.B. Lernprotokoll oder eigene Stellungnahmen (nach Gimpel et al., 2023).
- Nachvollziehbare Dokumentation des KI-Einsatzes.
- Sinnvoller Einsatz von KI-Tools bei der Erstellung, z. B. Nutzung als „Lernpartner*in): Die Dokumentation der Studierenden zeigt, dass gute Prompts verwendet wurden und KI-Output mit anderen wissenschaftlichen Quellen kritisch geprüft und überarbeitet oder ergänzt wurde.
- Bei Hausarbeiten z.B. das Einbeziehen der Seminardiskussion in die Ausarbeitung.
Außerdem sollte über eine veränderte Gewichtung bei den Prüfungskriterien nachgedacht werden. Argumentationstiefe, Originalität der Lösungswege oder Reflexionsfähigkeit sollten stärker gewichtet werden. Auch der mündlichen Verteidigung einer Bachelor- oder Masterarbeit könnte ein hohes Gewicht gegeben werden, denn in der Verteidigung können Lehrende überprüfen, wie tief Studierende die Inhalte durchdacht haben. Sprachliche Aspekte könnten hingegen zukünftig weniger Gewicht erhalten, wenn zunehmend mehr Studierende KI zur Korrektur von Arbeiten nutzen, ausgenommen jedoch das Sprachenlernen.
Abschließend lässt sich festhalten, dass die Entwicklung generativer KI Hochschulen vor die Aufgabe stellt, Prüfungen dynamisch weiterzuentwickeln. Wenn Prüfungsformate gezielt an die veränderten Rahmenbedingungen einer Welt mit KI angepasst werden, kann das nicht nur die Aussagekraft der Ergebnisse steigern, sondern auch die Studierenden besser auf eine digital geprägte Berufswelt vorbereiten. Die Herausforderungen lassen sich meistern, indem transparente Regeln, didaktisch durchdachte Lehr- und Prüfungsformate und eine vertrauensvolle Lernkultur wissenschaftliche Integrität und Zukunftsorientierung miteinander verbinden.
Bei der sprachlichen Überarbeitung wurde eine KI-Anwendung (ChatGPT) eingesetzt. Die inhaltliche Verantwortung liegt bei der Autorin.
