Prompt-basiertes Debiasing in der Hochschullehre

03.06.2026

Wie Lehrende KI-Bias erkennen, reflektieren und zum Gegenstand akademischer Bildung machen können.

Generative Künstliche Intelligenz hat die Hochschullehre in kurzer Zeit verändert. Werkzeuge wie ChatGPT, TUDaGPT, Claude, Mistral AI, Gemini oder Apertus sind längst Teil des akademischen Alltags. Gleichzeitig wird deutlich, dass diese Systeme keine neutralen Wissensmaschinen sind. Sie reproduzieren gesellschaftliche Muster, Wertvorstellungen und Stereotype, die in ihren Trainingsdaten angelegt sind (Sun et al., 2024; UNESCO, 2023).

Debiasing als Lernanlass

Für Hochschullehrende stellt sich die Frage, wie Studierende KI-generierte Inhalte kritisch hinterfragen können, statt sie unreflektiert zu übernehmen. Eine Möglichkeit bietet das prompt-basierte Debiasing: Durch gezielt formulierte Eingaben lassen sich Verzerrungen in KI-generierten Texten sichtbar machen oder reduzieren. Noch bedeutsamer als dieser technische Effekt ist jedoch das didaktische Potenzial. Debiasing schafft Lerngelegenheiten, in denen Studierende wissenschaftliche Urteilskraft, kritische Reflexion und einen verantwortungsvollen Umgang mit KI entwickeln können.

Warum Bias in KI für die Hochschullehre relevant ist

Große Sprachmodelle werden mit riesigen Textmengen trainiert und übernehmen dabei nicht nur Sprache und Fachwissen, sondern auch gesellschaftliche Vorannahmen und Stereotype (Li et al., 2024). Studien zeigen, dass Frauen in KI-generierten Texten häufiger in unterstützenden Rollen erscheinen, während Männer öfter als Führungskräfte oder Expert:innen dargestellt werden. Auch ethnische Minderheiten werden seltener mit prestigeträchtigen Positionen in Verbindung gebracht. Ähnliche Verzerrungen finden sich bei bildgenerierenden KI-Systemen, die bestehende Geschlechter- und Herkunftsstereotype vielfach reproduzieren (Sun et al., 2024; Sun et al., 2025).

…bestimmte gesellschaftliche Gruppen werden häufiger mit Defiziten oder Problemen assoziiert.

Für Hochschulen ist das besonders relevant, weil KI-generierte Inhalte zunehmend in die Lehre einfließen. Werden Fallbeispiele, Musterlösungen oder Feedbacktexte mit KI erstellt, können stereotype Zuschreibungen unbemerkt übernommen werden. Die OECD (2024) warnt daher vor einem unkritischen Einsatz KI-generierter Bildungsinhalte.

Zugleich wirken KI-Texte häufig plausibel und überzeugend, sodass Verzerrungen leicht übersehen werden. Die UNESCO (2023) betont deshalb, dass AI Literacy nicht nur technisches Wissen umfasst, sondern auch die Fähigkeit, KI-Ausgaben kritisch zu bewerten und ihre Grenzen zu erkennen.

Debiasing als Bestandteil von AI Literacy

Die Diskussion über Bias ist eng mit dem Konzept der AI Literacy verbunden. Die Institution EDUCAUSE (2024) beschreibt AI Literacy als die Fähigkeit, KI-Systeme zu verstehen, kritisch zu bewerten, verantwortungsvoll einzusetzen und ihre gesellschaftlichen Auswirkungen einzuordnen. Damit wird deutlich: Der kompetente Umgang mit KI erschöpft sich nicht im Schreiben von Prompts, die eine Aufgabe vermeintlich gut lösen.

Der kompetente Umgang mit KI erschöpft sich nicht im Schreiben von Prompts…

Vielmehr müssen Studierende lernen,

  • die Entstehung von KI-Ausgaben zu hinterfragen,
  • Verzerrungen zu erkennen,
  • Perspektivenvielfalt einzufordern,
  • eigene Urteile gegenüber KI-Ergebnissen zu begründen und
  • Verantwortung für die Nutzung von KI zu übernehmen.

Prompt-basiertes Debiasing eignet sich hervorragend, um diese Kompetenzen zu fördern, weil es technische Anwendung unmittelbar mit kritischer Reflexion verbindet.

Was bedeutet prompt-basiertes Debiasing?

Prompt-basiertes Debiasing bezeichnet den Versuch, Verzerrungen in KI-Ausgaben durch gezielte Eingabeaufforderungen zu reduzieren oder sichtbar zu machen. Der Vorteil dieses Ansatzes liegt in seiner Niedrigschwelligkeit: Lehrende und Studierende benötigen keinen Zugriff auf Trainingsdaten oder Modellparameter, sondern können unmittelbar mit den verfügbaren KI-Systemen arbeiten (Schick et al., 2021).

Prompting kann Verzerrungen abschwächen, aber nicht eliminieren.

Gleichzeitig zeigen aktuelle Studien, dass Debiasing durch Prompting keine vollständige Lösung darstellt. Cantini et al. (2025) konnten nachweisen, dass selbst nach gezielten Debiasing-Maßnahmen erhebliche Zusammenhänge zwischen den ursprünglichen Modell-Biases und den resultierenden Ausgaben bestehen bleiben. Prompting kann Verzerrungen abschwächen, aber nicht eliminieren.

Genau diese Begrenztheit macht Debiasing didaktisch interessant: Es verdeutlicht Studierenden, dass KI-Systeme nicht objektiv sind und dass kritische menschliche Prüfung unverzichtbar bleibt.

Drei wissenschaftlich fundierte Debiasing-Strategien

Erstens: Explizite Diversitätsanweisungen

Die einfachste Form des Debiasings besteht darin, dem Modell ausdrücklich vorzugeben, stereotype Darstellungen zu vermeiden und Vielfalt zu berücksichtigen.

Beispielsweise könnte ein Prompt lauten:

Erstelle ein Fallbeispiel für eine Lehrveranstaltung. Berücksichtige unterschiedliche Geschlechter, Altersgruppen, soziale Hintergründe und Behinderungen. Vermeide stereotype Rollenbilder und beschreibe die Personen primär über ihre fachlichen Kompetenzen.

Studien zeigen, dass solche expliziten Anweisungen die Wahrscheinlichkeit stereotypischer Ausgaben reduzieren können (Kamruzzaman et al., 2024). Allerdings sind die Effekte nicht stabil. Je nach Modell und Themenbereich können bestimmte Verzerrungen zurückgehen, während andere bestehen bleiben oder sogar verstärkt werden (Furniturewala et al., 2024).

Für die Lehre eignet sich diese Strategie besonders als Einstieg. Lehrende können Studierende denselben Auftrag einmal mit und einmal ohne Diversitätsanweisung bearbeiten lassen und die Unterschiede gemeinsam analysieren.

Zweitens: Reflexives Prompting und Chain-of-Thought

Eine weitere Strategie besteht darin, die KI vor der eigentlichen Antwort zu einer Reflexion über mögliche Verzerrungen anzuleiten.

Ein Beispiel:

Bevor du antwortest:

  1. Benenne mögliche stereotype Annahmen.
  2. Prüfe fehlende Perspektiven.
  3. Erstelle anschließend eine inklusive Antwort.

Qiu et al. (2025) konnten mit ihrem DR.GAP-Ansatz zeigen, dass solche reflektierenden Zwischenschritte Bias reduzieren können, ohne die Leistungsfähigkeit der Modelle wesentlich zu beeinträchtigen.

Didaktisch eröffnet dieser Ansatz interessante Möglichkeiten. Studierende lernen, dass wissenschaftliche Aussagen nicht nur Ergebnisse liefern, sondern auch ihre Voraussetzungen reflektieren müssen. Die Frage verschiebt sich von „Was ist die richtige Antwort?“ zu „Welche Annahmen liegen dieser Antwort zugrunde?“.

Drittens: Self-Critique und iterative Revision

Besonders wirksam erscheint die Kombination aus Selbstkritik und Überarbeitung.

Ein entsprechender Prompt könnte lauten:

Prüfe deinen Text auf stereotype Rollenbilder, Verallgemeinerungen, fehlende Perspektiven und problematische Annahmen. Überarbeite anschließend den Text und begründe die Änderungen.

Studien zeigen, dass Sprachmodelle problematische Muster teilweise selbst erkennen und überarbeiten können (Schick et al., 2021). Neuere Arbeiten weisen darauf hin, dass Verfahren wie Self-Reflection und Self-Critique stereotype Ausgaben reduzieren können (Liu et al., 2025).

Für die Hochschullehre bedeutet das: Im Mittelpunkt sollte nicht der erste KI-Output stehen, sondern der dokumentierte Überarbeitungsprozess. So lernen Studierende, KI-Ergebnisse kritisch zu prüfen und gezielt weiterzuentwickeln, statt sie ungefragt zu übernehmen.

Vom Debiasing zur wissenschaftlichen Urteilsbildung

Der eigentliche Mehrwert von Debiasing liegt nicht darin, perfekte Texte zu erzeugen. Viel wichtiger ist die Förderung wissenschaftlicher Urteilskraft.

…wichtiger ist die Förderung wissenschaftlicher Urteilskraft.

Studierende lernen,

  • implizite Annahmen zu identifizieren,
  • Perspektiven kritisch zu hinterfragen,
  • Alternativen zu entwickeln,
  • Begründungen einzufordern und
  • Unsicherheiten offen zu legen.

Diese Fähigkeiten gehören zum Kern wissenschaftlicher Bildung. Sie entsprechen zugleich den AI-Literacy-Kompetenzen, die von UNESCO (2023), EDUCAUSE (2024) und der OECD (2024) gefordert werden.

Debiasing als Lehr-Lern-Setting

Eine besonders wirksame Lehrmethode ist der sogenannte Bias-Audit-Zyklus mit fünf Schritten.

Der Bias-Audit-Zyklus

  1. Erstellung eines Ausgangstextes mit KI.
  2. Analyse von Stereotypen und Verzerrungen.
  3. Überarbeitung des Prompts.
  4. Durchführung von Counterfactual Tests.
  5. Reflexion und Revision.

Dieses Vorgehen verbindet technische Handlungskompetenz mit kritischer Analyse und ethischer Reflexion. Gleichzeitig entspricht es den Anforderungen moderner AI-Literacy-Konzepte, die technisches Verständnis und gesellschaftliche Verantwortung zusammendenken (EDUCAUSE, 2024).

Die Grenzen des Debiasings

Erstens bleibt Modellbias bestehen. Selbst umfangreiche Promptanpassungen können tief verankerte Verzerrungen nicht vollständig beseitigen (Cantini et al., 2025).

Zweitens kann Bias lediglich verschoben werden. Wird beispielsweise Geschlechterbias reduziert, können andere Formen von Verzerrung stärker hervortreten (Furniturewala et al., 2024).

Drittens erzeugen reflektierende Prompts häufig ein trügerisches Gefühl von Sicherheit. Plausible Erklärungen bedeuten nicht automatisch, dass ein Modell seine Entscheidungen tatsächlich versteht oder fair begründet (Bai et al., 2024).

…Verantwortung für Fairness, wissenschaftliche Qualität und Inklusion bleibt stets beim Menschen.

Schließlich warnen OECD (2024), UNESCO (2023) und NIST (2023) übereinstimmend davor, KI-Ergebnisse ohne menschliche Überprüfung zu übernehmen. Die Verantwortung für Fairness, wissenschaftliche Qualität und Inklusion bleibt stets beim Menschen.

Debiasing als Chance für eine reflektierte Hochschullehre

Prompt-basiertes Debiasing ist mehr als eine technische Methode zur Verbesserung von KI-Ausgaben. Es bietet die Chance, KI selbst zum Gegenstand kritischer Auseinandersetzung in der Hochschullehre zu machen. Studierende lernen dabei nicht nur, bessere Prompts zu formulieren, sondern auch, KI-generierte Inhalte kritisch zu hinterfragen und ihre Grenzen zu erkennen.

Der didaktische Wert liegt genau darin: Debiasing macht sichtbar, dass KI nicht neutral ist, und fördert Reflexion, Urteilsbildung und einen verantwortungsvollen Umgang mit generativer KI.

Bai, X., et al. (2024). Do unbiased large language models remain unbiased? arXiv. https://arxiv.org/abs/2402.04105

Cantini, F., et al. (2025). Bias after prompting: Persistent discrimination in large language models. arXiv. https://arxiv.org/abs/2509.08146

EDUCAUSE. (2024). Defining AI literacy for higher education.

Furniturewala, C., et al. (2024). Evaluating prompting strategies for bias mitigation in large language models. arXiv. https://arxiv.org/abs/2401.15585

Kamruzzaman, M., et al. (2024). Investigating debiasing prompts in large language models. Proceedings of EMNLP 2024.

Li, Y., et al. (2024). Bias and fairness in large language models: A survey. arXiv.

Liu, Y., et al. (2025). Self-reflection for reducing gender bias in large language models. arXiv. https://arxiv.org/abs/2503.09219

OECD. (2024). The potential impact of artificial intelligence on equity and inclusion in education. OECD Publishing.

Qiu, H., Xu, Y., Qiu, M., & Wang, W. (2025). DR.GAP: Mitigating bias in large language models using gender-aware prompting with demonstration and reasoning. arXiv.

Schick, T., Udupa, S., & Schütze, H. (2021). Self-diagnosis and self-debiasing: A proposal for reducing corpus-based biases in NLP. Transactions of the Association for Computational Linguistics, 9, 1408–1424.

Sun, J., Niu, F., Liu, M., et al. (2024). Laissez-faire harms: Algorithmic biases in generative language models. arXiv.

Sun, A., et al. (2025). Algorithmic bias in image-generating artificial intelligence: Prevalence and user perceptions. Information, Communication & Society.

UNESCO. (2023). Guidance for generative AI in education and research. UNESCO.