Große Sprachmodelle wie GPT-5 oder Llama bewerten Sprecherinnen und Sprecher deutscher Dialekte systematisch schlechter. Das zeigt eine aktuelle Studie, bei der Prof. Dr. Katharina von der Wense und Minh Duc Bui von der Johannes Gutenberg-Universität Mainz (JGU) eine führende Rolle übernahmen. Ihre Ergebnisse wurden kürzlich im Rahmen der diesjährigen Conference on Empirical Methods in Natural Language Processing (EMNLP), einer bedeutenden Konferenz für Computerlinguistik, veröffentlicht. Gemeinsam mit Forschenden der Universitäten Hamburg und Washington hatten Bui und von der Wense untersucht, wie Künstliche Intelligenz (KI) auf Dialektäußerungen reagiert. Das Ergebnis: Sämtliche getesteten Modelle übernahmen stereotype Denkmuster aus der Gesellschaft.