| Verena Schmidt |
| 28.04.2026 10:00 Uhr |
Beim Thema akute Nierenschädigung kann Künstliche Intelligenz Wissen besser abrufen und anwenden als Ärzte, das zeigt eine Studie. Dennoch kann man auf menschliche Mediziner nicht verzichten. / © Adobe Stock/Crystal light
Das Team der Forschenden verglich die Antworten der Modelle mit 123 freiwilligen Teilnehmenden, darunter Medizinstudierende sowie Ärzte aus dem Bereich der Inneren Medizin, die im Mai 2025 am Jahreskongress der Deutschen Gesellschaft für Innere Medizin (DGIM) in Wiesbaden teilgenommen hatten. Die Ergebnisse haben die Forschenden nun im Open-Access-Fachjournal »Scientific Reports« veröffentlicht.
Sowohl die KI-Modelle als auch die Mediziner bearbeiteten den identischen Wissenstest zum Thema Nierenschädigungen mit 15 Multiple-Choice-Fragen und zwei Patientenfällen. Das Ergebnis fiel den Studienautoren zufolge recht deutlich aus: Im Durchschnitt beantworteten die Sprachmodelle 90 Prozent der Fragen richtig, bei den Kongressteilnehmern waren es nur 49 Prozent. Mehrere Modelle hätten auch alle Fragen korrekt beantwortet und dafür nur einen Bruchteil der Zeit gebraucht, die die Menschen benötigten, heißt es in der Pressemitteilung der Universität Marburg.
Die Autoren betonen aber, dass das gute Abschneiden im Wissenstest nicht automatisch bedeutet, dass die KI eigenständig klinische Entscheidungen treffen kann oder sollte. »Menschliches Urteilsvermögen und klinische Erfahrung bleiben entscheidend«, betont der Marburger Nephrologe Professor Dr. Ivica Grgic in der Pressemeldung. Die Verantwortung liege klar bei den behandelnden Ärzten.
Studienleiter Dr. Philipp Russ fasst zusammen: »Große Sprachmodelle können medizinisches Faktenwissen sehr schnell bereitstellen. Das ist eine Chance für den klinischen Alltag. Gleichzeitig haben sie klare Grenzen: Sie können unter anderem fehlerhafte Inhalte erzeugen, den Menschen nicht in seiner ganzen Komplexität erfassen und keine Empathie empfinden.« Ein Sprachmodell sehe, höre und spüre nicht, worum es einem Patienten wirklich geht und könne daher ärztliches Handeln und klinisches Urteil nicht ersetzen. Richtig eingesetzt könne es Ärzten jedoch mehr Zeit für Aufmerksamkeit, Zuwendung und menschliche Nähe geben.