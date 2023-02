Für die Theorieprüfung müssen Medizinstudenten in der Regel jahrelang büffeln. Der Textroboter ChatGPT beantwortet die schwierigen Fragen aus dem Stegreif – und erzielt dabei ein überraschend gutes Ergebnis, wie Forscher berichten. Es ist nicht die erste Hochschulprüfung, die die künstliche Intelligenz meistert.

Der Textroboter ChatGPT würde bei einer Prüfung für angehende Medizinstudenten in den USA bemerkenswert gut abschneiden. Unter bestimmten Bedingungen konnte die KI-Software die erforderliche Mindestpunktzahl in den drei theoretischen Teilen des United States Medical Licensing Exam (USMLE) erreichen. Das berichten US-Experten im Fachblatt „PLOS Digital Health“. Allerdings ließ das Team um Victor Tseng vom kalifornischen Startup AnsibleHealth einige Fragen aus. Die USMLE ist eine standardisierte dreiteilige Prüfung, die Medizinstudenten bestehen müssen, um in den Vereinigten Staaten Medizin praktizieren zu dürfen. Dabei wird Wissen aus den meisten medizinischen Disziplinen – von der Biochemie über diagnostisches Denken bis hin zur Bioethik – ausgewertet.

Beim Testen mit ChatGPT mussten die Studienautoren allerdings berücksichtigen, dass die KI-Software OpenAI nur Texteingaben akzeptieren kann. Bildbasierte Fragen wurden entfernt. Anschließend testeten die Autoren die Software anhand von 350 öffentlich zugänglichen Fragen, die Teil der USMLE-Prüfung im vergangenen Sommer waren.

Das Ergebnis: Nachdem mehrdeutige Antworten der KI entfernt wurden, erreichte ChatGPT in den drei USMLE-Prüfungsteilen 52,4 bis 75 Prozent der noch erreichbaren Punkte. Die Ergebnisse variierten je nach Testteil und Aufgabentyp – etwa Zeckentests oder offene Fragen. Die Bestehensgrenze liegt bei rund 60 Prozent und ändert sich je nach Jahrgang leicht. Rechnet man die mehrdeutigen Antworten in das Ergebnis ein, erreicht ChatGPT 36,1 bis 61,5 Prozent der möglichen Punkte. Laut den Autoren übertraf ChatGPT PubMedGPT, ein Gegenmodell, das ausschließlich auf biomedizinischer Literatur trainiert wurde.

Juristische Prüfung bestanden

Das Team kam zu dem Schluss, dass ChatGPT das Potenzial hat, die medizinische Ausbildung und damit die klinische Praxis zu verbessern. „Das Erreichen der Mindestpunktzahl für diese notorisch schwierige Expertenprüfung und dies ohne menschliche Hilfe, ist ein bemerkenswerter Meilenstein in der Entwicklung der klinischen KI“, schreiben die Autoren.

Der Textroboter ChatGPT hatte sich zuvor in anderen Fächern der Universität durchgesetzt, auch wenn er in den Prüfungen keine Bestnoten erzielte. Laut Professoren der University of Minnesota hat das KI-Chatbot-Tool die juristischen Prüfungen in vier Kursen und einem weiteren Kurs an der Wharton School of Business der University of Pennsylvania bestanden.

Nach dem öffentlichen Start von ChatGPT durch das kalifornische Start-up-Unternehmen OpenAI im November 2022 lieferten sich etliche Player der Tech-Branche einen regelrechten Wettlauf um die Gunst der Nutzer. OpenAI wird von Microsoft mit Milliarden von Dollar unterstützt. Im Gegenzug kann Microsoft die Technologie in seine Suchmaschine Bing und andere Produkte integrieren. Der große Gegner von OpenAI und Microsoft ist Google. Der Suchmaschinenriese hat am Dienstag seinen eigenen Chatbot Bard gestartet. Auch kleinere Player wie You.com des deutschen KI-Forschers Richard Socher nehmen am Rennen teil. Socher stammt aus Dresden, lebt und arbeitet aber seit Jahren in den USA.