Warum die Medizin mehr als eine KI braucht
Mit „ChatGPT for Clinicians“ hat OpenAI eine spezialisierte Variante seines Sprachmodells vorgestellt, die explizit für den medizinischen Alltag entwickelt wurde. Die internationale Aufmerksamkeit war groß und die Hoffnungen sind berechtigt. Doch die Rolle eines einzelnen Large Language Models (LLM) wird dabei systematisch überschätzt. Damit sich die Versprechen im Gesundheitswesen wirklich erfüllen, brauchen wir viele KI-Modelle, die zusammenarbeiten.
Bei aller Euphorie rund um „ChatGPT for Clinicians“ werden zwei Punkte häufig übersehen:
Erstens ist die Anwendung primär auf allgemeinen medizinischen Informationen wie Leitlinien aufgebaut. Diese zu recherchieren ist jedoch nicht der eigentliche Zeitfresser im Klinikalltag. Der weitaus größere Aufwand liegt darin, die individuellen Patientenakten zu sichten und sich einen Überblick über die Krankheitshistorie zu verschaffen. Dort fließt ein Großteil der rund drei Stunden hinein, die Ärztinnen und Ärzte täglich mit Dokumentation verbringen.
Zweitens basiert „ChatGPT for Clinicians“ im Wesentlichen auf einer einzigen Modellarchitektur. Ein einzelnes LLM – so leistungsfähig es auch sein mag – kann die vielschichtigen Anforderungen der Medizin nicht vollständig erfüllen. Wer nachhaltigen Mehrwert schaffen will, muss über den Einsatz isolierter Modelle hinausdenken.
Von allgemeinen Leitlinien zu patientenindividuellen Daten
Solange eine KI ausschließlich mit allgemein verfügbaren Quellen arbeitet, bleibt der klinische Nutzen begrenzt. Erst wenn KI-Systeme Zugriff auf individuelle Patientendaten erhalten, ändert sich das Bild grundlegend. In Europa ist dabei zu beachten: Der Einsatz US-amerikanischer Modelle für patientenbezogene Daten ist mit erheblichen datenschutz- und compliance-rechtlichen Hürden verbunden. Gefragt sind Lösungen, die dem deutschen Datenschutz vollumfänglich gerecht werden.
Hinzu kommt eine weitere Herausforderung: Rund 90 Prozent der Patientendaten in Kliniken liegen unstrukturiert vor – als PDF-Dokumente oder Freitexteingaben. Um sie für KI nutzbar zu machen, müssen sie zunächst strukturiert werden. Das erfordert zwei Schritte: die Strukturierung im Hintergrund und die verständliche Aufbereitung im Vordergrund. Beide müssen höchst präzise ablaufen – denn in der Medizin können Fehler schwerwiegende Folgen haben.
Nicht das beste Solo-LLM – das beste KI-Team
Nicht jedes LLM ist gleichermaßen gut darin, unstrukturierte Inhalte zuverlässig zu standardisieren, zu extrahieren und verständlich aufzubereiten. Manche Modelle glänzen in der Textgenerierung, andere bei Informationsextraktion oder Klassifikation. Entscheidend ist daher, verschiedene KI-Modelle so miteinander zu verbinden, dass sich ihre Stärken addieren und ihre Schwächen ausgleichen. Das könnte zum Beispiel so aussehen
- Ein Modell extrahiert medizinische Entitäten aus Freitext.
- Ein weiteres normiert die Informationen auf standardisierte Codes (z. B. ICD oder SNOMED).
- Ein drittes Modell generiert daraus verständliche, dialogfähige Texte für den Arzt.
Mit einer derartigen „Model Orchestration“ lässt sich auch das Problem der Halluzinationen lösen: Mehrere LLMs arbeiten zusammen, überprüfen sich gegenseitig und bewerten die Qualität der Ergebnisse. Ergänzt durch regelbasierte Systeme und evidenzbasierte Datenbanken lässt sich das Risiko von Fehlinterpretationen nahezu auf null reduzieren.
Von der Theorie in die Praxis: Averbis Medical Summary
Solche Lösungen sind der Praxis näher, als die meisten vermuten. Am Bosch Health Campus in Stuttgart hat Averbis eine solche Anwendung in einem KI-Reallabor getestet – einer kontrollierten Umgebung, die Entwicklung, Training, Testing und Validierung innovativer KI-Systeme im Einvernehmen mit den Regulierungsbehörden ermöglicht. Inzwischen steht der Routinebetrieb in ersten Abteilungen des Robert Bosch Krankenhauses unmittelbar bevor.
Die „Medical Summary“ von Averbis deckt den gesamten Prozess ab: von der strukturierten Darstellung der Patientenhistorie bis hin zur Arztbriefschreibung. Die Anwendung extrahiert relevante Informationen aus sämtlichen im Krankenhaus verfügbaren Patientendaten, fasst sie übersichtlich zusammen und macht sie dialogfähig. Ärztinnen und Ärzte können gezielt Fragen stellen – etwa nach Allergien, Medikamenten oder dem Zeitpunkt der letzten Bildgebung.
Die Ergebnisse sprechen für sich: Ärztinnen und Ärzte können über die Medical Summary fünfmal schneller auf relevante medizinische Dokumentation zugreifen und benötigen bis zu 50 Prozent weniger Zeit für die Erstellung von Arztbriefen. Für ein Haus wie das Robert Bosch Krankenhaus entspricht das einem Äquivalent von rund 100.000 ärztlichen Arbeitsstunden – die fortan der Patientenversorgung zur Verfügung stehen.
Die Erfolge am Bosch Health Campus haben weitere Einrichtungen überzeugt: Mittlerweile geht die Medical Summary auch im Klinikum Rheine in den Praxisbetrieb. Und der KIS-Hersteller Meierhofer hat die Anwendung in sein Krankenhaus-Informationssystem integriert.
Fazit: Orchestrierung statt Monolith
Die Zukunft der KI im Gesundheitswesen liegt nicht in der Dominanz eines einzelnen Systems. Den Unterschied werden Plattformen machen, die verschiedene Modelle gezielt kombinieren – um Stärken optimal zu nutzen und Schwächen auszugleichen. Nur so lässt sich der Spagat zwischen Effizienz und Zuverlässigkeit meistern. Und nur so wird KI die Hoffnungen erfüllen, die derzeit viele in der Medizin in die Technologie setzen.