Während alle wie gebannt auf die immer neuen Tricks von „Large Language Models“ wie ChatGPT schauen ist KI längst in den medizinischen Alltag eingezogen.
„Eine Prinzessin ist so alt wie der Prinz, wenn die Prinzessin doppelt so alt ist wie der Prinz, als das Alter der Prinzessin die Hälfte der Summe ihres jetzigen Alters betrug. Wie alt sind der Prinz und die Prinzessin?“ Zwar soll die jüngste Version von ChatGPT, genannt ChatGPT o1, auch sehr komplexe Rätsel (letztlich eine mathematische Aufgabe) lösen können, was bisher eine Achillesferse der Chatbots ist (Erfahrungen mit der Auflösung am Ende dieser Geschichte;).
Zweifelsohne war „generative KI“, angeführt von ChatGPT von OpenAI, der KI-Star der beiden vergangenen Jahre. Jedoch folgt wie bei den meisten Technologie-Zyklen auf den Hype die Ernüchterung, dass es für weit verbreitete, kommerzielle Anwendungen mehr Zeit braucht. So auch bei den „Large Language Models“ (LLM) der KI wie ChatGPT. Noch sind LLMs eine Lösung, für die noch nach realen Aufgaben für eine breite Nutzergemeinde gesucht wird.
Der Optimismus stirbt allerdings zuletzt: Nach einer Kurskorrektur an der Börse von Unternehmen wie Microsoft, die viele Milliarden in OpenAI investiert haben, konnte OpenAI in einer neuen Finanzierungsrunde 6,6 Mrd. Dollar aufstellen und gilt seither mit einem (Papier-) Wert von 157 Mrd. Dollar als das erfolgreichste Startup aller Zeiten.
Ein Flugschreiber für den OP-Saal
KI ist aber natürlich sehr viel mehr als ein Chatbot und wird nachhaltige Auswirkungen auf alle Lebensbereiche haben. Ein Bereich, in dem KI bereits erfolgreich eingesetzt wird, ist die Medizin. Hier kommt die große Stärke von KI in der Erkennung von Mustern und Abweichungen, oft Zeichen von Erkrankung, zum Einsatz.
Um zu erkennen, dass eine 13-jährige nichts in einem Operationssaal zu suchen hat, schon gar nicht Geräte bedienen soll wie in Graz geschehen, sollte zwar der Hausverstand genügen. Jedoch ist auch bei gewissenhafter Arbeit in OP-Sälen nicht immer alles optimal und fehlerfrei. Aus Schwächen zu lernen, idealerweise schon während der Operation vor einem Fehler zu warnen, soll eine KI-gestützte „OP Blackbox“ ermöglichen, eine Art Flugschreiber für den OP-Saal.
Mehrere Kameras und Mikrofone erfassen das gesamte OP-Geschehen, von der Vorbereitung bis zum Ende, verwendete Instrumente und Medikamente, Vitaldaten des Patienten, Kommunikation zwischen allen Beteiligten, mögliche Störfaktoren. Die enorme Menge von täglich eine halber Million Datenpunkten wird dann mit Hilfe Künstlicher Intelligenz unter Beiziehung von Spezialisten analysiert. Trainiert wird diese KI durch hoch qualifizierte Analysten, häufig selbst Chirurginnen und Chirurgen, die alle Details des Trainingmaterials bezeichnen.
Bereits mehr als 40 Spitälern, darunter das dänische Rigshospitalet und der Krankenanstaltenverbund Amsterdam UMS, verwenden dieses System von Surgical Safety Technologies. Als Chirurg am Anfang seiner Laufbahn habe er aus Videoaufnahmen gelernt, sagt Teodor Grantcharov, Professor für Chirurgie an der Stanford University, der das System entwickelte. Unbeholfene Schnitte, falsche Instrumente, ineffiziente Abläufe: „Bis zum Augenblick, als ich das Video sah, dachte ich, dass meine Leistung ausgezeichnet sei.“
Das Ergebnis der Blackbox-Auswertung sind kurze Videoclips kritischer Momente und ein Dashboard mit Statistiken über den Verlauf. Chirurginnen und Chirurgen können einzelne Passagen aufrufen und studieren. Die weitere Entwicklung: Nicht erst nach der OP Feedback geben, sondern live vor möglichen Fehlern zu warnen. Sensibilität ist bei der Einführung in einem Spital nötig, damit es vom medizinischen Personal nicht boykottiert wird. Darum werden Video und Audio anonymisiert und alle Aufzeichnungen nach 30 Tagen automatisch gelöscht. Das soll Sorgen entkräften, dass die Daten in allfälligen Verfahren gegen das Personal verwendet werden könnten.
Das scharfe Auge von Doktor KI
Bei Bildanalyse ist KI vielfach bereits klinischer Alltag. Ein Forscherteam an der Dermatologie der Wiener MedUni verglich die Qualität menschlicher Diagnosen von Hautkrebs mit der von KI-Systemen. Eine KI-gestützte Smartphone-App zur Hautkrebsdiagnose erzielt inzwischen ähnlich gute Diagnoseraten wie Expertinnen und Experten. Im Vergleich mit weniger erfahrenen Ärztinnen und Ärzten ist die KI-App jedoch bereits signifikant besser, belegt die gemeinsame mit einem australischen Melanom-Zentrum durchgeführte Wiener Studie.
Bei den Therapieempfehlungen waren die Fachleute hingegen wesentlich besser als die KI, sie rät nämlich wesentlich öfter bei gutartigen Läsionen zur operativen Entfernung als die Ärzte. Die KI-Systeme verbessern sich durch „Verstärkungslernen“, der Rückmeldung, ob eine Diagnose richtig oder falsch war, ständig weiter. Am Ende „muss eine Person stehen, die sich auskennt“, sagt Harald Kittler, Forscher an der Uni-Klinik für Dermatologie.
Brustkrebs bis zu fünf Jahre früher erkennen
Bei der Diagnose von Brustkrebs anhand von MRI Scans (Magnetic Resonance Imaging) kann die Zusammenarbeit zwischen Mensch und Maschine die Treffsicherheit um 20 Prozent erhöhen. Das zeigte eine im „Lancet Oncology“ veröffentlichte Studie, bei der die Scans von 80.000 Schwedinnen mit erblichem Erkrankungsrisiko analysiert wurden. Während Teams von je zwei Radiologen bzw. Radiologinnen bei 1000 Scans fünf Karzinome entdeckten, kamen bei der Radiologen-KI-Kombo sechs korrekte Diagnosen auf 1000 Bilder.
Hoffnung auf frühere, damit oft lebensrettende Diagnosen macht ein Forschungsprojekt des renommierten MIT (Massachusetts Institute of Technology). Anhand hunderttausender Mammografien hat das MIRAI getaufte KI-System bis zu fünf Jahren früher als Spezialistinnen und Spezialisten korrekte Diagnosen gestellt. Für die weitere Entwicklung bleibt genug zu tun: Wie auch bei der Gesichtserkennung funktioniert MIRAI besser bei weißen Frauen als bei Frauen schwarzer Hautfarbe. Der Unterschied liegt wahrscheinlich im Trainingsmaterial, für das mehr Scans weißer Frauen zur Verfügung stehen. Schlechtere medizinische Behandlung und rechtzeitige Diagnostik führt dazu, dass in den USA – bei gleicher Erkankungsrate – 42 Prozent mehr schwarze Frauen an Brustkrebs sterben als weiße.
Österreichs Forscherinnen und Forscher sind sehr aktiv an KI-Entwicklungen beteiligt. Speziell mit KI-Einsatz in der Medizin beschäftigt sich an der MedUni Wien neben der Uni-Klinik für Dermatologie auch die Neurochirurgie des Universitätsklinikum, das bei Operationen Gewebeproben mit Hilfe von KI schneller analysieren und damit die Narkosedauer verkürzen kann.
„Bei der Biopsie oder Entfernung von Tumoren im Gehirn oder dem Rückenmark kann damit eine Gewebeanalyse viel rascher erfolgen, und somit können chirurgische Entscheidungen viel schneller und sicher getroffen werden“, erklärt der Neurochirurg Georg Widhalm im Gespräch mit der APA. Während man bei der klassischen neuropathologischen Schnellschnitt-Befundung rund eine halbe Stunde wartet, währenddessen der Patient in Vollnarkose am Operationstisch (beispielsweise bei Biopsien) liegt, funktioniert dies mit dem digitalen Histologiegerät, das Gewebeproben scannt und auch mittels KI analysiert, innerhalb von ungefähr drei Minuten.
Die Diagnosen des „digitalen Mediziners“ sind sehr verlässlich: „In 99 Prozent der untersuchten Fälle gab es eine Übereinstimmung der digitalen Histologie mit der konventionellen Histologie entsprechend einer wissenschaftlichen Studie an der MedUni Wien“, berichtet er.
Das Alter von Prinzessin und Prinz
Und wie steht es jetzt mit der Auflösung der Eingangs gestellten Frage nach dem Alter der Prinzessin in Relation zu ihrem Prinzen? Der Befund durch ChatGPT o1 scheint weitgehend richtig, fällt aber je nach Frage in Englisch oder leicht variierender deutscher Übersetzung mit leichten Abweichungen aus. Interessant ist dabei, dass die Antwort in Schritten erfolgt, bei der die Aufgabe in ihre mathematischen Bestandteile zerlegt wird – womit Benutzerin und Benutzer auch logische Deduktionen lernen können.
Der Konsens mehrere Anfragen ist jedenfalls dieser: Die Prinzessin ist 8, der Prinz 6 Jahre alt. Und auch Vielfache dieser Zahlen, bei gleichem 8:6-Verhältnis, sind möglich. Nur einmal ist ChatGPT o1 entgleist, was vielleicht an der Übersetzung lag: Demnach seien Prinzessin und Prinz gleich alt. Eine Second Opinion ist offenbar nicht nur in der Medizin nützlich.
KI-Forschung zur Medizin in Österreich:
MedUni Wien: Artificial Intelligence und Machine Learning
TU Wien: Center for Artificial Intelligence and Machine Learning (CAIML)
FH Joanneum Graz: eHealth Institute
Department Medical Informatics der RISC Software GmbH, ein Spinoff der Johannes Kepler Universität Linz
Austrian Institute of Technology (AIT): Forschungsabteilung Medical Signal Analysis
Published by