Künstliche Intelligenz in der Röntgen-Thorax-Analyse auf einer Intensivstation: Eine retrospektive Studie
Artificial Intelligence in Chest X-Ray Analysis in the Intensive Care Unit: A Retrospective Study
by Anna-Lena Andrea John
Date of Examination:2025-06-25
Date of issue:2025-05-28
Advisor:Prof. Dr. Joachim Lotz
Referee:Prof. Dr. Joachim Lotz
Referee:Prof. Dr. Bernhard Danner
Files in this item
Name:John_Anna-Lena Andrea_Dissertation.pdf
Size:2.69Mb
Format:PDF
Description:Dissertation
This file will be freely accessible after 2026-06-25.
Abstract
English
Supine chest radiographs are among the most frequently performed imaging studies in intensive care units. This study investigates the effect of an artificial intelligence (AI)-based system on the diagnostic performance and reporting time of clinicians in an intensive care setting. A CE-certified AI system specifically trained for the interpretation of chest radiographs was used. This single-center retrospective study included a total of 520 bedside chest radiographs from adult ICU patients at a university hospital, acquired between April and May 2021. Reporting was conducted with time tracking using a structured template. Three readers with varying levels of experience evaluated each radiograph twice—once with and once without AI support—assessing the presence of specific pathological findings using a semiquantitative probability scale (0 = definitely not present to 5 = definitely present). The assessed pathologies included consolidation, pneumothorax, atelectasis, fibrosis, pneumoperitoneum, mediastinal widening, nodules, calcifications, cardiomegaly, and pleural effusion. Diagnostic performance with and without AI support was evaluated using the area under the receiver operating characteristic curve (AUROC). The reference standard was established by a board-certified thoracic radiologist with access to all available clinical information. No statistically significant reduction in reporting time was observed for any of the readers with AI assistance (p-values: doctoral student 0.10; intermediate reader 0.99; senior reader 0.72). Likewise, no consistent or significant improvement in diagnostic accuracy was demonstrated with AI support. The results of the AUROC analyses were predominantly non-significant (p-values for docotral student/intermediate/experienced reader: consolidation 0.12/0.01/0.48; pneumothorax 0.13/0.24/0.57; atelectasis 0.045/0.33/0.93; pleural effusion 0.55/0.07/0.46; fibrosis –/0.60/0.026; mediastinal widening 0.46/0.70/0.49; calcifications 0.71/0.69/0.41; cardiomegaly 0.06/0.89/0.47). The use of an AI-based system to support the interpretation of supine chest radiographs in the ICU setting did not lead to improvements in either diagnostic accuracy or reporting efficiency compared to unaided image interpretation.
Keywords: Artificial intelligence; Chest x-ray; Intensive Care Unit; Machine Learning; Computer-assisted-diagnosis; thoracic radiograhy; critical care
German
Röntgen-Thorax-Aufnahmen im Liegen gehören auf Intensivstationen zu den am häufigsten durchgeführten bildgebenden Untersuchungen. Diese Arbeit untersucht den Effekt eines KI-basierten Systems auf die diagnostische Leistung und Befundungszeit von MedizinerInnen im intensivmedizinischen Kontext. In dieser Studie wurde ein CE-zertifiziertes KI-basiertes-System verwendet, dass speziell für die Analyse von Röntgen-Thorax-Aufnahmen trainiert wurde. Für diese monozentrische retrospektive Studie wurden insgesamt 520 Röntgen-Thorax-Aufnahmen von Erwachsenen auf der Intensivstation eines Universitätsklinikums eingeschlossen, bei denen zwischen April und Mai 2021 Röntgen-Thorax-Aufnahmen am Krankenbett durchgeführt wurden. Die Befundung erfolgte unter Zeiterfassung anhand einer strukturierten Vorlage. Insgesamt drei BefunderInnen unterschiedlicher Erfahrungsstufen bewerteten die Aufnahmen einmal mit und einmal ohne KI-Unterstützung auf das Vorliegen verschiedener Krankheitsmuster anhand einer semiquantitativen Wahrscheinlichkeitsskala (0 = sicher nicht vorhanden bis 5 = sicher vorhanden). Eingeschlossene Krankheitsmuster waren Konsolidierung, Pneumothorax, Atelektase, Fibrose, Pneumoperitoneum, Mediastinale Erweiterung, Knoten, Verkalkung, Kardiomegalie und Pleuraerguss. Anhand der AUC der ROC wurde die diagnostische Leistungsfähigkeit der BefunderInnen ohne und mit KI-Unterstützung bewertet. Als Referenzdiagnose diente die Beurteilung der Aufnahmen durch einen auf Röntgen-Thorax spezialisierten Facharzt für Radiologie unter Zuhilfenahme aller klinischen Befunde der PatientInnen. Es zeigt sich bei keinem der BefunderInnen eine signifikante Reduktion der Befundungszeit durch die Unterstützung des KI-basierten-Systems (p-Werte: Doktorandin 0,10; Intermediate 0,99; erfahrener Befunder 0,72). In Bezug auf die Befundungsqualität zeigt sich kein signifikanter Effekt durch den Einsatz des KI-basierten Systems. Die Ergebnisse der durchgeführten AUROC-Analysen liegen fast ausschließlich im nicht-signifikanten Bereich (p-Werte Doktorandin /Intermediate /erfahrener Befunder: Konsolidierung 0,12/0,01/0,48; Pneumothorax 0,13/0,24/0,57; Atelektase 0,045/0,33/0,93; Pleuraerguss 0,55/0,07/0,46; Fibrose -/0,60/0,026; Mediastinale Erweiterung 0,46/0,70/0,49; Verkalkung 0,71/0,69/0,41; Kardiomegalie 0,06/0,89/0,47). Der Einsatz eines KI-basierten Systems zur Unterstützung in der Befundung von Röntgen-Thorax-Aufnahmen im Liegen auf der Intensivstation führte weder zu einer diagnostischen noch zu einer zeitlichen Verbesserung im Vergleich zur Analyse ohne KI-Unterstützung.
Schlagwörter: Künstliche Intelligenz; Maschinelles Lernen; Computergestützte Diagnose; Röntgen-Thorax; Intensivstation; Intensivmedizin; Röntgenthorax