Persönliche Gesundheit

Erste systematische überprüfung und meta-Analyse schlägt vor, die KI kann so effektiv wie Gesundheit Profis bei der Diagnose von Krankheiten

Die künstliche Intelligenz (KI) erscheint zum erkennen von Krankheiten aus der medizinischen Bildgebung mit einem ähnlichen Grad der Genauigkeit, wie im Gesundheitswesen, nach den ersten systematischer review und meta-Analyse, Synthese alle der verfügbaren Evidenz aus der wissenschaftlichen Literatur veröffentlicht in „The Lancet“ Digital Healthjournal.

Dennoch, nur wenige Untersuchungen waren von ausreichender Qualität, um in die Analyse einbezogen werden, und die Autoren warnen, dass die wahre diagnostische Leistung der KI-Technik des sogenannten deep learning—die Verwendung von algorithmen, big data und Rechenleistung zu emulieren, das menschliche lernen und Intelligenz, bleibt ungewiss, weil der Mangel an Studien, die direkt vergleichen die Leistung von Menschen und Maschinen, oder dass die Validierung der AI-Leistung in der realen klinischen Umgebungen.

„Wir prüften über 20,500 Artikel, aber weniger als 1% von diesen waren ausreichend robust in Ihrem design und Ihrer Berichterstattung, dass unabhängige Gutachter hatten hohes Vertrauen in Ihren Forderungen. Was mehr ist, nur 25 Studien validiert die AI-Modelle extern (über medizinische Bilder aus einer anderen Bevölkerung), und nur 14 Studien, die tatsächlich im Vergleich die performance von AI-und Gesundheitsberufe mit dem gleichen test-Beispiel“, erklärt Professor Alastair Denniston aus Universitätskliniken Birmingham NHS Foundation Trust, UK, wer führte die Forschung.

„Innerhalb dieser Handvoll hochwertiger Studien, fanden wir, dass die Tiefe lernen könnte in der Tat erkennen von Krankheiten, angefangen von Krebs zu Erkrankungen des Auges so genau wie der Gesundheits-Profis. Aber es ist wichtig zu beachten, dass AI nicht erheblich-führen Sie die menschliche Diagnose.“

Mit deep learning, Computer untersuchen kann Tausende von medizinischen Bildern zu identifizieren Muster der Krankheit. Dies bietet ein enormes Potenzial zur Verbesserung der Genauigkeit und Schnelligkeit der Diagnose. Berichte von deep-learning-Modelle übertrifft den Menschen bei diagnostischen Tests generiert viel Aufregung und Debatte, und mehr als 30 KI-algorithmen für das Gesundheitswesen wurden bereits genehmigt durch die US Food and Drug Administration.

Trotz des starken öffentlichen Interesses und die Kräfte des Marktes fahren die rasche Entwicklung dieser Technologien bestehen Bedenken darüber, ob Studiendesigns sind voreingenommen zugunsten des maschinellen Lernens und der Grad, zu dem die Ergebnisse sind anwendbar auf die Reale klinische Praxis.

Um weitere Belege liefern die Forscher führten eine systematische überprüfung und meta-Analyse aller Studien zum Vergleich der Leistung der deep-learning-Modelle und die Angehörigen der Gesundheitsberufe in der Erkennung von Krankheiten aus der medizinischen Bildgebung veröffentlicht zwischen Januar 2012 und Juni 2019. Sie bewertete auch die Studie-design -, reporting-und klinischen Wert.

Insgesamt 82 Artikel wurden in den systematischen review. Daten wurden analysiert, für 69 Artikel enthielt genug Daten, um zu berechnen, performance-test, genau. Die gepoolten Schätzungen von 25 Artikeln, die validiert die Ergebnisse in eine unabhängige Teilmenge der Bilder, die aufgenommen wurden in der meta-Analyse.

Analyse von Daten aus 14 Studien zum Vergleich der Leistung der tiefen Lernens mit Menschen in der gleichen Probe gefunden, die am besten deep-learning-algorithmen kann richtig erkennen, die Krankheit in 87% der Fälle, im Vergleich zu 86% erreicht health-care-professionals.

Die Fähigkeit, genau zu ausschließen, Patienten, die nicht über Krankheit war auch ähnlich wie für deep-learning-algorithmen (93% Spezifität) im Vergleich zu Beschäftigten im Gesundheitswesen (91%).

Wichtig ist, die Autoren merken an, dass einige Einschränkungen in der Methodik und Berichterstattung von AI-diagnostische Studien in die Analyse einbezogen. Tiefe lernen wurde Häufig bewertet, in isolation, in einer Weise, spiegelt nicht die klinische Praxis. Zum Beispiel, nur vier Studien, die Gesundheits-Profis mit zusätzlichen klinischen Informationen, die Sie normalerweise verwenden, um eine Diagnose in der klinischen Praxis. Darüber hinaus nur wenige prospektive Studien wurden durchgeführt in realen klinischen Umgebungen, und die Autoren sagen, dass, um zu bestimmen, die diagnostische Genauigkeit erfordert hochwertige Vergleiche bei Patienten, die nicht nur datasets. Schlechte Berichterstattung war auch üblich, mit den meisten Studien nicht berichtet, fehlen Daten, welche Grenzen die Schlussfolgerungen, die gezogen werden kann.

„Es gibt eine inhärente Spannung zwischen dem Wunsch, neue, potenziell lebensrettende Diagnose und der Imperativ zur Entwicklung hochwertiger Beweise in einer Weise, die profitieren Patienten und die Gesundheitssysteme in der klinischen Praxis“, sagt Dr. Xiaoxuan Liu von der University of Birmingham, UK. „Die entscheidende Erkenntnis aus unserer Arbeit ist, dass in der AI—wie bei jedem anderen Teil der healthcare—gutes design der Studie Fragen. Ohne Sie kann man leicht Voreingenommenheit, die verzerrt die Ergebnisse. Diese Vorurteile können dazu führen, übertriebene Behauptungen, dass eine gute Leistung für die KI-Werkzeuge, die nicht übersetzen, in der realen Welt. Gutes design und Berichterstattung dieser Studien ist ein wichtiger Teil der sichergestellt wird, dass die AI-Interventionen, die über den Patienten sicher und wirksam sind.“

„Beweise, wie KI-algorithmen ändern wird das Ergebnis für den Patienten kommen muss, aus dem Vergleich mit alternativen Diagnose-tests im randomisierten kontrollierten Studien,“ fügt Dr. Livia Faes vom Moorfields Eye Hospital, London. „Bisher gibt es kaum solche Studien, in denen diagnostische Entscheidungen ein KI-Algorithmus auf sich einwirken lassen um zu sehen, was dann passiert, um die Ergebnisse, die wirklich wichtig für die Patienten, wie rechtzeitige Behandlung, Zeit der Entlassung aus dem Krankenhaus, oder sogar überlebensraten.“