La collaborazione tra medici e software AI può portare a diagnosi più accurate

Software AI e medici per diagnosi accurateUno studio pubblicato su “JAMA Network Open” ha analizzato l’efficacia dell’intelligenza artificiale nelle diagnosi mediche, confrontando le prestazioni di ChatGPT-4 con quelle dei medici in carne e ossa.

La ricerca ha coinvolto 50 professionisti tra specializzandi e strutturati di vari ospedali americani, rilevando che il chatbot ha ottenuto risultati migliori rispetto ai medici. 
ChatGPT-4 ha raggiunto un’accuratezza diagnostica del 90% nell’analisi di casi clinici, mentre i medici supportati dall’IA hanno ottenuto il 76%, e quelli che hanno operato senza assistenza il 74%.

La sperimentazione è stata condotta su sei casi clinici reali, mai pubblicati in precedenza, per garantire che l’IA non fosse stata addestrata su quei dati specifici.

Tuttavia, l’integrazione dell’IA nella pratica medica ha mostrato alcune criticità. Molti medici hanno dimostrato resistenza ad accettare diagnosi discordanti dalle loro, e la maggior parte non ha sfruttato pienamente le potenzialità del chatbot.

Il dottor Adam Rodman, esperto di medicina interna, sottolinea che l’IA dovrebbe essere utilizzata come un’estensione del medico, offrendo un supporto diagnostico aggiuntivo. Tuttavia, affinché ciò avvenga, è necessaria una formazione specifica sull’uso dell’intelligenza artificiale in ambito sanitario.
Un aspetto rilevante emerso dallo studio è che pochi medici hanno compreso che era possibile fornire all’IA l’intera storia clinica per ottenere diagnosi più articolate.
La maggioranza ha utilizzato ChatGPT-4 come un semplice motore di ricerca, limitandone l’efficacia.
I medici partecipanti allo studio non avevano infatti ricevuto, volutamente, una formazione preliminare su come interagire efficacemente con il chatbot.
Dunque, per migliorare l’integrazione dell’IA in medicina, sarà necessario un percorso di alfabetizzazione digitale, affinché gli utenti, e in particolare i medici, possano sfruttarne appieno le potenzialità.

Large Language Model Influence on Diagnostic Reasoning - A Randomized Clinical Trial