Introduzione
In questo lavoro viene toccato un tema molto attuale della nostra società, ovvero l’impiego dell’intelligenza artificiale nelle attività scientifiche al fine di fornire un ausilio per l’uomo e non un sostituto dello stesso. Gli autori partono dal seguente presupposto: l’intelligenza artificiale può ridurre il tempo impiegato dai medici nelle valutazioni radiologiche. Per i linfomi avidi di 18F-fluorodesossiglucosio (18F-FDG), l'ottenimento di una risposta metabolica completa (CMR) alla fine del trattamento ha un valore prognostico, oltre che di puntuale definizione dell’efficacia.
Metodi
In questo lavoro viene presentato un algoritmo basato sul deep learning per valutazioni della risposta al trattamento completamente automatizzate secondo la classificazione di Lugano 2014. Il metodo, proposto in quattro fasi, formato su uno studio clinico multinazionale (numero identificativo ClinicalTrials.gov, NCT01287741) e testato in tre set di test multicentrici e multinazionali indipendenti su diversi sottotipi di linfoma non-Hodgkin e diverse linee di trattamento (numeri identificativi ClinicalTrials.gov NCT02257567, NCT02500407; 20% di controllo nel numero identificativo ClinicalTrials.gov, NCT01287741), restituisce le lesioni rilevate al basale e al follow-up per consentire una revisione mirata del radiologo.
Risultati
La valutazione della risposta del metodo raggiungeva un elevato grado di accordo con le risposte radiologiche assegnate con metodologia tradizionale, (ad esempio, un grado di accordo per la valutazione della risposta complessiva del 93, 87 e 85% nei numeri identificativi ClinicalTrials.gov NCT01287741, NCT02500407 e NCT02257567, rispettivamente) simile all'accordo interradiologico ed era fortemente prognostica degli esiti, con una tendenza verso una maggiore accuratezza per il rischio di morte rispetto alle risposte radiologiche assegnate con metodologia tradizionale (hazard ratio per CMR per modello di fine trattamento pari a 0,123, 0,054 e 0,205 nei numeri identificativi ClinicalTrials.gov NCT01287741, NCT02500407 e NCT02257567 in confronto, rispettivamente, a 0,226, 0,292 e 0,272 per CMR dalle risposte assegnate con metodologia tradizionale). Inoltre, veniva condotta una revisione radiologica delle valutazioni dell'algoritmo. Il tempo medio di revisione del radiologo era di 1,38 minuti/valutazione e non si osservavano differenze statisticamente significative nel livello di accordo del radiologo con la risposta del modello rispetto al livello di accordo del radiologo con le risposte assegnate con metodologia tradizionale.
Conclusioni
Questi risultati suggeriscono che il metodo proposto può essere incorporato nei flussi di lavoro di valutazione della risposta radiologica nell’imaging delle patologie oncologiche, per un notevole risparmio di tempo e con prestazioni simili a quelle di esperti medici qualificati.