Press "Enter" to skip to content

Applicazioni per smartphone basate su algoritmi per valutare il rischio di cancro della pelle negli adulti: revisione sistematica degli studi di accuratezza diagnostica

Introduzione

Il cancro della pelle è uno dei tumori più comuni al mondo e l’incidenza è in aumento.1 Nel 2003, l’Organizzazione Mondiale della Sanità ha stimato che ogni anno a livello mondiale si verificano tra i due e i tre milioni di tumori della pelle, di cui l’80% è un carcinoma basocellulare, il 16% un carcinoma squamocellulare cutaneo e il 4% un melanoma (circa 130.000 tumori).2 Nel 2018, le stime sono salite a 287-723 nuovi melanomi in tutto il mondo.1 Nonostante la sua minore incidenza, il potenziale di metastatizzazione del melanoma in altre parti del corpo significa che è responsabile fino al 75% dei decessi per cancro della pelle.3 La sopravvivenza a cinque anni può raggiungere il 91-95% per il melanoma se viene identificato precocemente,4 il che rende la diagnosi precoce e il trattamento fondamentali per migliorare la sopravvivenza. Il carcinoma squamocellulare cutaneo ha un rischio minore di diffusione metastatica.56 Il carcinoma squamocellulare cutaneo e il carcinoma basocellulare sono localmente invasivi con risultati migliori se trattati in uno stadio precoce. Sono disponibili diverse tecnologie diagnostiche per aiutare i medici generici e i dermatologi a identificare accuratamente i melanomi riducendo al minimo i ritardi nella diagnosi.78 Il successo di queste tecnologie dipende dalle persone con lesioni cutanee nuove o mutevoli che cercano una consulenza precoce da parte di professionisti del settore medico. Sono necessari interventi efficaci che guidino le persone a cercare una valutazione medica appropriata.

Le applicazioni per smartphone per il cancro della pelle (“app”) forniscono un approccio tecnologico per aiutare le persone con lesioni sospette a decidere se devono richiedere ulteriori cure mediche. Con i moderni smartphone in grado di catturare immagini di alta qualità, sono state sviluppate numerose applicazioni “skin” con una serie di usi diversi.9 Queste app per la pelle possono fornire una risorsa di informazioni, assistere nell’autoesame della pelle, monitorare le condizioni della pelle e fornire consigli o indicazioni su come richiedere assistenza medica.1011 Tra il 2014 e il 2017 sono state identificate 235 nuove app per smartphone dermatologici.12

Alcune applicazioni per il cancro della pelle funzionano inviando immagini dalla fotocamera dello smartphone a un professionista esperto per la revisione, che è essenzialmente una diagnosi teledermatologica basata su immagini. Tuttavia, di crescente interesse sono le app per smartphone che utilizzano algoritmi integrati (o “intelligenza artificiale”) che catalogano e classificano le immagini delle lesioni ad alto o basso rischio di cancro della pelle (solitamente melanoma). Queste applicazioni restituiscono all’utente una valutazione immediata del rischio e una successiva raccomandazione. Le applicazioni con algoritmi incorporati che fanno una dichiarazione medica sono ora classificati come dispositivi medici che richiedono l’approvazione normativa.1314Queste applicazioni potrebbero essere dannose se le raccomandazioni sono errate, in particolare se le false rassicurazioni portano a ritardi nell’ottenere una valutazione medica. Il marchio CE (Conformit Europenne) è stato applicato per consentire la distribuzione di due app basate su algoritmi inEuropa1516 ,una delle quali è disponibile anche in Australia e Nuova Zelanda.16 Tuttavia, attualmente nessuna applicazione ha l’approvazione della Food and Drug Administration (FDA) degli Stati Uniti per consentirne la distribuzione negli Stati Uniti e in Canada. Inoltre, la Commissione Federale Americana per il Commercio ha multato i venditori di due app (MelApp17 e Mole Detective18) per “aver ingannevolmente rivendicato il rischio di melanoma accuratamente analizzato”.

Queste differenze nell’approvazione regolamentare e le false richieste di prova sollevano dubbi sulla portata e la validità della base di prova che supporta le app con algoritmi incorporati. Una precedente revisione sistematica con una data di ricerca del dicembre 2016 ha esaminato l’accuratezza delle applicazioni sanitarie mobili per condizioni multiple. Questa revisione ha identificato sei studi che riportavano la diagnosi di melanoma, ma l’accuratezza sembra essere stata sopravvalutata perché includeva risultati sia di studi di sviluppo che di validazione.9 Nella nostra revisione, puntiamo a riportare l’ambito, i risultati e la validità delle prove in studi che esaminano l’accuratezza di tutte le app che utilizzano algoritmi integrati per identificare il cancro della pelle negli utenti di smartphone.19

Metodi

Questa revisione amplia e aggiorna la nostra revisione sistematica delle applicazioni per smartphone19 (che si limitava alla diagnosi del melanoma). Abbiamo condotto la nostra revisione secondo i metodi descritti nel Cochrane Handbook for Systematic Reviews of Diagnostic Test Accuracy20 e riportiamo i nostri risultati secondo l’estensione Preferred Reporting Items for Systematic Reviews and Meta-Analyses (PRISMA) per le raccomandazioni relative alla dichiarazione sulla precisione dei test diagnostici.21

Fonti di dati

Abbiamo condotto ricerche nella letteratura per la nostra recensione originale Cochrane dall’inizio delle banche dati fino all’agosto 2016.19 Per questa recensione, abbiamo effettuato una ricerca aggiornata degli studi pubblicati tra l’agosto 2016 e il 10 aprile 2019. I database ricercati sono stati il Cochrane Central Register of Controlled Trials, MEDLINE, Embase, CINAHL, CPCI, Zetoc, Science Citation Index, US National Institutes of Health Ongoing Trials Register, NIHR Clinical Research Network Portfolio Portfolio Database, e la World Health Organization International Clinical Trials Registry Platform. L’appendice 1 supplementare online presenta le strategie di ricerca complete. Non abbiamo applicato alcuna restrizione linguistica. Le liste di riferimento delle revisioni sistematiche e i rapporti degli studi inclusi sono stati vagliati per ulteriori studi rilevanti.

Selezione dello studio

Due revisori hanno vagliato in modo indipendente i titoli e gli abstract di tutti i record recuperati e, successivamente, tutte le pubblicazioni a testo completo. Le discrepanze sono state risolte tramite consenso o discussione con un terzo revisore. Gli studi di qualsiasi progetto che valutava le applicazioni per smartphone basate su algoritmi o “intelligenza artificiale” che utilizzavano fotografie (cioè immagini macroscopiche) di lesioni cutanee potenzialmente maligne erano ammissibili all’inclusione se fornivano una tabulazione incrociata del rischio di cancro della pelle rispetto a una diagnosi standard di riferimento. Gli standard di riferimento erano la diagnosi istologica con o senza follow-up di presunte lesioni benigne (stima dell’accuratezza diagnostica), o la raccomandazione di esperti per ulteriori indagini o interventi (ad esempio, escissione, biopsia o valutazione di esperti). Gli studi che hanno utilizzato un accessorio di ingrandimento per smartphone sono stati esclusi in base al fatto che tali accessori sono relativamente rari tra gli utenti di smartphone e sono più spesso utilizzati nelle popolazioni ad alto rischio per il monitoraggio delle lesioni. Gli studi che hanno sviluppato nuove app sono stati esclusi a meno che non sia stato utilizzato un “test set” indipendente separato di immagini per valutare il nuovo approccio. Gli abstract delle conferenze sono stati esclusi a meno che non sia stato possibile identificare i testi completi associati. L’appendice supplementare online 2 presenta un elenco di studi esclusi con i motivi dell’esclusione. Abbiamo contattato gli autori degli studi ammissibili quando hanno presentato dati insufficienti per consentire la costruzione di 2×2 tabelle di contingenza o per informazioni di supporto non riportate nella pubblicazione.

Raccolta dati, valutazione della qualità e analisi

Due autori hanno estratto i dati in modo indipendente utilizzando un modulo di estrazione dati prestabilito e hanno valutato la qualità dello studio. Per la precisione diagnostica, ogni studio avrebbe dovuto idealmente reclutare in prospettiva un campione rappresentativo di pazienti che utilizzavano l’applicazione sul proprio dispositivo smartphone per valutare le lesioni che destavano preoccupazione. La verifica dei risultati (in cieco rispetto ai risultati dell’app), per determinare se ogni lesione valutata fosse o meno un tumore della pelle, sarebbe stata condotta utilizzando la valutazione istologica (se eliminata) o il follow-up (se non eliminata). Per la verifica con le raccomandazioni degli esperti, tutte le lesioni valutate dall’app sarebbero state rivalutate di persona da un dermatologo esperto. I dati verrebbero riportati per tutte le lesioni, comprese quelle per le quali l’app non ha fornito una valutazione. Questi aspetti della qualità dello studio sono stati valutati utilizzando lo strumento Quality Assessment of Diagnostic Accuracy Studies 2 (QUADAS-222; appendice 3 supplementare online). Eventuali disaccordi sono stati risolti per consenso.

Abbiamo tracciato le stime di sensibilità e specificità di ogni studio su appezzamenti forestali accoppiati per ogni variazione di ogni app. Le raccomandazioni delle app associate al rischio di melanoma per le diverse app sono state tabulate(tabella 1). Quando le app hanno riportato tre categorie di rischio (alto, moderato, basso rischio), abbiamo utilizzato le raccomandazioni fornite da ciascuna app per decidere se i risultati a rischio moderato della app dovessero essere combinati con risultati a basso o alto rischio per la stima dell’accuratezza del test. In caso di ambiguità, entrambe le opzioni sono state perseguite. A causa della scarsità di dati e della scarsa qualità degli studi, non abbiamo effettuato una meta-analisi. Le parcelle forestali sono state prodotte utilizzando RevMan 5.3 (Nordic Cochrane Centre). Presentiamo i dati per ogni lesione.

App Piattaforma; disponibilità delle app Basso rischio Rischio moderato Alto rischio Confronto
Applicazioni attualmente disponibili
skinScan* iOS; Europa (marchio CE), Australia e Nuova Zelanda “Tipico” “Atipico
SkinVision† con o senza questionario iOS, Android; Europa (marchio CE) “Non c’è molto di cui preoccuparsi”; monitorare eventuali cambiamenti “Un po’ di crescita caotica”; consultare un medico “Crescita anomala”; consultare un medico il prima possibile H v M/LH/M v L
App con disponibilità incerta (url non accessibili)
Dr Mole‡§ Android/Amazon; app aggiornata l’ultima volta il 2 agosto 201*¶ Nessuna azione specifica consigliata Consultare uno specialista Consultare immediatamente uno specialista H/M v L
SpotMole‡ Android; app aggiornata l’ultima volta il 30 marzo 2016** Va bene; consultare un medico se ancora preoccupato “Problematico”; consultare il medico H v L
App ritirate dal mercato
MelApp‡ iOS, Android Basso Medio Alto H v M/LH/M v L
Detective Talpa‡ iOS, Android Monitor; non è necessaria alcuna consultazione “Sintomi del melanoma”; monitorare e programmare l’appuntamento annuale di dermatologia “Diversi sintomi del melanoma”; consultare il dermatologo H v M/LH/M v L
**.Riepilogo delle raccomandazioni per lesioni a basso, moderato e alto rischio con le applicazioni basate su algoritmi nominativi identificate da questa recensione

Coinvolgimento del paziente e del pubblico

Il protocollo per la revisione1925 è stato sviluppato e scritto con il contributo di due coautori con esperienza vissuta di cancro della pelle per assicurare che si tenesse in debita considerazione il paziente e la prospettiva pubblica.

Risultati

Selezione dello studio

La ricerca ha individuato 418 record unici di cui 64 sono stati selezionati per la valutazione del testo completo insieme a 16 studi individuati per la revisione originale (vedi fig. 1 supplementare online per il diagramma di flusso completo di PRISMA). Abbiamo contattato gli autori corrispondenti per ulteriori informazioni su tre studi. Sono state ricevute risposte da due autori e uno di essi ha fornito ulteriori informazioni rilevanti. Abbiamo escluso più di un terzo degli studi (30/80, 37,5%) sulla base del test dell’indice. I motivi dell’esclusione sono da ricondurre al fatto che gli studi non hanno valutato gli smartphone o le app per smartphone (n=18); si trattava di studi di sviluppo senza una convalida indipendente (n=6); hanno utilizzato allegati ingrandenti alla fotocamera del telefono (n=3); hanno operato su una base di teledermatologia di negozio e di inoltro (n=2); oppure sono stati utilizzati per il monitoraggio delle lesioni (n=1). Due studi2627 hanno duplicato i dati inclusi in altri studi.2829La figura supplementare e l’appendice 2 supplementare online documentano gli altri motivi di esclusione.

Caratteristiche degli studi inclusi

Nove studi (9/80, 11,3%) hanno soddisfatto i criteri di ammissibilità.23242829293031323334Sei studi (comprese 725 lesioni cutanee) hanno valutato l’accuratezza diagnostica delle app per smartphone per la stratificazione del rischio di lesioni cutanee sospette, confrontando i livelli di rischio delle app con una diagnosi istopatologica standard di riferimento (alcuni hanno incorporato la diagnosi faccia a faccia di esperti clinici per alcune lesioni).232831323334Cinque dei sei studi miravano a rilevare solo il melanoma e uno33 mirava a distinguere tra lesioni maligne (compreso il melanoma, il carcinoma a cellule basali e il carcinoma a cellule squamose) o premaligne e lesioni benigne. Tre studi (con 407 lesioni) hanno verificato le raccomandazioni dell’app per smartphone rispetto a uno standard di riferimento di raccomandazioni di esperti per ulteriori indagini o interventi (identificazione di una lesione come maligna o premaligna,30 istologia richiesta o meno,29 o una consultazione faccia a faccia richiesta o meno24).

Gli studi hanno valutato sei diverse applicazioni denominate. La tabella 1 riassume queste applicazioni secondo la disponibilità attuale. L’applicazione denominata SkinScan in Chadwick 201423 è un predecessore di SkinVision e non l’applicazione TeleSkin skinScan con marchio CE. Attualmente sono disponibili solo le app TeleSkin skinScan e SkinVision; MelApp e Mole Detective sono state ritirate dal mercato dopo le indagini dell’American Federal Trade Commission1718 e Dr. Mole e Spotmole sembrano non essere più disponibili. Due studi hanno valutato una31 e tre34 app senza rivelarne il nome.

Latabella 2 e la tabella 3 riassumono le caratteristiche degli studi inclusi. Le dimensioni del campione variavano da 1523 a 199 lesioni,30 con un massimo del 45%30 delle immagini delle lesioni riportate come non valutabili. Dopo le esclusioni, il numero medio di lesioni incluse era di 91 (mediana 108). Tre studi hanno riportato tra cinque30 e102324tentativi di ottenere un’immagine adeguata per ogni lesione e uno studio28 ha analizzato un minimo di tre immagini per ogni lesione. Due studi hanno incluso qualsiasi tipo di lesione cutanea,3033e tutti gli altri studi hanno limitato l’inclusione alle sole lesioni pigmentate o melanocitarie.

Studio, paese Applicazioni Numero di pazienti, lesioni Criteri di inclusione Criteri di esclusione Raccolta dati Scelta delle lesioni, acquisizione di immagini Norma di riferimento, condizione obiettivo N. di esclusioni (%) N. di tumori/totale analizzato, % (diagnosi finale)
Chadwick (2014),23 Australia SkinScan, Mel App, Detective Talpa, Spot Mole Plus, Dr. Mole Premium NR, 15 Immagini di lesioni melanocitarie asportate con diagnosi istopatologica “Incapace di analizzare” lesioni dopo 10 tentativi Retrospettiva (interpretazione prospettica) Clinico, clinico, clinico Istopatologia (no FU), melanoma v nevo benigno Immagini inestimabili escluse a priori NR 5/15, 33,3% (5 MM o MiS, 10 BN)
Dorairaj (2017),31 Irlanda App (non nominata*) 32, 32 Pazienti refertati per l’escissione di lesioni pigmentate NR Prospettiva NR, medico Istopatologia (no FU), melanoma v nevo displastico o benigno Immagini inestimabili 6 (19%) 9/26, 35% (9 MM o MiS, diagnosi benigna NR)
Maier (2015),28 Germania SkinVision (versione originale) NR, 195‡ Pazienti con lesioni cutanee melanocitarie viste di routine per lo screening del cancro della pelle presso il reparto di dermatologia Immagine di scarsa qualità dell’indice di prova; altri elementi dell’immagine, ad esempio, capelli, immagini contenenti più di una lesione, lesioni incomplete, lesioni non melanocitiche, casi con due punti di differenza, casi di cravatta Prospettiva Clinico, clinico, clinico Istopatologia (no FU), melanoma v non melanoma Immagini non valutabili 20 (10%); casi di “cravatta” 18 (9%); due punti di differenza 13 (7%) 26/144, 18,1% (26 MM o MiS, 34 DN, 84 BN)
Robson (2012),32Regno Unito MelApp 31, 35 Pazienti con lesioni cutanee pigmentate riferite da medici di medicina generale a una clinica oncologica urgente NR Prospettiva NR, medico Istopatologia (49%) o valutazione clinica (no FU), melanoma v non melanoma Immagini inestimabili 14 (40%) 2/21, 9,5% (istologia: 2 MM, 4 BN, 2 DN, 1 nevo blu, 2 SK; clinicamente benigno 10)
Thissen (2017),33 Paesi Bassi SkinVision (originale e rev±qu) 256, 341§ Pazienti con lesioni cutanee pigmentate o non pigmentate viste di routine nel reparto di dermatologia NR Prospettiva Clinico, clinico, clinico Istopatologia (38%) o valutazione clinica (nessuna FU), maligna o premaligna v benigna Nessuno escluso a causa della qualità per imitare l’uso del mondo reale 35/108, 32,4% (maligno o premaligno: 2 MM, 1 MiS, 16 BCC, 3 cSCC, 5 BD, 8 AK, tutti con istologia ad eccezione di 2 BCC e 3 AK; benigno: 9 SK, 12 BN, 1 DN, 7 SL, 3 LPLK, 41 altri benigni¶)
Wolf (2013),34StatiUniti 3 Applicazioni (non nominate) NR, 188 Immagini di lesioni cutanee pigmentate con una chiara diagnosi istologica valutata da un dermatologo certificato dalla commissione Lesioni “difficili da diagnosticare”, lesioni con diagnosi equivoca, tipi di lesioni specifiche, ad esempio, SN o naevi atipiche (di grado elevato moderato), immagini con caratteristiche identificabili Retrospettiva (interpretazione prospettica) Clinico, clinico, clinico Istopatologia (no FU), melanoma v lesioni benigne Immagini non valutabili app 1: 6 (3%); app 2: 3 (2%); app 3: 17 (9%); più la scarsa qualità esclusa a priori 60/188, 31,9% (44 MM, 16 MiS, 94 BN, 20 SK, 8 SL, 2 hemangiona 2, 4 DF)
¶.Caratteristiche degli studi che hanno riportato l’accuratezza diagnostica delle applicazioni per smartphone verificate mediante istologia con o senza follow-up
Studio, paese Applicazioni Numero di pazienti, lesioni Criteri di inclusione Criteri di esclusione Raccolta dati Scelta delle lesioni, acquisizione di immagini Norma di riferimento, condizione obiettivo N. di esclusioni (%) N. di tumori/totale analizzato, % (diagnosi finale)
Chung (2018),30 Paesi Bassi SkinVision (versione NR) 125, 199 Visitatori della Giornata nazionale del cancro della pelle (fino a 2 lesioni selezionate per la valutazione da parte dei partecipanti) NR Prospettiva Paziente, medico Valutazione da parte di esperti (sembra essere faccia a faccia), maligno o premaligno v benigno Immagini inestimabili 90 (45%)* 9/109, 8,3% (diagnosi finale NR; diagnosi esperte: 6 BCC, 1 BD, 1 AK, 1 angioma più 54 BN, 7 BN atipici, 21 SK, 8 SL, 7 DF, 3 altri BN)
Nabil (2017),29 Paesi Bassi SkinVision (versione NR) NR, 151 Nuovi pazienti indirizzati dal medico di famiglia alla clinica delle lesioni pigmentate (fino a 2 lesioni selezionate per la valutazione da parte dei partecipanti) NR Prospettiva Paziente, medico Valutazione da parte di esperti in un consulto faccia a faccia, istopatologia garantita v non istopatologia Non sono state riportate immagini di valore inestimabile 8/151, 5,3% (diagnosi finale NR; diagnosi esperte ottenute dall’autore: 5 MM, 3 BCC, 3 AK, 3 DF, 17 DN, 86 BN, 3 angioma, 4 SL, 2 nevo blu, 1 SN, 1 comedo gigante)
Ngoo (2018),24 Australia SkinVision (versione NR), SpotMole, Dr. Mole 30, 57 Elenco chirurgico dei pazienti con lesioni pigmentate in programma per l’escissione, partecipanti allo studio di morfologia del nevo Lesioni su superfici cutanee non tipiche, scarsa qualità dell’immagine, lesioni cheratinocitarie Prospettiva Clinico, clinico, clinico Valutazione da parte di esperti di immagini dermoscopiche e cliniche, la lesione garantisce la consultazione in persona v benigna Immagini di scarsa qualità escluse a priori 4/38 (11%), più 3 partecipanti con lesioni non ammissibili e 1 senza escissione; immagini non valutabili: SkinVision iOS 8 (14%), SkinVision Android 10 (18%)†. 42/57, 73,7% (l’esperto diagnostica NR; l’istologia ha riportato 1 MIS)
†.Caratteristiche degli studi che hanno riportato l’accuratezza delle app per smartphone verificate da raccomandazioni di esperti per ulteriori indagini o interventi

Valutazione della validità e dell’applicabilità delle prove utilizzando QUADAS-2

Solo quattro studi28313334 hanno reclutato un campione consecutivo di partecipanti allo studio o lesioni. Il processo di selezione delle lesioni era altrimenti poco chiaro293032 o è stato utilizzato un campionamento per convenienza.2324Uno studio prospettico ha reclutato pazienti della popolazione generale che hanno partecipato a una giornata nazionale sul cancro della pelle tenutasi in tre centri medici universitari30 ; uno ha reclutato pazienti che hanno partecipato a screening di follow-up28 ; e sette hanno reclutato solo pazienti selezionati per l’escissione di lesioni sospette o per la valutazione di problemi cutanei da parte di dermatologi.23242931323334Solo due studi hanno incluso lesioni cutanee selezionate dai partecipanti allo studio (fino a due per ogni partecipante)2930; due non hanno riportato la selezione delle lesioni3132; e in cinque.2324283334il clinico ha effettuato la selezione delle lesioni. Solo due studi sono stati valutati a basso rischio di pregiudizio per la selezione dei pazienti, e in otto dei nove studi, la selezione delle lesioni cutanee da valutare non rifletteva le lesioni che sarebbero state valutate nella popolazione che avrebbe potuto utilizzare le applicazioni per smartphone(fig 1).

Fig 1.Panoramica del rischio di distorsione e dei problemi di applicabilità degli studi inclusi

Abbiamo avuto forti (otto su nove) o non chiare (una su nove) preoccupazioni circa l’applicazione del test dell’indice. In sette studi2428292930313233 i ricercatori, piuttosto che i partecipanti allo studio, hanno utilizzato l’app per fotografare le lesioni. Due studi hanno utilizzato immagini acquisite in precedenza di lesioni escoriate ottenute da database dermatologici,2334che hanno sollevato dubbi sul fatto che i risultati degli studi non fossero rappresentativi dell’uso nella vita reale. La qualità delle immagini era probabilmente superiore a quella della vita reale per due motivi: le immagini archiviate sono state scelte sulla base della qualità dell’immagine; oppure un clinico o un ricercatore ha acquisito immagini prospetticamente acquisite utilizzando un protocollo standard in condizioni ottimizzate e utilizzando una singola fotocamera per smartphone piuttosto che i partecipanti utilizzando i propri dispositivi individuali. Gli studi hanno ridotto il numero di immagini non valutabili tentando di presentare fino a 10 immagini per ogni lesione. Uno studio ha preso in considerazione i risultati di un minimo di tre immagini per ogni lesione nella valutazione finale del rischio.28

La maggior parte degli studi di accuratezza diagnostica (n=5) mirava a differenziare tra melanomi e lesioni benigne2328313234; uno studio33 includeva come condizione target altri tipi di cancro della pelle e lesioni premaligne. Il rischio di distorsione per lo standard di riferimento era basso solo in due studi.2334Cinque studi hanno utilizzato la diagnosi di esperti per confermare la diagnosi finale per almeno alcune lesioni, senza alcuna conferma da parte dello standard di riferimento preferito per l’istopatologia o il follow-up delle lesioni.2429303233Inoltre in cinque studi non era chiaro se la diagnosi finale fosse stata fatta senza alcuna conoscenza del risultato dell’applicazione.28
29
31
32
33

L’esclusione di immagini non valutabili per le quali l’app non ha potuto restituire una valutazione del rischio potrebbe aver sistematicamente gonfiato le prestazioni diagnostiche delle app testate in sei dei nove articoli.242830313234Quattro studi hanno riportato criteri di esclusione,23242834che includevano condizioni difficili da diagnosticare, scarsa qualità delle immagini e risultati inequivocabili ottenuti dalle app. Ad esempio, Maier e colleghi28 hanno valutato un minimo di tre immagini per ogni lesione. Hanno escluso le lesioni con immagini della stessa lesione che rientrano in categorie ad alto e basso rischio, e legano i casi, quando le tre immagini di una singola lesione sono classificate a diversi livelli di rischio (alto, medio e basso rischio).

Fig. 1.Fig. 1. Panoramica del rischio di distorsione e dei problemi di applicabilità degli studi inclusi

Sintesi dello studio: fonti di variabilità delle prestazioni del test

Tutte le applicazioni identificabili, tranne due, riportano le raccomandazioni relative alle lesioni come ad alto, moderato o basso rischio(tabella 1); SpotMole e skinScan non presentano un risultato di rischio moderato. Non siamo stati in grado di identificare l’azione raccomandata per un risultato ad alto rischio da MelApp e abbiamo ipotizzato che, come per altre app, gli utenti avrebbero (si raccomanda di) consultare un medico. Per le lesioni a rischio moderato, una app raccomanda il monitoraggio delle lesioni (Mole Detective) e due raccomandano di consultare un medico (SkinVision e Dr Mole), anche se con meno urgenza di quanto implicito per un risultato ad alto rischio.

Tra le altre fonti di variabilità vi sono le diverse definizioni della condizione target (qualsiasi lesione maligna o premaligna in unostudio33 e melanoma solo in cinque studi); diverse versioni di app (adattamenti per migliorare le prestazioni delle app per lesioni non pigmentate e app per diverse piattaforme di telefonia mobile); considerazione dei risultati di un breve questionario utente; e modalità di caricamento delle immagini (direttamente nell’app v indirettamente dalla memoria interna del telefono).

Test delle prestazioni delle app per il cancro della pelle basate su algoritmi

La Figura 2 presenta i risultati delle app attualmente disponibili per ogni lesione. Non è stato trovato alcuno studio peer reviewed pubblicato che valutasse l’applicazione TeleSkin skinScan. L’app SkinScan, che ha preceduto SkinVision, è stata valutata in un unico studio su sole 15 lesioni (cinque melanomi).23 La sensibilità era bassa indipendentemente dal fatto che il rischio moderato fosse combinato con la categoria a basso o alto rischio (0% o 20% rispettivamente), con corrispondenti specificità del 100% e del 60%(fig. 2). Quando solo i risultati ad alto rischio sono stati considerati positivi al test, l’applicazione originale di SkinVision ha dimostrato una sensibilità del 73% (intervallo di confidenza del 95% dal 52% all’88%) in uno studio di lesioni pigmentate (n=144, 26 melanomi)28; tuttavia, la sensibilità era solo del 26% (dal 12% al 43%) se applicata a lesioni pigmentate e non pigmentate (n=108, 35 lesioni maligne o premaligne).33 L’applicazione ha rilevato correttamente solo uno dei tre melanomi ad alto rischio.33 Le specificità corrispondenti erano dell’83% e del 75%(fig. 2). Una successiva revisione dell’app per tener conto delle lesioni non pigmentate ha portato ad un aumento di 15 punti percentuali della sensibilità per il rilevamento del melanoma quando applicata al dataset originale della lesione pigmentata (88%, 95% intervallo di confidenza dal 70% al 98%); tuttavia, la specificità è scesa di 3 punti percentuali (79%, dal 70% all’86%).33 Inoltre, la sensibilità per il rilevamento di lesioni maligne o premaligne è aumentata di 45 punti percentuali quando applicata al dataset di lesioni pigmentate e non pigmentate (71%, dal 54% all’85%), ma la specificità è diminuita di 19 punti percentuali (56%, dal 44% al 68%).33 Quando sono state incluse le risposte dei partecipanti alle domande in-app sulle caratteristiche e i sintomi della lesione, la sensibilità è aumentata ulteriormente all’80% (63%-92%) e la specificità al 78% (67%-87%).33

Fig. 2.Stime di sensibilità e specificità delle parcelle forestali per gli studi delle applicazioni basate su algoritmi attualmente disponibili. L’applicazione Chadwick 2014 SkinScan è un predecessore di SkinVision e non è collegata all’applicazione TeleSkin skinScan con marchio CE. I dati vengono presentati quando solo i risultati ad alto rischio sono stati considerati positivi al test, o quando i risultati ad alto e moderato rischio sono stati considerati positivi al test. Immagini non valutabili: Chadwick 2014: escluso a priori; Chung 2018: 90; Maier 2015: 20; Nabil 2017: non riportato; Ngoo 2018a: 10; Ngoo 2018b: 8; Thissen 2017: 0. FN=numero di persone con un falso risultato negativo; FP=numero di persone con un falso risultato positivo; H=alto rischio; L=basso rischio; M= moderato rischio; rev=rivisto (versione dell’app); rev+qu=rivisto (versione dell’app) più le risposte dei partecipanti alle domande sulla loro lesione cutanea; TN=numero di persone con un vero risultato negativo; TP=numero di persone con un vero risultato positivo. *iOS; †piattaforma mobile non segnalata; ‡Android

Quando l’interpretazione di SkinVision è stata variata per considerare risultati elevati e moderati dell’app come positivi al test, la sensibilità è aumentata (tra 17 e 57 punti percentuali) ma con un costo considerevole per la specificità (diminuendo di 11-45 punti percentuali).33

Tre studi hanno valutato l’applicazione SkinVision.242930L’app è stata verificata sulla base delle raccomandazioni di esperti per ulteriori indagini o interventi, presumibilmente utilizzando la versione originale dell’app.242930L’accordo tra l’app e la valutazione della lesione da parte dell’esperto era scarso e variabile indipendentemente dalla soglia di positività del test applicata(fig. 2). Quando solo i risultati ad alto rischio sono stati considerati positivi al test, tra il 25% (intervallo di confidenza del 95% dal 3% al 65%)29 e il 67% (dal 30% al 93%)30 delle lesioni che il dermatologo riteneva richiedessero ulteriori indagini sono state rilevate dall’app (con specificità del 90% e del 61%, rispettivamente). Quando i risultati ad alto e moderato rischio sono stati considerati positivi al test, la sensibilità variava dal 57% al 78% e le specificità dal 27% al 50%(fig. 2).

I risultati dei cinque studi che hanno riportato i dati relativi alle app con disponibilità incerta2324 o alle app ritirate2332 sono semmai più variabili. Questi risultati variabili potrebbero essere in parte causati da campioni di dimensioni più piccole, con bassa sensibilità (25-50% per MelApp) o specificità (20-60% per Mole Detective, Dr Mole e SpotMole). La figura supplementare online 2 presenta i risultati di questi studi e delle valutazioni di app non identificabili.31
34

Fig. 2.Stime di sensibilità e specificità delle parcelle forestali per gli studi delle applicazioni basate su algoritmi attualmente disponibili. L’applicazione Chadwick 2014 SkinScan è un predecessore di SkinVision e non è collegata all’applicazione TeleSkin skinScan con marchio CE. I dati vengono presentati quando solo i risultati ad alto rischio sono stati considerati positivi al test, o quando i risultati ad alto e moderato rischio sono stati considerati positivi al test. Immagini non valutabili: Chadwick 2014: escluso a priori; Chung 2018: 90; Maier 2015: 20; Nabil 2017: non riportato; Ngoo 2018a: 10; Ngoo 2018b: 8; Thissen 2017: 0. FN=numero di persone con un falso risultato negativo; FP=numero di persone con un falso risultato positivo; H=alto rischio; L=basso rischio; M= moderato rischio; rev=rivisto (versione dell’app); rev+qu=rivisto (versione dell’app) più le risposte dei partecipanti alle domande sulla loro lesione cutanea; TN=numero di persone con un vero risultato negativo; TP=numero di persone con un vero risultato positivo. *iOS; †piattaforma mobile non segnalata; ‡Android

Guasto del test

Quando le app non sono riuscite a restituire una valutazione del rischio, le immagini sono state escluse a priori dagli studi,23 escluse dall’analisi,242830313234o non sono state riportate.Latabella2, la tabella 3 e la figura 2 riportano i numeri esclusi per ogni analisi a causa del fallimento del test, che vanno dal 3/188 (1,6%)34 al 90/199 (45,2%).30 Solo uno studio33 ha riportato l’analisi di tutte le immagini per mimare più da vicino un’ambientazione del mondo reale.

Discussione

Principali risultati

In questa revisione sistematica delle applicazioni per smartphone basate su algoritmi abbiamo trovato nove studi che hanno valutato sei applicazioni denominate per la stratificazione del rischio di lesioni cutanee. Solo due app con il marchio CE sono attualmente disponibili per il download in varie parti del mondo. Le valutazioni delle app con disponibilità sconosciuta e di quelle ora ritirate dal mercato a causa di “crediti ingannevoli” sono state particolarmente piccole e con risultati molto variabili. La nostra recensione mostra piccoli miglioramenti nel tempo nella precisione diagnostica di una app attualmente disponibile (SkinVision) e una netta mancanza di prove valide per l’altra app (SkinScan). Gli studi identificati sull’accuratezza dei test hanno molti punti deboli e non forniscono prove adeguate a supporto dell’implementazione delle app attualmente disponibili.

Nonostante i limiti della base di prove, due app basate su algoritmi hanno ottenuto il marchio CE e sono attualmente commercializzate con l’affermazione di poter “rilevare il cancro della pelle in uno stadio precoce” 15 o tracciare i nei nel tempo con l’obiettivo di catturare il melanoma in uno stadio precoce della malattia”.16 Secondo la Direttiva UE sui dispositivi medici35 le applicazioni per smartphone sono dispositivi di classe 1. I produttori possono applicare la marcatura CE ai dispositivi di classe 1 a condizione che abbiano dimostrato la conformità ai “requisiti essenziali” come indicato nella direttiva,35 e senza essere necessariamente soggetti a ispezioni indipendenti da parte di organismi notificati come la Medicines and Healthcare products Regulatory Agency nel Regno Unito. In base ai nuovi Medical Device Regulations,3637che entreranno in vigore a pieno regime entro maggio 2020, le applicazioni per smartphone potrebbero rientrare in classi di dispositivi più elevate e saranno soggette a ispezione da parte degli organismi notificati. La FDA ha già un processo di valutazione più rigoroso per valutare le app mobili, adottando una prospettiva più ampia di danno in cui “la funzionalità potrebbe rappresentare un rischio per la sicurezza di un paziente se l’app mobile non dovesse funzionare come previsto”.13 Nessuna applicazione per smartphone a stratificazione del rischio di cancro della pelle ha ricevuto l’approvazione della FDA fino ad oggi.

Nell’insieme delle prove presentate, diverse app raccomandano consigli di gestione contrastanti per le stesse lesioni.2334Inoltre, le raccomandazioni delle app erano comunemente in disaccordo con i risultati istopatologici o con la valutazione clinica, con alcune app che non sono in grado di identificare alcun caso di melanoma.23

L’applicazione SkinVision ha prodotto le più alte stime di accuratezza. Pertanto, in una popolazione ipotetica di 1000 adulti, in cui il 3% ha un melanoma, quattro melanomi su 30 non sarebbero rilevati come ad alto rischio, e più di 200 persone otterrebbero risultati falsi positivi (utilizzando una sensibilità dell’88% e una specificità del 79%, come osservato da Thissen e colleghi33). Tuttavia, è probabile che le prestazioni siano scarse perché gli studi sono stati piccoli e complessivamente di scarsa qualità metodologica, e non hanno valutato le app in quanto sarebbero state utilizzate in pratica dalle persone che le avrebbero utilizzate. Il reclutamento selettivo dei partecipanti, gli standard di riferimento inadeguati, la verifica differenziale e gli alti tassi di immagini non valutabili sono stati problemi particolari.

Sfide negli studi di valutazione

In primo luogo, le applicazioni per smartphone si rivolgono tipicamente alla popolazione generale con una prevalenza relativamente bassa di lesioni maligne e un’ampia gamma di condizioni cutanee diverse. Gli studi non sono riusciti a reclutare campioni rappresentativi di questa popolazione. Abbiamo scoperto che gli studi si basavano su immagini di lesioni cutanee sospette che erano state sottoposte a escissione o biopsia, e sono stati ulteriormente selezionati per includere solo le condizioni identificate dalle app; ad esempio, hanno escluso le lesioni con caratteristiche cliniche e istologiche simili almelanoma34 , o hanno limitato l’inclusione alle lesioni melanocitiche che hanno maggiori probabilità di essere riconosciute dalle app.2328293132Tali differenze fondamentali nello spettro delle condizioni dermatologiche rispetto alla popolazione generale fanno sì che sia probabile che si osservi una minore accuratezza in un contesto reale.3839I risultati dello studio non sono applicabili anche alle persone con melanomi amelanotici (che rappresentano il 2-8% di tutti i melanomi),40 o per identificare altre forme più comuni di tumori della pelle come il carcinoma squamocellulare cutaneo.

In secondo luogo, la qualità dell’immagine è una delle principali preoccupazioni per le applicazioni per smartphone. Le videocamere degli smartphone hanno molte più probabilità di essere utilizzate in condizioni non ottimali dalla popolazione generale, il che si traduce in una qualità d’immagine variabile. Anche in condizioni controllate, gli studi hanno riportato difficoltà nell’ottenere immagini chiare di lesioni di grandi dimensioni, superficie erosiva di tumori ulcerati, pelle screziata, lesioni nelle pieghe della pelle, pelle abbronzata o lesioni multiple in stretta approssimazione. Questi problemi hanno portato all’esclusione delle immagini e alla potenziale sovrastima delle prestazioni diagnostiche delle applicazioni per il cancro della pelle. L’analisi di immagini non ottimali quando vengono utilizzate dagli utenti di smartphone influenzerà ulteriormente la capacità delle app per il cancro della pelle di distinguere accuratamente tra lesioni ad alto e basso rischio.

In terzo luogo, la mancanza di chiarezza nelle raccomandazioni delle app per smartphone potrebbe lasciare gli utenti interessati incerti sulla migliore linea d’azione. Le reazioni a un risultato a rischio moderato dipenderanno probabilmente da quanto le persone sono avverse al rischio, il che molto probabilmente porterà a decisioni variabili, con il rischio che le persone non si presentino a uno specialista con una lesione cutanea potenzialmente maligna. Pertanto, è impossibile prevedere le reali prestazioni delle diverse app in un contesto reale senza ulteriori ricerche sulle risposte comportamentali in diversi gruppi di persone con una serie di tipi di lesioni.

In quarto luogo, le applicazioni basate su algoritmi sono in continua evoluzione. Una valutazione della versione di una app e delle sue prestazioni potrebbe non essere applicabile alla versione disponibile per gli utenti. Gli studi inclusi in questa revisione non hanno specificato le versioni degli algoritmi utilizzati per la valutazione del rischio e non sappiamo se tre studi dell’app SkinVision 293033 hanno preso in considerazione la stessa versione dell’app o versioni diverse.

Infine, il potenziale vantaggio delle app per smartphone risiede nella loro disponibilità e nell’utilizzo da parte di persone al di fuori del sistema sanitario per valutare le lesioni che li preoccupano. Tuttavia, tutti gli studi hanno valutato le lesioni o le immagini selezionate e acquisite dai medici piuttosto che le lesioni ritenute preoccupanti per le persone che utilizzano le app. Esiste una preoccupazione circa l’impatto delle false rassicurazioni che le app basate su algoritmi potrebbero dare agli utenti con lesioni cutanee potenzialmente maligne, soprattutto se vengono dissuase dal richiedere una consulenza sanitaria. Questi pazienti non sono rappresentati negli studi riportati e quindi non abbiamo valutato questo rischio. Un numero considerevole di utenti riceverà un risultato inappropriato ad alto rischio che potrebbe causare preoccupazioni inutili e un onere per le cure primarie e i servizi dermatologici.

Gli algoritmi all’interno delle applicazioni attuali possono essere migliorati e potrebbero raggiungere livelli di performance adatti ad un ruolo di screening nel prossimo futuro. Tuttavia, i produttori e i ricercatori devono progettare studi che forniscano valide valutazioni di accuratezza. Uno studio SkinVision41 pubblicato dopo la nostra ricerca ha riportato un miglioramento delle stime di sensibilità per il rilevamento di lesioni maligne o premaligne per una nuova versione dell’app (95,1%, intervallo di confidenza del 95% dal 91,9% al 97,3%) con una specificità simile (78,3%, dal 77,3% al 79,3%). Lo studio ha utilizzato alcune immagini e dati raccolti da utenti reali dell’app sui propri telefoni, tuttavia è probabile che la selezione di lesioni maligne e benigne da diverse fonti diverse abbia introdotto un pregiudizio. Due terzi (195/285) delle lesioni maligne o premaligne hanno avuto origine da studi precedenti (inclusi 40 melanomi da uno studio28 e otto melanomi più 147 altre lesioni maligne o premaligne da un altro studio33), con immagini scattate da esperti su pazienti indirizzati a una clinica. Altri 90 melanomi sono stati identificati da utenti dell’app che avevano caricato i risultati dell’istologia dopo una valutazione ad alto rischio da parte di un dermatologo e una raccomandazione ad alto o moderato rischio da parte dell’app (che sovrastimerà l’accuratezza se saranno inclusi melanomi più facilmente identificabili).41 La valutazione clinica da parte di un dermatologo di una singola immagine presentata online senza istologia, senza valutazione di persona o follow-up ha identificato le 6000 lesioni apparentemente benigne incluse. Pertanto, è possibile che questo gruppo possa includere alcuni melanomi mancanti.

Punti di forza e di debolezza di questa revisione

I punti di forza di questa revisione sono l’utilizzo di una ricerca completa della letteratura elettronica con rigorosi metodi di revisione sistematica che includono l’estrazione indipendente di duplicati di dati e la valutazione della qualità degli studi, il tentativo di contatto con gli autori e una chiara struttura di analisi. Abbiamo incluso altri due studi2930 che non erano stati inclusi nelle revisioni precedenti. Abbiamo anche escluso tra i tre42 e i cinque9 studi che riportavano lo sviluppo (senza convalida indipendente) di nuove applicazioni che erano state incluse nelle altre due revisioni perché tali studi probabilmente sovrastimano l’accuratezza.

Abbiamo incluso studi che hanno verificato i risultati delle app utilizzando le raccomandazioni degli esperti per le indagini o gli interventi, oltre agli studi che hanno utilizzato l’istologia con o senza follow-up. Gli studi che hanno utilizzato l’istologia e il follow-up sono più affidabili perché le valutazioni delle app sono valutate rispetto alla vera diagnosi finale delle lesioni dello studio; le basse sensibilità o specificità riflettono l’incapacità delle app di identificare i melanomi o altri tumori della pelle come ad alto rischio. Gli studi che verificano i risultati rispetto alle raccomandazioni degli esperti possono solo fornire un’idea del livello di accordo tra la valutazione del rischio dell’algoritmo e la decisione di gestione clinica di un dermatologo; accordo tra i due non significa necessariamente che la valutazione del rischio effettuata sia quella corretta per la lesione in questione.

Implicazioni per la pratica

Nonostante la crescente disponibilità di applicazioni per il cancro della pelle, la mancanza di prove e i notevoli limiti degli studi evidenziano in ultima analisi le preoccupazioni sulla sicurezza delle applicazioni per smartphone basate su algoritmi. La generalizzabilità dei risultati degli studi è particolarmente preoccupante. L’investimento nelle applicazioni per il cancro della pelle basate su algoritmi è in corso, con l’azienda dietro SkinVision che ha annunciato un investimento di 7,6 milioni di dollari (5,8 milioni di sterline; 6,8 milioni di euro) nel 2018.43 Successivamente, nel marzo 2019,44 questa applicazione è stata selezionata per entrare a far parte dell’NHS Innovation Accelerator del Regno Unito come possibile nuova tecnologia a sostegno della diagnosi precoce e della prevenzione del cancro. Pertanto, è fondamentale che gli operatori sanitari siano consapevoli dei limiti attuali delle tecnologie e delle loro valutazioni. I regolatori devono essere attenti ai potenziali danni che le applicazioni diagnostiche o di stratificazione del rischio basate su algoritmi e scarsamente performanti creano.

Implicazioni per la ricerca

I futuri studi sulle applicazioni per smartphone basate su algoritmi dovrebbero essere basati su una popolazione clinicamente rilevante di utenti di smartphone che potrebbero avere preoccupazioni circa il loro rischio di cancro alla pelle o che potrebbero avere preoccupazioni circa una lesione cutanea nuova o mutevole. Le lesioni che sono riferite per un’ulteriore valutazione e quelle che non lo sono devono essere incluse. Uno standard di riferimento combinato di istologia e follow-up clinico delle lesioni benigne fornirebbe risultati più affidabili e più generalizzabili. Devono essere riportati dati completi che includano i tassi di fallimento causati da una scarsa qualità dell’immagine. Qualsiasi studio di ricerca futuro dovrebbe essere conforme alle linee guida per la segnalazione, incluse le linee guida aggiornate sugli Standard per la segnalazione dell’accuratezzadiagnostica45 e le considerazioni pertinenti della prossima estensione specifica per l’intelligenza artificiale alla dichiarazione CONSORT (Consolidated Standards of Reporting Trials).46

Conclusione

Le applicazioni basate su un algoritmo per smartphone per il cancro della pelle includono tutti i disclaimer che i risultati devono essere utilizzati solo come guida e non possono sostituire i consigli sanitari. Pertanto, queste applicazioni tentano di eludere qualsiasi responsabilità per i risultati negativi sperimentati dagli utenti. Ciononostante, la nostra recensione ha riscontrato prestazioni scarse e variabili delle app per smartphone basate su algoritmi, il che indica che queste app non hanno ancora dimostrato una promessa sufficiente per raccomandarne l’uso. Gli attuali processi di valutazione del marchio CE sono inadeguati per proteggere il pubblico dai rischi creati dall’utilizzo di applicazioni di diagnostica o di stratificazione del rischio per smartphone. Gli smartphone e le app dedicate al cancro della pelle possono avere altri ruoli; ad esempio, assistere nell’autoesame della pelle, seguire l’evoluzione delle lesioni sospette nelle persone più a rischio di sviluppare il cancro della pelle,4748o quando vengono utilizzate per la teledermatologia di store e forward.4950Tuttavia, gli operatori sanitari che lavorano nelle cure primarie e secondarie devono essere consapevoli dei limiti delle app basate su algoritmi per identificare in modo affidabile i melanomi e dovrebbero informare i potenziali utenti delle app per smartphone in merito a tali limiti.

Ciò che è già noto su questo argomento

  1. Il cancro della pelle è uno dei tumori più comuni al mondo e l’incidenza è in aumento
  2. Le applicazioni per smartphone basate su algoritmi (“app”) forniscono all’utente una valutazione immediata del rischio di cancro alla pelle e offrono il potenziale per una diagnosi e un trattamento più precoci, che potrebbero migliorare la sopravvivenza.
  3. Una revisione Cochrane di soli due studi che hanno cercato di convalidare le applicazioni per la pelle basate su algoritmi ha suggerito che c’è un’alta probabilità che i tumori della pelle non vengano presi in considerazione.

Cosa aggiunge questo studio

  1. Questa revisione ha identificato nove studi ammissibili che hanno valutato le applicazioni per la stratificazione del rischio di lesioni cutanee e hanno mostrato un’accuratezza del test variabile e inaffidabile per sei diverse applicazioni
  2. Gli studi hanno valutato le app in gruppi selezionati di lesioni, utilizzando immagini scattate da esperti piuttosto che da utenti delle app, e molti non hanno identificato se le lesioni a basso rischio fossero veramente benigne
  3. In un campo che avanza rapidamente, la qualità delle prove è scarsa per sostenere l’uso di queste applicazioni per valutare il rischio di cancro della pelle negli adulti con preoccupazioni per lesioni cutanee nuove o mutevoli

References

  1. Ferlay J, Colombet M, Soerjomataram I. Cancer incidence and mortality patterns in Europe: estimates for 40 countries and 25 major cancers in 2018. Eur J Cancer. 2018; 103:356-87. DOI | PubMed
  2. WHO. INTERSUN: The Global UV Project. A guide and compendium.. World Health Organization; 2003.
  3. Publisher Full Text
  4. Balch CM, Gershenwald JE, Soong SJ. Final version of 2009 AJCC melanoma staging and classification. J Clin Oncol. 2009; 27:6199-206. DOI | PubMed
  5. Rowe DE, Carroll RJ, Day CL. Prognostic factors for local recurrence, metastasis, and survival rates in squamous cell carcinoma of the skin, ear, and lip. Implications for treatment modality selection. J Am Acad Dermatol. 1992; 26:976-90. DOI | PubMed
  6. Venables ZC, Nijsten T, Wong KF. Epidemiology of basal and cutaneous squamous cell carcinoma in the U.K. 2013-15: a cohort study. Br J Dermatol. 2019; 181:474-82. DOI | PubMed
  7. Dinnes J, Deeks JJ, Chuchu N. Dermoscopy, with and without visual inspection, for diagnosing melanoma in adults. Cochrane Database Syst Rev. 2018; 12:CD011902. DOI
  8. Dinnes J, Deeks JJ, Chuchu N, Cochrane Skin Cancer Diagnostic Test Accuracy Group. Reflectance confocal microscopy for diagnosing keratinocyte skin cancers in adults. Cochrane Database Syst Rev. 2018; 12DOI | PubMed
  9. Buechi R, Faes L, Bachmann LM. Evidence assessing the diagnostic performance of medical smartphone apps: a systematic review and exploratory meta-analysis. BMJ Open. 2017; 7DOI | PubMed
  10. Kassianos AP, Emery JD, Murchie P, Walter FM. Smartphone applications for melanoma detection by community, patient and generalist clinician users: a review. Br J Dermatol. 2015; 172:1507-18. DOI | PubMed
  11. Yas QM, Zaidan AA, Zaidan BB, Hashim M, Lim CK. A systematic review on smartphone skin cancer apps: coherent taxonomy, motivations, open challenges and recommendations, and new research direction. J Circuits Syst Comput. 2018; 27DOI
  12. Flaten HK, St Claire C, Schlager E, Dunnick CA, Dellavalle RP. Growth of mobile applications in dermatology – 2017 update. Dermatol Online J. 2018; 24
  13. FDA. Mobile medical applications – guidance for industry and food and drug administration staff.. Food and Drug Administration; 2015.
  14. Publisher Full Text
  15. SkinVision.Publisher Full Text
  16. SkinScan.Publisher Full Text
  17. USA Federal Trade Commission. 2015. Publisher Full Text
  18. USA Federal Trade Commission. 2015. Publisher Full Text
  19. Chuchu N, Takwoingi Y, Dinnes J. Smartphone applications for triaging adults with skin lesions that are suspicious for melanoma. Cochrane Database Syst Rev. 2018; 12:CD013192. DOI
  20. Publisher Full Text
  21. McInnes MDF, Moher D, Thombs BD, and the PRISMA-DTA Group. Preferred reporting items for a systematic review and meta-analysis of diagnostic test accuracy studies: the PRISMA-DTA statement. JAMA. 2018; 319:388-96. DOI | PubMed
  22. Whiting PF, Rutjes AW, Westwood ME, QUADAS-2 Group. QUADAS-2: a revised tool for the quality assessment of diagnostic accuracy studies. Ann Intern Med. 2011; 155:529-36. DOI | PubMed
  23. Ngoo A, Finnane A, McMeniman E, Tan JM, Janda M, Soyer HP. Efficacy of smartphone applications in high-risk pigmented lesions. Australasian J Dermatol. 2018; 59:e175-82.
  24. Dinnes J, Matin RN, Moreau JF. Tests to assist in the diagnosis of cutaneous melanoma in adults: a generic protocol. Cochrane Database Syst Rev. 2015; 10DOI
  25. Von Braunmühl T. Smartphone apps for skin cancer diagnosis? The Munich study. Kosmetische Medizin. 2015; 36:152-7.
  26. Kukutsch NA. Skin cancer apps: possibilities and impossibilities. [Huidkankerapps: mogelijkheden en onmogelijkheden.]. Ned Tijdschr Dermatol Venereol. 2017; 27:155-7.
  27. Maier T, Kulichova D, Schotten K. Accuracy of a smartphone application using fractal image analysis of pigmented moles compared to clinical diagnosis and histological result. J Eur Acad Dermatol Venereol. 2015; 29:663-7. DOI | PubMed
  28. Nabil R, Bergman W, Kukutsch NA. Conflicting results between the analysis of skin lesions using a mobile-phone application and a dermatologist’s clinical diagnosis: a pilot study. Br J Dermatol. 2017; 177:583-4. DOI | PubMed
  29. Chung Y, van der Sande AAJ, de Roos KP. Automated analysis of skin cancer app is unreliable. Ned Tijdschr Dermatol Venereol. 2018; 28:10-3.
  30. Dorairaj JJ, Healy GM, McInerney A, Hussey AJ. Validation of a melanoma risk assessment smartphone application. Dermatol Surg. 2017; 43:299-302. DOI | PubMed
  31. Robson Y, Blackford S, Roberts D. Caution in melanoma risk analysis with smartphone application technology. Br J Dermatol. 2012; 167:703-4. DOI | PubMed
  32. Thissen M, Udrea A, Hacking M, von Braunmuehl T, Ruzicka T. mHealth app for risk assessment of pigmented and nonpigmented skin lesions-a study on sensitivity and specificity in detecting malignancy. Telemed J E Health. 2017; 23:948-54. DOI | PubMed
  33. Wolf JA, Moreau JF, Akilov O. Diagnostic inaccuracy of smartphone applications for melanoma detection. JAMA Dermatol. 2013; 149:422-6. DOI | PubMed
  34. DIRECTIVE 2007/47/EC OF THE EUROPEAN PARLIAMENT AND OF THE COUNCIL of 5 September 2007 amending Council Directive 90/385/EEC on the approximation of the laws of the Member States relating to active implantable medical devices, Council Directive 93/42/EEC concerning medical devices and Directive 98/8/EC concerning the placing of biocidal products on the market. 2007. p. 22-55.
  35. REGULATION (EU) 2017/745 OF THE EUROPEAN PARLIAMENT AND OF THE COUNCIL of 5 April 2017 on medical devices, amending Directive 2001/83/EC, Regulation (EC) No 178/2002 and Regulation (EC) No 1223/2009 and repealing Council Directives 90/385/EEC and 93/42/EEC. 2017. p. 1-175.
  36. Publisher Full Text
  37. Leeflang MM, Rutjes AW, Reitsma JB, Hooft L, Bossuyt PM. Variation of a test’s sensitivity and specificity with disease prevalence. CMAJ. 2013; 185:E537-44. DOI | PubMed
  38. Usher-Smith JA, Sharp SJ, Griffin SJ. The spectrum effect in tests for risk prediction, screening, and diagnosis. BMJ. 2016; 353:i3139. DOI | PubMed
  39. Pizzichetta MA, Talamini R, Stanganelli I. Amelanotic/hypomelanotic melanoma: clinical and dermoscopic features. Br J Dermatol. 2004; 150:1117-24. DOI | PubMed
  40. Udrea A, Mitra GD, Costea D. Accuracy of a smartphone application for triage of skin lesions based on machine learning algorithms. J Eur Acad Dermatol Venereol. 2019. DOI | PubMed
  41. Rat C, Hild S, Rault Sérandour J. Use of smartphones for early detection of melanoma: systematic review. J Med Internet Res. 2018; 20DOI | PubMed
  42. SkinVision. 2018. Publisher Full Text
  43. SkinVision.Publisher Full Text
  44. Bossuyt PM, Reitsma JB, Bruns DE, STARD Group. STARD 2015: an updated list of essential items for reporting diagnostic accuracy studies. BMJ. 2015; 351:h5527. DOI | PubMed
  45. Liu X, Rivera SC, Faes L. Reporting guidelines for clinical trials evaluating artificial intelligence interventions are needed. Nat Med. 2019; 25:1467-68. PubMed
  46. Guido N, Hagstrom E, Ibler E, Carneiro C, West D, Nardone B. A novel total body digital photography smartphone application designed to detect and monitor skin lesions: a pilot study. J Surg Dermatol.. 2018; 3:177. DOI
  47. Manahan MN, Soyer HP, Loescher LJ. A pilot trial of mobile, patient-performed teledermoscopy. Br J Dermatol. 2015; 172:1072-80. DOI | PubMed
  48. Markun S, Scherz N, Rosemann T, Tandjung R, Braun RP. Mobile teledermatology for skin cancer screening: a diagnostic accuracy study. Medicine (Baltimore). 2017; 96DOI | PubMed
  49. Silveira CEG, Carcano C, Mauad EC, Faleiros H, Longatto-Filho A. Cell phone usefulness to improve the skin cancer screening: preliminary results and critical analysis of mobile app development. Rural Remote Health. 2019; 19:4895. DOI | PubMed

Fonte

Freeman K, Dinnes J, Chuchu N, Takwoingi Y, Bayliss SE, et al. (2020) Algorithm based smartphone apps to assess risk of skin cancer in adults: systematic review of diagnostic accuracy studies. The BMJ 368m127. https://doi.org/10.1136/bmj.m127