Lo strumento di deep learning identifica le mutazioni del mosaico che causano la malattia

Le mutazioni genetiche causano centinaia di disturbi irrisolti e incurabili. Tra questi, le mutazioni del DNA in una piccola percentuale di cellule, chiamate mutazioni a mosaico, sono estremamente difficili da rilevare perché esistono in una piccola percentuale delle cellule.

Durante la scansione dei 3 miliardi di basi del genoma umano, gli attuali rilevatori software di mutazione del DNA non sono adatti a discernere le mutazioni a mosaico che si nascondono tra le normali sequenze di DNA. Di conseguenza, spesso i genetisti medici devono esaminare a occhio le sequenze del DNA per cercare di identificare o confermare le mutazioni del mosaico -; uno sforzo dispendioso in termini di tempo e irto di possibilità di errore.

Scrivendo nel numero del 2 gennaio 2023 di Biotecnologie naturalii ricercatori della University of California San Diego School of Medicine e del Rady Children’s Institute for Genomic Medicine descrivono un metodo per insegnare a un computer come individuare le mutazioni del mosaico utilizzando un approccio di intelligenza artificiale chiamato “deep learning”.

Studio: rilevamento della variante a singolo nucleotide del mosaico indipendente dal controllo con DeepMosaic.  Credito di immagine: Laurent T/ShutterstockStudio: rilevamento della variante a singolo nucleotide del mosaico indipendente dal controllo con DeepMosaic. Credito di immagine: Laurent T/Shutterstock

Il deep learning, a volte indicato come reti neurali artificiali, è una tecnica di apprendimento automatico che insegna ai computer a fare ciò che viene naturale per gli esseri umani: imparare con l’esempio, soprattutto da grandi quantità di informazioni. Rispetto ai modelli statistici tradizionali, i modelli di deep learning utilizzano reti neurali artificiali per elaborare dati rappresentati visivamente. Di conseguenza, i modelli funzionano in modo simile all’elaborazione visiva umana, con una precisione e un’attenzione ai dettagli molto maggiori, portando a progressi significativi nelle capacità computazionali, incluso il rilevamento delle mutazioni.

“Un esempio di disturbo irrisolto è l’epilessia focale”, ha affermato l’autore senior dello studio Joseph Gleeson, MD, Rady Professor of Neuroscience presso la UC San Diego School of Medicine e direttore della ricerca neuroscientifica presso il Rady Children’s Institute for Genomic Medicine.

“L’epilessia colpisce il 4% della popolazione e circa un quarto delle crisi focali non risponde ai farmaci standard. Questi pazienti spesso richiedono l’escissione chirurgica della parte focale del cervello in cortocircuito per fermare le crisi. Tra questi pazienti, mutazioni a mosaico all’interno del cervello può causare focolai epilettici.

“Abbiamo avuto molti pazienti con epilessia di cui non siamo stati in grado di individuare la causa, ma una volta applicato il nostro metodo, chiamato ‘DeepMosaic’, ai dati genomici, la mutazione è diventata evidente. Questo ci ha permesso di migliorare la sensibilità del sequenziamento del DNA in certe forme di epilessia, e aveva portato a scoperte che puntano a nuovi modi per curare le malattie del cervello”.

Gleeson ha affermato che il rilevamento accurato delle mutazioni del mosaico è il primo passo nella ricerca medica verso lo sviluppo di trattamenti per molte malattie.

L’autore co-primo e co-corrispondente Xiaoxu Yang, Ph.D., uno studioso post-dottorato nel laboratorio di Gleeson, ha affermato che DeepMosaic è stato addestrato su quasi 200.000 varianti simulate e biologiche in tutto il genoma fino a quando “finalmente, siamo rimasti soddisfatti della sua capacità di rilevare varianti da una data che non aveva mai incontrato prima.”

Per addestrare il computer, gli autori hanno fornito esempi di mutazioni a mosaico affidabili e molte normali sequenze di DNA e hanno insegnato al computer a distinguere. Allenandosi e riaddestrandosi ripetutamente con set di dati sempre più complessi e selezionando tra una dozzina di modelli, il computer è stato infine in grado di identificare le mutazioni del mosaico molto meglio degli occhi umani e dei metodi precedenti. DeepMosaic è stato anche testato su diversi set di dati indipendenti di sequenziamento su larga scala che non aveva mai visto, superando gli approcci precedenti.

“DeepMosaic ha superato gli strumenti tradizionali nel rilevare il mosaicismo da sequenze genomiche ed esoniche”, ha affermato il co-primo autore Xin Xu, ex assistente di ricerca universitaria presso la UC San Diego School of Medicine e ora ricercatore di dati presso Novartis. “Le caratteristiche visive di spicco raccolte dai modelli di deep learning sono molto simili a ciò su cui gli esperti si stanno concentrando quando esaminano manualmente le varianti”.

DeepMosaic è disponibile gratuitamente per gli scienziati. I ricercatori hanno affermato che non si tratta di un singolo programma per computer, ma di una piattaforma open source che può consentire ad altri ricercatori di addestrare le proprie reti neurali per ottenere un rilevamento più mirato delle mutazioni utilizzando una configurazione simile basata su immagini.

I coautori includono Martin W. Breuss, Danny Antaki, Laurel L. Ball, Changuk Chung, Jiawei Shen, Chen Li e Renee D. George, UC San Diego e Rady Children’s Institute for Genomic Medicine; Yifan Wang, Taejeong Bae e Alexei Abyzov, Mayo Clinic; Yuhe Cheng, Ludmil B. Alexandrov e Jonathan L. Sebat, UC San Diego; Liping Wei, Università di Pechino; e NIMH Brain Somatic Mosaicism Network.

I finanziamenti per questa ricerca provenivano in parte dal National Institutes of Health (sovvenzioni U01MH108898 e R01MH124890), dal San Diego Supercomputer Center e dall’UC San Diego Institute of Genomic Medicine.

NBT: video introduttivo del “Rilevamento di varianti a singolo nucleotide del mosaico indipendente dal controllo con DeepMosaic”

.

Leave a Comment

Your email address will not be published. Required fields are marked *