RNA e intelligenza artificiale: scoperte nuove regole nelle interazioni molecolari. UniCamillus guida lo studio

Il progetto è stato supervisionato dal Prof. Alessio Colantoni, Ricercatore affiliato a UniCamillus. Lo abbiamo intervistato per saperne di più.

Dentro ogni nostra cellula c’è una specie di “libretto di istruzioni”: il nostro famoso DNA. Ma il DNA, da solo, non fa nulla: per trasformare quelle istruzioni in qualcosa di concreto servono gli RNA.

Gli RNA sono molecole fatte di una sequenza di “lettere” chimiche – A, U, C e G – messe in un certo ordine. L’ordine di queste lettere è come una frase: cambia il significato, cambia quello che l’RNA può fare e con chi può interagire. 

Alcuni RNA servono a produrre proteine, altri invece hanno un ruolo di regolazione: aiutano a decidere quando, dove e quanto un gene deve essere attivo. E per farlo, spesso devono interagire tra loro. Il punto è che non sappiamo ancora bene quali “regole” permettano a due RNA di riconoscersi e legarsi.

Ed è qui che entra in gioco uno studio, intitolato “The role of low-complexity repeats in RNA-RNA interactions and a deep learning framework for duplex prediction”, apparso su Nature Communications il 23 gennaio 2026. Analizzando grandi quantità di dati, i ricercatori hanno scoperto che anche sequenze molto semplici e ripetitive – parti dell’RNA fatte di lettere che si ripetono – possono essere fondamentali per far comunicare gli RNA tra loro. Insomma, quelle parti che sembravano noiose o poco importanti potrebbero essere in realtà il collante che tiene insieme molte interazioni nella cellula.

E non è tutto qui: i ricercatori hanno anche sviluppato uno strumento di intelligenza artificiale, chiamato RIME, capace di predire quali RNA tenderanno a interagire tra loro semplicemente leggendo la loro sequenza.

Una parte importante di questo lavoro scientifico è stata realizzata anche grazie al contributo di Alessio Colantoni, Docente di Biologia Molecolare presso l’Università UniCamillus, specializzato nella predizione e caratterizzazione delle interazioni tra RNA e proteine o altri RNA usando approcci computazionali e di machine learning. Il Prof. Colantoni, infatti, ha agito come supervisor dello studio insieme a Gian Gaetano Tartaglia dell’Istituto Italiano di Tecnologia. Per questo gli abbiamo chiesto di raccontarci cosa significa tutto ciò e perché potrebbe cambiare il modo in cui guardiamo al mondo dell’RNA.


Se dovesse spiegare gli obiettivi di questo studio a qualcuno che non ha esperienza, come lo spiegherebbe? 

«Gli RNA sono molecole fondamentali che permettono alle informazioni contenute nei nostri geni di essere utilizzate dalla cellula. Ogni RNA è definito da una sequenza, cioè una successione ordinata di “lettere” chimiche che rappresentano l’informazione genetica e determinano come quell’RNA si comporta e con quali altre molecole può interagire. In particolare, molti RNA – chiamati RNA messaggeri – funzionano come istruzioni che vengono lette per produrre le proteine, cioè i principali “mattoni” e regolatori delle funzioni cellulari.

Non tutti gli RNA, però, servono a produrre proteine. Esistono infatti RNA non codificanti che hanno un ruolo di regolazione. Un esempio molto noto sono i microRNA, piccole molecole di RNA che controllano l’espressione dei geni legandosi agli RNA messaggeri e modulandone la traduzione. La scoperta dei microRNA è stata così importante da essere premiata con il Premio Nobel, a sottolineare quanto sia cruciale capire come gli RNA interagiscono tra loro.

Negli ultimi anni è emerso che anche RNA non codificanti più lunghi, chiamati long non-coding RNA (lncRNA), possono interagire direttamente con altri RNA, inclusi gli RNA messaggeri, influenzandone la stabilità, la localizzazione o l’attività. Tuttavia, a differenza dei microRNA, i meccanismi alla base delle interazioni tra RNA lunghi sono ancora poco compresi.

Lo scopo di questo studio è stato proprio quello di capire quali caratteristiche permettono agli RNA lunghi di riconoscersi e interagire tra loro. In altre parole, ci siamo chiesti se esistano “regole” nella sequenza degli RNA che ne guidano le interazioni, in modo simile a quanto già noto per i microRNA.

Per rispondere a questa domanda, abbiamo analizzato numerosi dataset biologici utilizzando strumenti informatici, cercando schemi ricorrenti nelle sequenze degli RNA che tendono a interagire. Questo approccio ci ha permesso di individuare elementi comuni che possono spiegare come e perché alcuni RNA lunghi entrano in contatto tra loro. Comprendere questi meccanismi è importante perché tali interazioni rappresentano un ulteriore livello di controllo dell’espressione genica e possono contribuire sia al corretto funzionamento delle cellule sia allo sviluppo di malattie quando vengono alterate.»


Qual è il risultato più importante e innovativo che avete raggiunto?

«Una delle scoperte chiave del nostro studio è che le cosiddette low-complexity repeats, sequenze ripetute e molto semplici negli RNA, svolgono un ruolo centrale nelle interazioni tra RNA lunghi. Abbiamo infatti osservato che queste sequenze, pur essendo estremamente semplici dal punto di vista della composizione, sono fortemente arricchite nei punti di contatto tra RNA lunghi.

In particolare, abbiamo mostrato che le sequenze ripetitive tendono a formare regioni di interazione stabili e multivalenti, capaci di entrare in contatto con più RNA diversi. Questo le rende nodi centrali all’interno delle reti di interazione tra RNA. Il nostro lavoro suggerisce quindi che la capacità degli RNA di interagire non dipende solo da strutture complesse o altamente specifiche, ma anche da moduli di sequenza semplici e flessibili, che contribuiscono a coordinare processi fondamentali come la regolazione dell’espressione genica, lo sviluppo e il metabolismo dell’RNA.»


Perché queste sequenze ripetitive sono così importanti, e come mai prima non venivano considerate tali?

«Le sequenze ripetitive sono particolarmente interessanti perché sono estremamente variabili tra individui: la loro lunghezza e composizione possono cambiare facilmente da una persona all’altra. Proprio per questa variabilità, vengono comunemente utilizzate per l’identificazione genetica, ad esempio nei test di paternità o nella genetica forense. Tuttavia, dal punto di vista biologico, la loro funzione molecolare è rimasta a lungo poco chiara.

Per molti anni queste sequenze sono state considerate elementi poco informativi o privi di una funzione specifica. Inoltre, molte analisi computazionali tendono a escludere o semplificare le regioni ripetitive, trattandole come rumore piuttosto che come possibili segnali funzionali.

Il nostro studio suggerisce invece che proprio queste caratteristiche – semplicità, ripetitività e flessibilità – rendono le sequenze ripetitive particolarmente adatte a mediare interazioni tra RNA. La loro composizione favorisce l’appaiamento con più partner, permettendo a un singolo RNA di partecipare a molte interazioni. Questo porta a una nuova interpretazione del loro ruolo: non solo marcatori genetici, ma componenti attivi dell’organizzazione e della regolazione delle interazioni tra RNA nella cellula


Avete sviluppato RIME, uno strumento di IA. A cosa serve, come funziona e in cosa supera i metodi tradizionali?

«RIME è uno strumento di intelligenza artificiale sviluppato per predire quali RNA possono interagire tra loro a partire dalla loro sequenza. Serve quindi a identificare, in modo rapido e sistematico, potenziali interazioni RNA–RNA che sarebbero molto difficili da individuare solo con esperimenti tradizionali.

I metodi classici per predire le interazioni tra RNA si basano principalmente su calcoli termodinamici, cioè stimano quanto sia stabile l’appaiamento tra due molecole in base all’energia di legame. Questi approcci sono utili, ma funzionano bene soprattutto per RNA corti e spesso non riescono a catturare la complessità delle interazioni tra RNA lunghi, che dipendono anche dal contesto della sequenza e da molti fattori biologici.

RIME adotta un approccio diverso. Analizza le sequenze di RNA utilizzando modelli di apprendimento automatico che hanno “imparato” le regolarità del linguaggio delle sequenze nucleotidiche. In questo modo, lo strumento è in grado di riconoscere schemi ricorrenti nella sequenza, inclusi quelli legati alle sequenze ripetitive, che favoriscono le interazioni tra RNA, anche quando queste non sono facilmente prevedibili con le sole regole energetiche.

In sintesi, RIME non si limita a calcolare se due RNA possono interagire in teoria, ma impara dai dati sperimentali come le interazioni avvengono realmente nelle cellule, rendendolo uno strumento potente per esplorare nuovi livelli di regolazione dell’espressione genica.»


Quali sono le implicazioni di questa scoperta per la medicina? 

«Le implicazioni per la medicina sono soprattutto legate a una migliore comprensione dei meccanismi molecolari che regolano il funzionamento delle cellule. Molte patologie, in particolare quelle neurodegenerative e alcuni tumori, non dipendono solo da mutazioni nelle proteine, ma anche da alterazioni nei livelli, nella struttura e nelle interazioni degli RNA.

La scoperta che le sequenze ripetitive svolgono un ruolo attivo nelle interazioni tra RNA lunghi è particolarmente rilevante in ambito medico, perché molte di queste sequenze sono associate a patologie come la sclerosi laterale amiotrofica, l’autismo o la malattia di Huntington, ma finora il loro contributo molecolare non era del tutto chiaro.

Inoltre, le interazioni mediate da sequenze ripetitive possono favorire la formazione di aggregati di RNA e di strutture cellulari anomale, come i granuli da stress, che sono frequentemente osservati in condizioni patologiche. Comprendere come e perché queste interazioni si formano aiuta quindi a chiarire i meccanismi che portano alla disfunzione cellulare e alla neurodegenerazione.

Infine, strumenti come RIME permettono di identificare e prioritizzare interazioni RNA–RNA potenzialmente rilevanti in contesti patologici, aprendo la strada a nuovi approcci diagnostici o terapeutici. Anche se siamo ancora in una fase di ricerca di base, queste scoperte forniscono una cornice concettuale importante per interpretare meglio il ruolo degli RNA nelle malattie e per sviluppare, in futuro, strategie mirate a intervenire sui meccanismi di regolazione mediati dall’RNA.»


Prossimo passo nella ricerca sulle interazioni tra RNA?

«Il prossimo passo nella ricerca sulle interazioni tra RNA sarà passare dalla loro identificazione a una comprensione più profonda del loro ruolo funzionale nelle cellule. Ora che sappiamo che semplici sequenze ripetute possono guidare molte di queste interazioni, diventa fondamentale capire quando, dove e con quali conseguenze biologiche esse avvengono.

Un aspetto chiave sarà studiare come le interazioni mediate da sequenze ripetitive cambiano in contesti diversi, ad esempio durante lo sviluppo, in risposta a stress cellulari o in condizioni patologiche. Questo aiuterà a distinguere le interazioni fisiologiche da quelle che contribuiscono alla disfunzione cellulare.

Un’altra direzione importante sarà integrare le interazioni RNA-RNA con altri livelli di regolazione, come le interazioni con le proteine e l’organizzazione spaziale dell’RNA nella cellula. Le sequenze ripetitive sembrano infatti collocarsi in punti di convergenza tra diversi processi regolatori, suggerendo che possano coordinare reti complesse di regolazione dell’espressione genica.

Infine, dal punto di vista metodologico, sarà cruciale sviluppare nuovi strumenti computazionali e combinarli con approcci sperimentali che permettano di studiare queste interazioni con maggiore precisione e in condizioni più vicine alla fisiologia cellulare. La nuova prospettiva offerta dal nostro studio apre quindi la strada a una visione più integrata e dinamica di come gli RNA interagiscono tra loro all’interno della cellula, con potenziali ricadute sia per la biologia di base sia per la medicina.»