Un modello linguistico per scoprire nuovi farmaci

Un modello linguistico per scoprire nuovi farmaciApplicando un modello di linguaggio alle interazioni proteina-farmaco, i ricercatori possono eseguire rapidamente screening su ampie librerie di potenziali composti farmaceutici.

I grandi archivi di composti farmaceutici possono contenere potenziali trattamenti per numerose malattie, come il cancro o le malattie cardiache.
Idealmente, gli scienziati vorrebbero testare sperimentalmente ciascuno di questi composti su tutti i possibili bersagli, ma un tale screening richiederebbe troppo tempo.

Negli ultimi anni, i ricercatori hanno iniziato a utilizzare metodi computazionali per eseguire lo screening di tali librerie nella speranza di accelerare la scoperta di nuovi farmaci.
Tuttavia, questi metodi richiedono molto tempo, in quanto calcolano la struttura tridimensionale di ciascuna proteina bersaglio dalla sua sequenza di aminoacidi e utilizzano tali strutture per prevedere con quali molecole di farmaco interagirà.

I ricercatori del MIT e dell'Università di Tufts hanno ora ideato un approccio computazionale alternativo basato su un tipo di algoritmo di intelligenza artificiale noto come modello di linguaggio.
Questi modelli - un esempio ben noto è ChatGPT - possono analizzare enormi quantità di testo e capire quali parole (o, in questo caso, aminoacidi) sono più propense a comparire insieme.

Il nuovo modello, chiamato ConPLex, può abbinare proteine bersaglio con potenziali molecole di farmaco senza dover eseguire il calcolo intensivo dal punto di vista computazionale delle strutture molecolari.
Utilizzando questo metodo, i ricercatori possono eseguire lo screening di oltre 100 milioni di composti in un solo giorno, molto più di quanto riesca a fare qualsiasi altro modello esistente.
I ricercatori hanno testato il modello su diverse proteine bersaglio e hanno ottenuto risultati promettenti. Il modello è stato in grado di identificare correttamente i farmaci noti che interagiscono con le proteine bersaglio e ha anche individuato nuovi composti che potrebbero essere efficaci.

Contrastive learning in protein language space predicts interactions between drugs and protein targets