nouvelles

L'École d'informatique de l'Université de Pékin est répertoriée dans la meilleure revue internationale sur l'IA ! L’équipe du professeur Zhang Ming a formé un modèle de base de l’activité biologique avec 1,6 million de données

2024-08-16

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


L'article est réimprimé dans Xinzhiyuan

La bioactivité des petites molécules joue un rôle crucial dans le développement de médicaments.

L'activité biologique reflète le degré avec lequel une petite molécule interagit avec une cible spécifique (telle qu'une protéine, un récepteur ou une enzyme) dans un système biologique et provoque une réponse biologique mesurable. Il s'agit d'un facteur important dans la sélection de candidats médicaments potentiels et l'optimisation des structures moléculaires. , et prédire l'efficacité des médicaments et les indicateurs clés de sécurité.

Une prédiction et une évaluation précises de l'activité biologique peuvent non seulement réduire considérablement le temps de dépistage des médicaments et réduire les coûts de recherche et de développement, mais également aider les chercheurs à comprendre le mécanisme d'action des médicaments, accélérant ainsi le processus de développement de nouveaux médicaments et offrant des options de traitement plus efficaces et plus sûres. patients.

Dans le domaine de la prévision de l'activité biologique, les méthodes de calcul existantes basées sur la physique, telles que la perturbation de l'énergie libre (FEP), peuvent donner des prévisions précises, mais elles se heurtent au problème du coût de calcul élevé.

Ces dernières années, les méthodes d’apprentissage profond ont montré un grand potentiel, mais sont confrontées au problème des données expérimentales limitées et de l’incompatibilité des différentes activités biologiques mesurées expérimentalement.

Dans le passé, les chercheurs ont utilisé des techniques avancées d'apprentissage automatique telles que l'apprentissage par transfert, l'apprentissage multitâche et le méta-apprentissage, mais ils ne se sont formés que sur des types spécifiques (tels que Ki, Kd, ​​​​IC50) et des données d'activité biologique en concentration molaire. unités, ce qui rend difficile la généralisation du modèle à la tâche de prédire l'activité biologique avec des types (par exemple EC50) ou des unités (par exemple «%») jamais vus auparavant.

Pour résoudre ce défi, l'équipe du professeur Zhang Ming de l'École d'informatique de l'Université de Pékin, en collaboration avec le professeur adjoint Wang Sheng de l'Université de Washington, le chercheur postdoctoral Xiao Zhiping et le professeur Xu Yinghui de l'Université de Fudan, a proposé une méthode formée sur 1.6. millions de données d'activité biologique mesurées expérimentalement dans la base de données ChEMBL. Le modèle de base de l'activité biologique ——ActFound.

Actuellement, ces travaux ont été publiés dans la principale revue mondiale sur l'intelligence artificielle, Nature Machine Intelligence (NMI en abrégé, le dernier facteur d'impact est de 18,8).


Lien papier https://www.nature.com/articles/s42256-024-00876-w

Lien de partage : https://rdcu.be/dQUav

Les données, le code et les modèles de formation d'ActFound sont open source : https://github.com/BFeng14/ActFound

L'idée principale d'ActFound est d'utiliser une méthode d'apprentissage par paires pour apprendre la différence d'activité biologique relative entre deux petites molécules dans le même ensemble d'expériences, évitant ainsi le problème de l'incompatibilité des activités biologiques entre différentes expériences. Le modèle utilise également la technologie de méta-apprentissage pour aider le modèle à améliorer la précision des prédictions avec seulement une petite quantité de données.

Les évaluateurs estiment que la combinaison de l’apprentissage par paires et du méta-apprentissage résout non seulement avec succès le problème central de la prédiction d’activité, mais inspire également le développement d’autres domaines.

Sur six ensembles de données de référence pour l'évaluation de la bioactivité, ActFound a démontré des capacités de prédiction précises et de fortes capacités de généralisation à travers différents types de bioactivité et échafaudages moléculaires.

La recherche montre également qu'ActFound peut servir d'alternative au principal outil informatique basé sur la physique FEP+, en atteignant des performances comparables en utilisant seulement une petite quantité de données pour un réglage précis.


Afin de vérifier les performances et la valeur pratique du modèle ActFound, l’équipe de recherche a mené une série d’expériences sur des tâches de prédiction de l’activité biologique.

Premièrement, les chercheurs ont évalué les performances d'ActFound sur six ensembles de données différents. ActFound a surpassé les neuf méthodes comparatives sur ChEMBL, BindingDB, FS-Mol, pQSAR-ChEMBL, Davis et Kiba, démontrant ainsi ses performances en termes d'applicabilité étendue dans presque tous les types d'expériences.

En termes de prédiction de bioactivité inter-domaines, ActFound surpasse également les méthodes de pointe existantes et démontre de bonnes capacités de généralisation sur différents types de données de bioactivité.


Deuxièmement, l'équipe de recherche a comparé ActFound avec des outils de calcul de perturbation d'énergie libre (FEP) pour démontrer la valeur pratique d'ActFound dans l'optimisation des petites molécules de plomb.

Les résultats expérimentaux montrent qu'ActFound a le potentiel d'être un outil alternatif au FEP+.

Plus précisément, ActFound a surpassé FEP+ tout en utilisant seulement 4,8 molécules en moyenne pour le réglage fin. Actfound peut prédire l'activité de plus de 10 000 composés en une seconde, mais FEP nécessite 24 à 48 heures GPU pour calculer la différence d'activité relative d'une paire de molécules.

Enfin, les chercheurs ont démontré les performances exceptionnelles d’un modèle de prédiction de la réponse aux médicaments anticancéreux pré-entraîné à l’aide d’ActFound.

Les résultats expérimentaux montrent que le modèle de prédiction de la réponse aux médicaments anticancéreux initialisé avec ActFound présente d'excellentes performances sans réglage fin, prouvant ainsi le large potentiel d'application d'ActFound.


Dans l’ensemble, ces résultats expérimentaux démontrent qu’ActFound, en tant que modèle d’activité biologique de base, non seulement fonctionne bien dans diverses tâches de prédiction de l’activité biologique, mais montre également ses perspectives d’application dans d’autres aspects du développement et de la découverte de médicaments.

Ces résultats apportent une solution efficace aux limites des méthodes existantes de prédiction de l’activité biologique, tout en ouvrant de nouvelles possibilités pour accélérer le processus de développement de médicaments.

1

À propos de l'auteur

Le premier auteur de l'article, Feng Bin, est titulaire d'une maîtrise de l'École d'informatique de l'Université de Pékin, et son mentor était le professeur Zhang Ming. Wang Sheng et Xiao Zhiping sont également anciens élèves du Département d'informatique de l'École d'information de l'Université de Pékin et collaborent avec l'équipe du professeur Zhang Ming depuis de nombreuses années. L’équipe de l’Université de Pékin comprend également le doctorant Liu Zequn et l’étudiant à la maîtrise Srbuhi Mirzoyan.

Tous les auteurs sont Bin Feng, Zequn Liu, Nanlan Huang, Zhiping Xiao#, Haomiao Zhang, Srbuhi Mirzoyan, Hanwen Xu, Jiaran Hao, Yinghui Xu, Ming Zhang#, Sheng Wang# (# est l'auteur correspondant).

Références :

https://www.nature.com/articles/s42256-024-00876-w