notícias

A Escola de Ciência da Computação da Universidade de Pequim está listada na principal revista internacional de IA! A equipe do professor Zhang Ming treinou um modelo básico de atividade biológica com 1,6 milhão de dados

2024-08-16

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


O artigo foi reimpresso em Xinzhiyuan

A bioatividade de moléculas pequenas desempenha um papel crucial no desenvolvimento de medicamentos.

A atividade biológica reflete o grau em que uma pequena molécula interage com um alvo específico (como uma proteína, receptor ou enzima) num sistema biológico e provoca uma resposta biológica mensurável. É um fator importante na triagem de potenciais candidatos a medicamentos, otimizando estruturas moleculares. e previsão da eficácia dos medicamentos e indicadores-chave de segurança.

A previsão e avaliação precisas da atividade biológica podem não apenas reduzir significativamente o tempo de triagem de medicamentos e reduzir os custos de pesquisa e desenvolvimento, mas também ajudar os pesquisadores a compreender o mecanismo de ação dos medicamentos, acelerando assim o processo de desenvolvimento de novos medicamentos e trazendo opções de tratamento mais eficazes e seguras para pacientes.

No campo da previsão da atividade biológica, os métodos de cálculo existentes baseados na física, como a perturbação de energia livre (FEP), podem fornecer previsões precisas, mas enfrentam o problema do alto custo computacional.

Nos últimos anos, os métodos de aprendizagem profunda têm mostrado grande potencial, mas enfrentam o problema de dados experimentais limitados e incompatibilidade de diferentes atividades biológicas medidas experimentalmente.

No passado, os pesquisadores usaram técnicas avançadas de aprendizado de máquina, como aprendizagem por transferência, aprendizagem multitarefa e meta-aprendizagem, mas treinaram apenas em tipos específicos (como Ki, Kd, ​​​​IC50) e dados de atividade biológica em concentração molar. unidades, tornando difícil a generalização do modelo para a tarefa de prever a atividade biológica com tipos nunca antes vistos (por exemplo, EC50) ou unidades (por exemplo, '%').

Para resolver este desafio, a equipe do professor Zhang Ming da Escola de Ciência da Computação da Universidade de Pequim, juntamente com o professor assistente Wang Sheng da Universidade de Washington, o pós-doutorado Xiao Zhiping e o professor Xu Yinghui da Universidade Fudan, propuseram um método treinado em 1.6 milhões de dados de atividade biológica medidos experimentalmente no banco de dados ChEMBL. O modelo básico de atividade biológica —— ActFound.

Atualmente, este trabalho foi publicado na principal revista de inteligência artificial do mundo, Nature Machine Intelligence (abreviadamente NMI, o fator de impacto mais recente é 18,8).


Link do artigo https://www.nature.com/articles/s42256-024-00876-w

Link de compartilhamento: https://rdcu.be/dQUav

Os dados, códigos e modelos de treinamento do ActFound são de código aberto: https://github.com/BFeng14/ActFound

A ideia central do ActFound é usar um método de aprendizagem pareado para aprender a diferença relativa de atividade biológica entre duas pequenas moléculas no mesmo conjunto de experimentos, evitando assim o problema de incompatibilidade de atividades biológicas entre diferentes experimentos. O modelo também usa tecnologia de meta-aprendizado para ajudar o modelo a melhorar a precisão da previsão com apenas uma pequena quantidade de dados.

Os revisores acreditam que a combinação de aprendizagem em pares e meta-aprendizagem não só resolve com sucesso o problema central da previsão de atividades, mas também inspira o desenvolvimento de outros campos.

Em seis conjuntos de dados de referência de avaliação de bioatividade, o ActFound demonstrou capacidades de previsão precisas e fortes capacidades de generalização em diferentes tipos de bioatividade e estruturas moleculares.

A pesquisa também mostra que o ActFound pode servir como uma alternativa à ferramenta líder de computação baseada em física FEP+, alcançando desempenho comparável usando apenas uma pequena quantidade de dados para ajuste fino.


Para verificar o desempenho e o valor prático do modelo ActFound, a equipe de pesquisa conduziu uma série de experimentos em tarefas de previsão de atividade biológica.

Primeiro, os pesquisadores avaliaram o desempenho do ActFound em seis conjuntos de dados diferentes. O ActFound superou todos os nove métodos comparativos em ChEMBL, BindingDB, FS-Mol, pQSAR-ChEMBL, Davis e Kiba, demonstrando seu desempenho em ampla aplicabilidade em quase todos os tipos de experimentos.

Em termos de previsão de bioatividade entre domínios, o ActFound também supera os métodos de última geração existentes e demonstra boas capacidades de generalização em diferentes tipos de dados de bioatividade.


Em segundo lugar, a equipe de pesquisa comparou o ActFound com ferramentas de cálculo de perturbação de energia livre (FEP) para demonstrar o valor prático do ActFound na otimização de pequenas moléculas de chumbo.

Resultados experimentais mostram que o ActFound tem potencial como uma ferramenta alternativa ao FEP+.

Especificamente, o ActFound superou o FEP+ ao usar apenas uma média de 4,8 moléculas para ajuste fino. Actfound pode prever a atividade de mais de 10.000 compostos em um segundo, mas o FEP requer 24-48 horas de GPU para calcular a diferença relativa de atividade de um par de moléculas.

Finalmente, os pesquisadores demonstraram o excelente desempenho de um modelo de previsão de resposta a medicamentos contra o câncer pré-treinado usando o ActFound.

Resultados experimentais mostram que o modelo de previsão de resposta a medicamentos contra o câncer inicializado com ActFound tem excelente desempenho sem ajuste fino, comprovando ainda mais o amplo potencial de aplicação do ActFound.


No geral, estes resultados experimentais demonstram que o ActFound, como modelo básico de atividade biológica, não só tem um bom desempenho em várias tarefas de previsão de atividade biológica, mas também mostra as suas perspectivas de aplicação em outros aspectos do desenvolvimento e descoberta de medicamentos.

Estas descobertas fornecem uma solução eficaz para as limitações dos métodos existentes de previsão da atividade biológica, ao mesmo tempo que abrem novas possibilidades para acelerar o processo de desenvolvimento de medicamentos.

1

Sobre o autor

O primeiro autor do artigo, Feng Bin, formou-se com mestrado pela Escola de Ciência da Computação da Universidade de Pequim, e seu mentor foi o professor Zhang Ming. Wang Sheng e Xiao Zhiping também são ex-alunos do Departamento de Ciência da Computação da Escola de Informação da Universidade de Pequim e colaboram com a equipe do professor Zhang Ming há muitos anos. Os membros da equipe da Universidade de Pequim também incluem o estudante de doutorado Liu Zequn e o estudante de mestrado Srbuhi Mirzoyan.

Todos os autores são Bin Feng, Zequn Liu, Nanlan Huang, Zhiping Xiao#, Haomiao Zhang, Srbuhi Mirzoyan, Hanwen Xu, Jiaran Hao, Yinghui Xu, Ming Zhang#, Sheng Wang# (# é o autor correspondente).

Referências:

https://www.nature.com/articles/s42256-024-00876-w