новости

Факультет компьютерных наук Пекинского университета включен в лучший международный журнал по искусственному интеллекту! Команда профессора Чжан Мина обучила базовую модель биологической активности на основе 1,6 миллиона данных.

2024-08-16

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Статья перепечатана в Синьчжиюань.

Биологическая активность малых молекул играет решающую роль в разработке лекарств.

Биологическая активность отражает степень, в которой небольшая молекула взаимодействует с конкретной мишенью (например, белком, рецептором или ферментом) в биологической системе и вызывает измеримый биологический ответ. Это важный фактор при скрининге потенциальных кандидатов на лекарства, оптимизации молекулярных структур. и прогнозирование эффективности лекарств и ключевых показателей безопасности.

Точное прогнозирование и оценка биологической активности может не только значительно сократить время скрининга лекарств и снизить затраты на исследования и разработки, но также помочь исследователям понять механизм действия лекарств, тем самым ускоряя процесс разработки новых лекарств и предлагая более эффективные и безопасные варианты лечения. пациенты.

В области прогнозирования биологической активности существующие методы расчета, основанные на физике, такие как возмущение свободной энергии (FEP), могут давать точные прогнозы, но они сталкиваются с проблемой высоких вычислительных затрат.

В последние годы методы глубокого обучения продемонстрировали большой потенциал, но столкнулись с проблемой ограниченности экспериментальных данных и несовместимости различных экспериментально измеренных биологических активностей.

В прошлом исследователи использовали передовые методы машинного обучения, такие как трансферное обучение, многозадачное обучение и метаобучение, но они обучались только на определенных типах (таких как Ki, Kd, ​​IC50) и данных о биологической активности в молярной концентрации. единиц, что затрудняет обобщение модели для задачи прогнозирования биологической активности с использованием ранее не встречавшихся типов (например, EC50) или единиц (например, «%»).

Чтобы решить эту задачу, команда профессора Чжан Мина из Школы компьютерных наук Пекинского университета вместе с доцентом Ван Шэном из Вашингтонского университета, научным сотрудником Сяо Чжипином и профессором Сюй Инхуэй из Фуданьского университета предложили метод, обученный на 1.6. миллионов экспериментально измеренных данных о биологической активности в базе данных ChEMBL. Базовая модель биологической активности — ActFound.

В настоящее время эта работа опубликована в ведущем в мире журнале по искусственному интеллекту Nature Machine Intelligence (сокращенно NMI, последний импакт-фактор — 18,8).


Ссылка на статью https://www.nature.com/articles/s42256-024-00876-w

Поделиться ссылкой: https://rdcu.be/dQUav

Данные, код и модели обучения ActFound имеют открытый исходный код: https://github.com/BFeng14/ActFound.

Основная идея ActFound заключается в использовании метода парного обучения для изучения относительной разницы в биологической активности между двумя небольшими молекулами в одной и той же серии экспериментов, тем самым избегая проблемы несовместимости биологической активности между различными экспериментами. Модель также использует технологию метаобучения, которая помогает модели повысить точность прогнозирования при использовании лишь небольшого объема данных.

Рецензенты считают, что сочетание парного обучения и метаобучения не только успешно решает основную проблему прогнозирования деятельности, но и стимулирует развитие других областей.

На шести наборах эталонных данных для оценки биоактивности ActFound продемонстрировал возможности точного прогнозирования и сильные возможности обобщения для различных типов биоактивности и молекулярных каркасов.

Исследование также показывает, что ActFound может служить альтернативой ведущему инструменту вычислений на основе физики FEP+, достигая сопоставимой производительности, используя лишь небольшой объем данных для точной настройки.


Чтобы проверить производительность и практическую ценность модели ActFound, исследовательская группа провела серию экспериментов по задачам прогнозирования биологической активности.

Во-первых, исследователи оценили эффективность ActFound на шести различных наборах данных. ActFound превзошел все девять сравнительных методов на ChEMBL, BindingDB, FS-Mol, pQSAR-ChEMBL, Davis и Kiba, продемонстрировав свою эффективность в широком применении практически во всех типах экспериментов.

С точки зрения междоменного прогнозирования биоактивности ActFound также превосходит существующие современные методы и демонстрирует хорошие возможности обобщения различных типов данных о биоактивности.


Во-вторых, исследовательская группа сравнила ActFound с инструментами расчета возмущений свободной энергии (FEP), чтобы продемонстрировать практическую ценность ActFound в оптимизации малых молекул свинца.

Результаты экспериментов показывают, что ActFound потенциально может стать альтернативой FEP+.

В частности, ActFound превзошел FEP+, используя в среднем всего 4,8 молекул для точной настройки. Actfound может предсказать активность более 10 000 соединений за одну секунду, но FEP требует 24-48 часов графического процессора для расчета относительной разницы активности пары молекул.

Наконец, исследователи продемонстрировали выдающуюся эффективность модели прогнозирования реакции на противораковые препараты, предварительно обученной с помощью ActFound.

Результаты экспериментов показывают, что модель прогнозирования реакции на лекарство от рака, инициализированная с помощью ActFound, имеет превосходную производительность без тонкой настройки, что еще раз доказывает широкий потенциал применения ActFound.


В целом, эти экспериментальные результаты показывают, что ActFound, как базовая модель биологической активности, не только хорошо справляется с различными задачами прогнозирования биологической активности, но также показывает перспективы ее применения в других аспектах разработки и открытия лекарств.

Эти результаты обеспечивают эффективное решение ограничений существующих методов прогнозирования биологической активности, а также открывают новые возможности для ускорения процесса разработки лекарств.

1

Об авторе

Первый автор статьи Фэн Бинь окончил Школу компьютерных наук Пекинского университета со степенью магистра, а его наставником был профессор Чжан Мин. Ван Шэн и Сяо Чжипин также являются выпускниками факультета компьютерных наук Школы информации Пекинского университета и уже много лет сотрудничают с командой профессора Чжан Мина. В состав команды Пекинского университета также входят докторант Лю Цзэцюнь и магистрантка Србуи Мирзоян.

Все авторы: Бинь Фэн, Цзэцюнь Лю, Наньлань Хуан, Чжипин Сяо#, Хаомяо Чжан, Србухи Мирзоян, Ханьвэнь Сюй, Цзярань Хао, Инхуэй Сюй, Мин Чжан#, Шэн Ван# (# – автор-переписчик).

Ссылки:

https://www.nature.com/articles/s42256-024-00876-w