소식

북경대학교 컴퓨터과학과가 최고의 국제 AI 저널에 등재되었습니다! Zhang Ming 교수팀은 160만 개의 데이터로 생물학적 활동의 기본 모델을 훈련했습니다.

2024-08-16

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


이 기사는 Xinzhiyuan에 재인쇄되었습니다.

소분자 생체활성은 약물 개발에 중요한 역할을 합니다.

생물학적 활성은 소분자가 생물학적 시스템의 특정 표적(예: 단백질, 수용체 또는 효소)과 상호 작용하여 측정 가능한 생물학적 반응을 일으키는 정도를 반영하며 잠재적인 약물 후보를 선별하고 분자 구조를 최적화하는 데 중요한 요소입니다. , 약물 효능 및 보안의 주요 지표를 예측합니다.

생물학적 활성의 정확한 예측 및 평가는 약물 스크리닝 시간을 크게 단축하고 연구 개발 비용을 절감할 수 있을 뿐만 아니라 연구자가 약물 작용 메커니즘을 이해하는 데 도움을 주어 신약 개발 과정을 가속화하고 환자에게 보다 효과적이고 안전한 치료 옵션을 제공할 수 있습니다. 환자.

생물학적 활동 예측 분야에서는 자유 에너지 섭동(FEP)과 같은 기존의 물리학 기반 계산 방법을 사용하면 정확한 예측이 가능하지만 계산 비용이 많이 든다는 문제에 직면해 있습니다.

최근 몇 년 동안 딥러닝 방법은 큰 잠재력을 보여주었지만 제한된 실험 데이터와 실험적으로 측정된 다양한 생물학적 활동의 비호환성 문제에 직면해 있습니다.

과거 연구자들은 전이학습(transfer learning), 다중작업학습(multi-task learning), 메타러닝(meta-learning) 등 고급 기계학습 기법을 사용해왔지만 특정 유형(Ki, Kd, ​​IC50 등)과 몰농도의 생물학적 활성 데이터만 훈련했다. 이전에 본 적이 없는 유형(예: EC50) 또는 단위(예: '%')를 사용하여 모델이 생물학적 활동을 예측하는 작업을 일반화하기가 어렵습니다.

이 문제를 해결하기 위해 북경대학교 컴퓨터과학부 Zhang Ming 교수팀은 워싱턴대학교 Wang Sheng 조교수, Xiao Zhiping 박사후 연구원, 푸단대학교 Xu Yinghui 교수와 함께 1.6으로 훈련된 방법을 제안했습니다. ChEMBL 데이터베이스에서 실험적으로 측정된 백만 개의 생물학적 활동 데이터 ——ActFound.

현재 이 연구는 세계 최고 인공지능 저널 네이처 머신 인텔리전스(NMI, 줄여서 NMI, 최신 임팩트 팩터 18.8)에 게재됐다.


논문 링크 https://www.nature.com/articles/s42256-024-00876-w

공유 링크: https://rdcu.be/dQUav

ActFound의 훈련 데이터, 코드 및 모델은 오픈 소스입니다: https://github.com/BFeng14/ActFound

ActFound의 핵심 아이디어는 쌍을 이루는 학습 방법을 사용하여 동일한 실험 세트에서 두 개의 소분자 간의 상대적 생물학적 활성 차이를 학습함으로써 서로 다른 실험 간의 생물학적 활성 비호환 문제를 피하는 것입니다. 또한 모델은 메타러닝 기술을 사용하여 적은 양의 데이터만으로 모델의 예측 정확도를 향상시킬 수 있도록 도와줍니다.

리뷰어들은 쌍별 학습과 메타 학습의 결합이 활동 예측의 핵심 문제를 성공적으로 해결할 뿐만 아니라 다른 분야의 발전에도 영감을 준다고 믿습니다.

6개의 생체활성 평가 벤치마크 데이터 세트에서 ActFound는 다양한 생체활성 유형과 분자 비계에 걸쳐 정확한 예측 기능과 강력한 일반화 기능을 입증했습니다.

또한 이 연구는 ActFound가 선도적인 물리 기반 컴퓨팅 도구인 FEP+의 대안이 되어 미세 조정을 위해 소량의 데이터만 사용하여 비슷한 성능을 달성할 수 있음을 보여줍니다.


연구팀은 ActFound 모델의 성능과 실용성을 검증하기 위해 생물학적 활성 예측 과제에 대한 일련의 실험을 진행했다.

첫째, 연구원들은 6개의 서로 다른 데이터 세트에서 ActFound의 성능을 평가했습니다. ActFound는 ChEMBL, BindingDB, FS-Mol, pQSAR-ChEMBL, Davis 및 Kiba에 대한 9가지 비교 방법 모두를 능가하여 거의 모든 유형의 실험에서 폭넓은 적용 가능성을 입증했습니다.

도메인 간 생체 활성 예측 측면에서 ActFound는 기존의 최첨단 방법을 능가하며 다양한 유형의 생체 활성 데이터에 대한 우수한 일반화 기능을 보여줍니다.


둘째, 연구팀은 ActFound를 자유 에너지 섭동(FEP) 계산 도구와 비교하여 납 소분자 최적화에 있어 ActFound의 실질적인 가치를 입증했습니다.

실험 결과는 ActFound가 FEP+의 대체 도구로서의 잠재력을 가지고 있음을 보여줍니다.

특히 ActFound는 미세 조정에 평균 4.8개의 분자만 사용하면서 FEP+보다 성능이 뛰어났습니다. Actfound는 1초에 10,000개 이상의 화합물의 활성을 예측할 수 있지만 FEP에서는 한 쌍의 분자의 상대적 활성 차이를 계산하는 데 24~48 GPU 시간이 필요합니다.

마지막으로 연구원들은 ActFound를 사용하여 사전 훈련된 항암제 반응 예측 모델의 뛰어난 성능을 입증했습니다.

실험 결과, ActFound로 초기화된 항암제 반응 예측 모델은 미세 조정 없이도 우수한 성능을 보여 ActFound의 폭넓은 활용 가능성을 더욱 입증했습니다.


전반적으로, 이러한 실험 결과는 기본 생물학적 활성 모델인 ActFound가 다양한 생물학적 활성 예측 작업에서 우수한 성능을 발휘할 뿐만 아니라 약물 개발 및 발견의 다른 측면에서도 응용 가능성을 보여줍니다.

이러한 발견은 기존 생물학적 활성 예측 방법의 한계에 대한 효과적인 솔루션을 제공하는 동시에 약물 개발 프로세스를 가속화할 수 있는 새로운 가능성을 열어줍니다.

1

저자 소개

논문의 제1저자인 Feng Bin은 북경대학교 컴퓨터공학과에서 석사학위를 취득했으며, 그의 멘토는 Zhang Ming 교수였습니다. Wang Sheng과 Xiao Zhiping은 북경대학교 정보학부 컴퓨터과학과 출신이며 수년 동안 Zhang Ming 교수 팀과 협력해 왔습니다. Peking University 팀원에는 박사 과정 학생 Liu Zequn과 석사 과정 학생 Srbuhi Mirzoyan도 포함되어 있습니다.

모든 저자는 Bin Feng, Zequn Liu, Nanlan Huang, Zhiping Xiao#, Haomiao Zhang, Srbuhi Mirzoyan, Hanwen Xu, Jiaran Hao, Yinghui Xu, Ming Zhang#, Sheng Wang#입니다(#은 교신 저자입니다).

참고자료:

https://www.nature.com/articles/s42256-024-00876-w