berita

Fakultas Ilmu Komputer Universitas Peking terdaftar dalam jurnal AI internasional teratas! Tim Profesor Zhang Ming melatih model dasar aktivitas biologis dengan 1,6 juta data

2024-08-16

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Artikel ini dicetak ulang di Xinzhiyuan

Bioaktivitas molekul kecil memainkan peran penting dalam pengembangan obat.

Aktivitas biologis mencerminkan sejauh mana molekul kecil berinteraksi dengan target tertentu (seperti protein, reseptor, atau enzim) dalam sistem biologis dan menyebabkan respons biologis yang terukur. Ini merupakan faktor penting dalam menyaring calon obat potensial, mengoptimalkan struktur molekul , dan memprediksi kemanjuran obat dan Indikator utama keamanan.

Prediksi dan evaluasi aktivitas biologis yang akurat tidak hanya dapat mempersingkat waktu penyaringan obat secara signifikan dan mengurangi biaya penelitian dan pengembangan, namun juga membantu peneliti memahami mekanisme kerja obat, sehingga mempercepat proses pengembangan obat baru dan menghadirkan pilihan pengobatan yang lebih efektif dan aman bagi masyarakat. pasien.

Di bidang prediksi aktivitas biologis, metode perhitungan berbasis fisika yang ada seperti gangguan energi bebas (FEP) dapat memberikan prediksi yang akurat, namun metode tersebut menghadapi masalah biaya komputasi yang tinggi.

Dalam beberapa tahun terakhir, metode pembelajaran mendalam telah menunjukkan potensi besar, tetapi menghadapi masalah terbatasnya data eksperimen dan ketidakcocokan berbagai aktivitas biologis yang diukur secara eksperimental.

Di masa lalu, para peneliti telah menggunakan teknik pembelajaran mesin tingkat lanjut seperti pembelajaran transfer, pembelajaran multi-tugas, dan pembelajaran meta, tetapi mereka hanya melatih jenis tertentu (seperti Ki, Kd, ​​​​IC50) dan data aktivitas biologis dalam konsentrasi molar. unit, sehingga menyulitkan model untuk menggeneralisasi tugas memprediksi aktivitas biologis dengan jenis yang belum pernah dilihat sebelumnya (misalnya EC50) atau unit (misalnya '%').

Untuk mengatasi tantangan ini, tim Profesor Zhang Ming dari Fakultas Ilmu Komputer di Universitas Peking, bersama dengan Asisten Profesor Wang Sheng dari Universitas Washington, rekan pascadoktoral Xiao Zhiping, dan Profesor Xu Yinghui dari Universitas Fudan, mengusulkan metode yang dilatih pada 1.6 juta data aktivitas biologis yang diukur secara eksperimental dalam database ChEMBL. Model dasar aktivitas biologis—ActFound.

Saat ini, karya ini telah dipublikasikan di jurnal kecerdasan buatan terkemuka dunia, Nature Machine Intelligence (disingkat NMI, faktor dampak terbaru adalah 18,8).


Tautan kertas https://www.nature.com/articles/s42256-024-00876-w

Bagikan tautan: https://rdcu.be/dQUav

Data pelatihan, kode, dan model ActFound bersifat open source: https://github.com/BFeng14/ActFound

Ide inti ActFound adalah menggunakan metode pembelajaran berpasangan untuk mempelajari perbedaan aktivitas biologis relatif antara dua molekul kecil dalam rangkaian eksperimen yang sama, sehingga menghindari masalah ketidakcocokan aktivitas biologis antara eksperimen yang berbeda. Model ini juga menggunakan teknologi meta-learning untuk membantu model meningkatkan akurasi prediksi hanya dengan sejumlah kecil data.

Para peninjau percaya bahwa kombinasi pembelajaran berpasangan dan pembelajaran meta tidak hanya berhasil memecahkan masalah inti prediksi aktivitas, namun juga menginspirasi pengembangan bidang lainnya.

Pada enam kumpulan data tolok ukur evaluasi bioaktivitas, ActFound menunjukkan kemampuan prediksi yang akurat dan kemampuan generalisasi yang kuat di berbagai jenis bioaktivitas dan perancah molekuler.

Penelitian ini juga menunjukkan bahwa ActFound dapat berfungsi sebagai alternatif alat komputasi berbasis fisika terkemuka FEP+, mencapai kinerja yang sebanding hanya dengan menggunakan sejumlah kecil data untuk penyesuaian.


Untuk memverifikasi kinerja dan nilai praktis model ActFound, tim peneliti melakukan serangkaian eksperimen pada tugas prediksi aktivitas biologis.

Pertama, para peneliti mengevaluasi kinerja ActFound pada enam kumpulan data yang berbeda. ActFound mengungguli kesembilan metode komparatif pada ChEMBL, BindingDB, FS-Mol, pQSAR-ChEMBL, Davis dan Kiba, menunjukkan kinerjanya dalam penerapan yang luas di hampir semua jenis eksperimen.

Dalam hal prediksi bioaktivitas lintas domain, ActFound juga melampaui metode canggih yang ada dan menunjukkan kemampuan generalisasi yang baik pada berbagai jenis data bioaktivitas.


Kedua, tim peneliti membandingkan ActFound dengan alat penghitungan gangguan energi bebas (FEP) untuk menunjukkan nilai praktis ActFound dalam optimalisasi molekul kecil timbal.

Hasil eksperimen menunjukkan bahwa ActFound berpotensi sebagai alat alternatif selain FEP+.

Secara khusus, ActFound mengungguli FEP+ dengan hanya menggunakan rata-rata 4,8 molekul untuk penyesuaian. Actfound dapat memprediksi aktivitas lebih dari 10.000 senyawa dalam satu detik, tetapi FEP memerlukan 24-48 jam GPU untuk menghitung perbedaan aktivitas relatif dari sepasang molekul.

Terakhir, para peneliti mendemonstrasikan kinerja luar biasa dari model prediksi respons obat kanker yang telah dilatih sebelumnya menggunakan ActFound.

Hasil eksperimen menunjukkan bahwa model prediksi respons obat kanker yang diinisialisasi dengan ActFound memiliki kinerja yang sangat baik tanpa penyesuaian, yang semakin membuktikan potensi penerapan ActFound secara luas.


Secara keseluruhan, hasil eksperimen ini menunjukkan bahwa ActFound, sebagai model aktivitas biologis dasar, tidak hanya berkinerja baik dalam berbagai tugas prediksi aktivitas biologis, namun juga menunjukkan prospek penerapannya dalam aspek lain dari pengembangan dan penemuan obat.

Temuan ini memberikan solusi efektif terhadap keterbatasan metode prediksi aktivitas biologis yang ada, sekaligus membuka kemungkinan baru untuk mempercepat proses pengembangan obat.

1

Tentang penulis

Penulis pertama makalah ini, Feng Bin, lulus dengan gelar master dari Fakultas Ilmu Komputer, Universitas Peking, dan mentornya adalah Profesor Zhang Ming. Wang Sheng dan Xiao Zhiping juga merupakan alumni Departemen Ilmu Komputer, Sekolah Informasi, Universitas Peking, dan telah berkolaborasi dengan tim Profesor Zhang Ming selama bertahun-tahun. Anggota tim Universitas Peking juga termasuk mahasiswa doktoral Liu Zequn dan mahasiswa master Srbuhi Mirzoyan.

Semua penulis adalah Bin Feng, Zequn Liu, Nanlan Huang, Zhiping Xiao#, Haomiao Zhang, Srbuhi Mirzoyan, Hanwen Xu, Jiaran Hao, Yinghui Xu, Ming Zhang#, Sheng Wang# (# adalah penulis koresponden).

Referensi:

https://www.nature.com/articles/s42256-024-00876-w