uutiset

Peking University School of Computer Science on listattu kansainvälisen AI-lehden kärkeen! Professori Zhang Mingin tiimi koulutti biologisen toiminnan perusmallin 1,6 miljoonalla tiedolla

2024-08-16

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Artikkeli on painettu uusintapainos kielellä Xinzhiyuan

Pienmolekyylisellä bioaktiivisuudella on ratkaiseva rooli lääkekehityksessä.

Biologinen aktiivisuus heijastaa sitä, missä määrin pieni molekyyli on vuorovaikutuksessa tietyn kohteen (kuten proteiinin, reseptorin tai entsyymin) kanssa biologisessa järjestelmässä ja aiheuttaa mitattavissa olevan biologisen vasteen. Se on tärkeä tekijä mahdollisten lääkekandidaattien seulonnassa ja molekyylirakenteiden optimoinnissa sekä lääkkeiden tehokkuuden ennustaminen ja turvallisuuden keskeiset indikaattorit.

Biologisen aktiivisuuden tarkka ennustaminen ja arviointi voi paitsi lyhentää merkittävästi lääkkeiden seulonta-aikaa ja vähentää tutkimus- ja kehityskustannuksia, myös auttaa tutkijoita ymmärtämään lääkkeiden vaikutusmekanismia, mikä nopeuttaa uusien lääkkeiden kehitysprosessia ja tuo tehokkaampia ja turvallisempia hoitovaihtoehtoja. potilaita.

Biologisen aktiivisuuden ennustamisen alalla olemassa olevat fysiikkaan perustuvat laskentamenetelmät, kuten vapaan energian häiriö (FEP), voivat antaa tarkkoja ennusteita, mutta ne kohtaavat korkeiden laskentakustannusten ongelman.

Viime vuosina syväoppimismenetelmät ovat osoittaneet suurta potentiaalia, mutta niiden ongelmana on rajallinen kokeellinen data ja erilaisten kokeellisesti mitattujen biologisten aktiivisuuksien yhteensopimattomuus.

Aiemmin tutkijat ovat käyttäneet edistyneitä koneoppimistekniikoita, kuten siirto-oppimista, monitehtäväoppimista ja meta-oppimista, mutta he ovat harjoittaneet vain tietyntyyppisiä (kuten Ki, Kd, ​​​​IC50) ja biologisen aktiivisuuden tietoja molaarisessa pitoisuudessa. yksiköitä, mikä vaikeuttaa mallin yleistämistä tehtävään ennustaa biologista aktiivisuutta ennennäkemättömillä tyypeillä (esim. EC50) tai yksiköillä (esim. '%).

Tämän haasteen ratkaisemiseksi professori Zhang Mingin tiimi Pekingin yliopiston tietojenkäsittelytieteen korkeakoulusta yhdessä Washingtonin yliopiston apulaisprofessori Wang Shengin, tohtoritutkinnon suorittaneen Xiao Zhipingin ja Fudanin yliopiston professori Xu Yinghuin kanssa ehdottivat menetelmää, joka on koulutettu 1.6. miljoonaa kokeellisesti mitattua biologisen aktiivisuuden dataa ChEMBL-tietokannassa. Biologisen aktiivisuuden perusmalli — ActFound.

Tällä hetkellä tämä teos on julkaistu maailman parhaimmassa tekoälylehdessä Nature Machine Intelligence (lyhyesti NMI, viimeisin vaikutuskerroin on 18,8).


Paperilinkki https://www.nature.com/articles/s42256-024-00876-w

Jaa linkki: https://rdcu.be/dQUav

ActFoundin harjoitustiedot, koodi ja mallit ovat olleet avoimen lähdekoodin: https://github.com/BFeng14/ActFound

ActFoundin ydinideana on käyttää parillista oppimismenetelmää kahden pienen molekyylin suhteellisen biologisen aktiivisuuden eron oppimiseen samassa koesarjassa, jolloin vältetään biologisten aktiivisuuksien yhteensopimattomuusongelma eri kokeiden välillä. Malli käyttää myös meta-oppimistekniikkaa, joka auttaa mallia parantamaan ennusteiden tarkkuutta vain pienellä tietomäärällä.

Arvioijat uskovat, että pari-oppimisen ja meta-oppimisen yhdistelmä ei ainoastaan ​​ratkaise menestyksekkäästi aktiivisuuden ennustamisen ydinongelmaa, vaan innostaa myös muiden alojen kehitystä.

Kuudessa bioaktiivisuuden arvioinnin vertailutietojoukossa ActFound osoitti tarkat ennustusominaisuudet ja vahvat yleistysominaisuudet eri bioaktiivisuustyypeissä ja molekyylirakenteissa.

Tutkimus osoittaa myös, että ActFound voi toimia vaihtoehtona johtavalle fysiikkapohjaiselle laskentatyökalulle FEP+, joka saavuttaa vertailukelpoisen suorituskyvyn käyttämällä vain pientä datamäärää hienosäätöön.


ActFound-mallin suorituskyvyn ja käytännön arvon tarkistamiseksi tutkimusryhmä suoritti sarjan kokeita biologisen aktiivisuuden ennustetehtävistä.

Ensinnäkin tutkijat arvioivat ActFoundin suorituskyvyn kuudessa eri tietojoukossa. ActFound ylitti kaikki yhdeksän vertailumenetelmää ChEMBL:n, BindingDB:n, FS-Molin, pQSAR-ChEMBL:n, Davisin ja Kiban osalta, mikä osoitti sen suorituskyvyn laajassa sovellettavuuden lähes kaikentyyppisissä kokeissa.

Toimialueiden välisessä bioaktiivisuuden ennustamisessa ActFound ylittää myös nykyiset huipputekniikan menetelmät ja osoittaa hyviä yleistyskykyjä erityyppisissä bioaktiivisuustiedoissa.


Toiseksi tutkimusryhmä vertasi ActFoundia vapaan energian häiriöiden (FEP) laskentatyökaluihin osoittaakseen ActFoundin käytännön arvon lyijyn pienmolekyylien optimoinnissa.

Kokeet osoittavat, että ActFoundilla on potentiaalia vaihtoehtoisena työkaluna FEP+:lle.

Tarkemmin sanottuna ActFound ylitti FEP+:n, kun se käytti hienosäätöön vain keskimäärin 4,8 molekyyliä. Actfound voi ennustaa yli 10 000 yhdisteen aktiivisuuden yhdessä sekunnissa, mutta FEP vaatii 24–48 GPU tuntia laskeakseen molekyyliparin suhteellisen aktiivisuuseron.

Lopuksi tutkijat osoittivat ActFoundilla esiopetetun syöpälääkevasteen ennustusmallin erinomaisen suorituskyvyn.

Kokeelliset tulokset osoittavat, että ActFoundilla alustettu syöpälääkevasteen ennustemalli toimii erinomaisesti ilman hienosäätöä, mikä todistaa entisestään ActFoundin laajan sovelluspotentiaalin.


Kaiken kaikkiaan nämä kokeelliset tulokset osoittavat, että ActFound, joka on biologisen aktiivisuuden perusmalli, ei ainoastaan ​​suoriudu hyvin erilaisissa biologisen aktiivisuuden ennustetehtävissä, vaan näyttää myös sen soveltamismahdollisuudet muissa lääkekehityksen ja -kehityksen näkökohdissa.

Nämä havainnot tarjoavat tehokkaan ratkaisun olemassa olevien biologisen aktiivisuuden ennustemenetelmien rajoituksiin ja avaavat samalla uusia mahdollisuuksia nopeuttaa lääkekehitysprosessia.

1

Tietoja kirjoittajasta

Paperin ensimmäinen kirjoittaja Feng Bin valmistui maisterin tutkinnosta Pekingin yliopiston tietojenkäsittelytieteiden korkeakoulusta, ja hänen mentorinsa oli professori Zhang Ming. Wang Sheng ja Xiao Zhiping ovat myös Pekingin yliopiston Information Schoolin tietojenkäsittelytieteen laitoksen alumneja, ja he ovat tehneet yhteistyötä professori Zhang Mingin tiimin kanssa useiden vuosien ajan. Pekingin yliopiston tiimiin kuuluvat myös tohtoriopiskelija Liu Zequn ja maisteriopiskelija Srbuhi Mirzoyan.

Kaikki kirjoittajat ovat Bin Feng, Zequn Liu, Nanlan Huang, Zhiping Xiao#, Haomiao Zhang, Srbuhi Mirzoyan, Hanwen Xu, Jiaran Hao, Yinghui Xu, Ming Zhang#, Sheng Wang# (# on vastaava kirjoittaja).

Viitteet:

https://www.nature.com/articles/s42256-024-00876-w