Nachricht

Die Peking University School of Computer Science ist in der führenden internationalen KI-Zeitschrift gelistet! Das Team von Professor Zhang Ming trainierte ein grundlegendes Modell der biologischen Aktivität mit 1,6 Millionen Daten

2024-08-16

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Der Artikel ist in Xinzhiyuan abgedruckt

Die Bioaktivität kleiner Moleküle spielt eine entscheidende Rolle bei der Arzneimittelentwicklung.

Die biologische Aktivität spiegelt den Grad wider, in dem ein kleines Molekül mit einem bestimmten Ziel (z. B. einem Protein, Rezeptor oder Enzym) in einem biologischen System interagiert und eine messbare biologische Reaktion hervorruft. Sie ist ein wichtiger Faktor beim Screening potenzieller Arzneimittelkandidaten und optimiert die molekularen Strukturen und Vorhersage der Arzneimittelwirksamkeit und Schlüsselindikatoren für die Sicherheit.

Eine genaue Vorhersage und Bewertung der biologischen Aktivität kann nicht nur die Zeit für das Screening von Arzneimitteln erheblich verkürzen und Forschungs- und Entwicklungskosten senken, sondern auch dazu beitragen, dass Forscher den Wirkungsmechanismus von Arzneimitteln verstehen, wodurch der Entwicklungsprozess neuer Arzneimittel beschleunigt wird und wirksamere und sicherere Behandlungsmöglichkeiten entstehen Patienten.

Im Bereich der Vorhersage biologischer Aktivität können bestehende physikbasierte Berechnungsmethoden wie die Störung der freien Energie (FEP) genaue Vorhersagen liefern, stehen jedoch vor dem Problem hoher Rechenkosten.

Deep-Learning-Methoden haben in den letzten Jahren großes Potenzial gezeigt, stehen jedoch vor dem Problem begrenzter experimenteller Daten und der Inkompatibilität verschiedener experimentell gemessener biologischer Aktivitäten.

In der Vergangenheit verwendeten Forscher fortschrittliche Techniken des maschinellen Lernens wie Transferlernen, Multitasking-Lernen und Meta-Lernen, trainierten jedoch nur auf bestimmte Typen (wie Ki, Kd, ​​​​IC50) und biologische Aktivitätsdaten in molarer Konzentration Einheiten, was eine Verallgemeinerung des Modells auf die Aufgabe der Vorhersage biologischer Aktivität mit noch nie zuvor gesehenen Typen (z. B. EC50) oder Einheiten (z. B. „%“) erschwert.

Um diese Herausforderung zu lösen, schlug das Team von Professor Zhang Ming von der School of Computer Science der Universität Peking zusammen mit Assistenzprofessor Wang Sheng von der University of Washington, Postdoktorand Xiao Zhiping und Professor Xu Yinghui von der Fudan-Universität eine auf 1.6 trainierte Methode vor Millionen experimentell gemessener biologischer Aktivitätsdaten in der ChEMBL-Datenbank. Das Basismodell der biologischen Aktivität – ActFound.

Derzeit wurde diese Arbeit in der weltweit führenden Fachzeitschrift für künstliche Intelligenz Nature Machine Intelligence (kurz NMI, der neueste Impact-Faktor liegt bei 18,8) veröffentlicht.


Papierlink https://www.nature.com/articles/s42256-024-00876-w

Link zum Teilen: https://rdcu.be/dQUav

Die Trainingsdaten, der Code und die Modelle von ActFound sind Open Source: https://github.com/BFeng14/ActFound

Die Kernidee von ActFound besteht darin, mithilfe einer gepaarten Lernmethode den relativen biologischen Aktivitätsunterschied zwischen zwei kleinen Molekülen in derselben Versuchsreihe zu lernen und so das Problem der Inkompatibilität biologischer Aktivitäten zwischen verschiedenen Experimenten zu vermeiden. Das Modell nutzt außerdem Meta-Learning-Technologie, um die Vorhersagegenauigkeit des Modells mit nur einer kleinen Datenmenge zu verbessern.

Die Gutachter glauben, dass die Kombination aus paarweisem Lernen und Meta-Lernen nicht nur das Kernproblem der Aktivitätsvorhersage erfolgreich löst, sondern auch die Entwicklung anderer Bereiche inspiriert.

Anhand von sechs Benchmark-Datensätzen zur Bewertung der Bioaktivität demonstrierte ActFound genaue Vorhersagefähigkeiten und starke Generalisierungsfähigkeiten über verschiedene Arten von Bioaktivität und Molekülgerüsten hinweg.

Die Forschung zeigt auch, dass ActFound als Alternative zum führenden physikbasierten Rechentool FEP+ dienen kann und eine vergleichbare Leistung mit nur einer kleinen Datenmenge zur Feinabstimmung erreicht.


Um die Leistung und den praktischen Wert des ActFound-Modells zu überprüfen, führte das Forschungsteam eine Reihe von Experimenten zu Aufgaben zur Vorhersage biologischer Aktivität durch.

Zunächst bewerteten die Forscher die Leistung von ActFound anhand von sechs verschiedenen Datensätzen. ActFound übertraf alle neun Vergleichsmethoden bei ChEMBL, BindingDB, FS-Mol, pQSAR-ChEMBL, Davis und Kiba und demonstrierte seine Leistung in Bezug auf die breite Anwendbarkeit in fast allen Arten von Experimenten.

Auch im Hinblick auf die domänenübergreifende Bioaktivitätsvorhersage übertrifft ActFound bestehende, hochmoderne Methoden und zeigt gute Generalisierungsfähigkeiten für verschiedene Arten von Bioaktivitätsdaten.


Zweitens verglich das Forschungsteam ActFound mit Berechnungstools für die Störung der freien Energie (FEP), um den praktischen Wert von ActFound bei der Optimierung kleiner Bleimoleküle zu demonstrieren.

Experimentelle Ergebnisse zeigen, dass ActFound das Potenzial als alternatives Tool zu FEP+ hat.

Insbesondere übertraf ActFound FEP+ und verwendete dabei nur durchschnittlich 4,8 Moleküle für die Feinabstimmung. Actfound kann die Aktivität von mehr als 10.000 Verbindungen in einer Sekunde vorhersagen, FEP benötigt jedoch 24–48 GPU-Stunden, um den relativen Aktivitätsunterschied eines Molekülpaares zu berechnen.

Schließlich demonstrierten die Forscher die herausragende Leistung eines mit ActFound vorab trainierten Modells zur Vorhersage der Reaktion auf Krebsmedikamente.

Experimentelle Ergebnisse zeigen, dass das mit ActFound initialisierte Modell zur Vorhersage der Reaktion auf Krebsmedikamente eine hervorragende Leistung ohne Feinabstimmung aufweist, was das breite Anwendungspotenzial von ActFound weiter beweist.


Insgesamt zeigen diese experimentellen Ergebnisse, dass ActFound als grundlegendes Modell der biologischen Aktivität nicht nur bei verschiedenen Aufgaben zur Vorhersage der biologischen Aktivität gute Leistungen erbringt, sondern auch seine Anwendungsaussichten in anderen Aspekten der Arzneimittelentwicklung und -entdeckung zeigt.

Diese Erkenntnisse bieten eine wirksame Lösung für die Einschränkungen bestehender Methoden zur Vorhersage der biologischen Aktivität und eröffnen gleichzeitig neue Möglichkeiten zur Beschleunigung des Arzneimittelentwicklungsprozesses.

1

Über den Autor

Der Erstautor der Arbeit, Feng Bin, schloss sein Studium an der Fakultät für Informatik der Universität Peking mit einem Master ab und sein Mentor war Professor Zhang Ming. Wang Sheng und Xiao Zhiping sind ebenfalls Absolventen des Fachbereichs Informatik der School of Information der Universität Peking und arbeiten seit vielen Jahren mit dem Team von Professor Zhang Ming zusammen. Zu den Teammitgliedern der Peking-Universität gehören auch der Doktorand Liu Zequn und der Masterstudent Srbuhi Mirzoyan.

Alle Autoren sind Bin Feng, Zequn Liu, Nanlan Huang, Zhiping Xiao#, Haomiao Zhang, Srbuhi Mirzoyan, Hanwen Xu, Jiaran Hao, Yinghui Xu, Ming Zhang#, Sheng Wang# (# ist der korrespondierende Autor).

Referenzen:

https://www.nature.com/articles/s42256-024-00876-w