ニュース

北京大学コンピューターサイエンス学部が世界トップクラスの AI ジャーナルに掲載されました! Zhang Ming 教授のチームは、160 万のデータを使用して生物活動の基本モデルをトレーニングしました

2024-08-16

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


この記事は新志源に転載されています

低分子の生物活性は、医薬品開発において重要な役割を果たします。

生物学的活性は、小分子が生体系内の特定の標的 (タンパク質、受容体、酵素など) と相互作用し、測定可能な生物学的反応を引き起こす程度を反映しており、潜在的な薬剤候補のスクリーニングや分子構造の最適化において重要な要素です。 、薬効と安全性の重要な指標を予測します。

生物学的活性の正確な予測と評価は、薬剤のスクリーニング時間を大幅に短縮し、研究開発コストを削減するだけでなく、研究者が薬剤の作用機序を理解するのにも役立ち、それによって新薬の開発プロセスが加速され、より効果的で安全な治療選択肢がもたらされます。患者。

生物活性予測の分野では、自由エネルギー摂動(FEP)などの既存の物理ベースの計算手法は正確な予測を提供できますが、計算コストが高いという問題があります。

近年、ディープラーニング手法は大きな可能性を示していますが、限られた実験データと、実験的に測定されたさまざまな生物活性の非互換性の問題に直面しています。

これまで研究者は転移学習、マルチタスク学習、メタ学習などの高度な機械学習技術を使用してきましたが、特定の種類(Ki、Kd、IC50など)とモル濃度での生物活性データについてのみトレーニングしていました。単位が異なるため、これまでに見たことのないタイプ (例: EC50) や単位 (例: '%') を使用して生物活性を予測するタスクにモデルを一般化することが困難になります。

この課題を解決するために、北京大学コンピューター サイエンス学部の Zhang Ming 教授のチームは、ワシントン大学の Wang Sheng 助教授、博士研究員 Xiao Zhiping、復旦大学の Xu Yinghui 教授とともに、1.6 で訓練された手法を提案しました。 ChEMBL データベース内の数百万の実験的に測定された生物活性データ。生物活性基本モデル — ActFound。

現在、この研究は世界トップクラスの人工知能専門誌Nature Machine Intelligence(略してNMI、最新のインパクトファクターは18.8)に掲載されています。


論文リンク https://www.nature.com/articles/s42256-024-00876-w

共有リンク: https://rdcu.be/dQUav

ActFound のトレーニング データ、コード、モデルはオープンソースになっています: https://github.com/BFeng14/ActFound

ActFound の中心となるアイデアは、一対の学習方法を使用して、同じセットの実験における 2 つの小分子間の相対的な生物活性の違いを学習し、それによって異なる実験間の生物活性の不適合性の問題を回避することです。このモデルではメタ学習テクノロジーも使用されており、少量のデータのみでモデルの予測精度を向上させることができます。

査読者は、ペアワイズ学習とメタ学習の組み合わせが活動予測の中核問題を首尾よく解決するだけでなく、他の分野の発展も刺激すると信じています。

ActFound は、6 つの生物活性評価ベンチマーク データ セットで、さまざまな生物活性タイプと分子足場にわたる正確な予測機能と強力な一般化機能を実証しました。

この研究では、ActFound が主要な物理ベースのコンピューティング ツール FEP+ の代替として機能し、微調整に少量のデータのみを使用して同等のパフォーマンスを達成できることも示しています。


ActFound モデルのパフォーマンスと実用的価値を検証するために、研究チームは生物活性予測タスクに関する一連の実験を実施しました。

まず、研究者らは 6 つの異なるデータセットで ActFound のパフォーマンスを評価し、ChEMBL、BindingDB、FS-Mol、pQSAR-ChEMBL、Davis、および Kiba での 9 つの比較手法すべてを上回り、ほぼすべての種類の実験でそのパフォーマンスが広範囲に適用できることを実証しました。

クロスドメインの生物活性予測の点でも、ActFound は既存の最先端の手法を上回り、さまざまなタイプの生物活性データに対して優れた一般化機能を示しています。


次に、研究チームは ActFound と自由エネルギー摂動 (FEP) 計算ツールを比較し、鉛小分子の最適化における ActFound の実用的な価値を実証しました。

実験結果は、ActFound が FEP+ の代替ツールとしての可能性を秘めていることを示しています。

具体的には、ActFound は微調整に平均 4.8 分子のみを使用しながら、FEP+ を上回りました。 Actfound は 10,000 を超える化合物の活性を 1 秒で予測できますが、FEP では 1 対の分子の相対的な活性の差を計算するのに 24 ~ 48 GPU 時間を必要とします。

最後に、研究者らは、ActFound を使用して事前トレーニングされた抗がん剤反応予測モデルの優れたパフォーマンスを実証しました。

実験結果は、ActFound で初期化された抗がん剤反応予測モデルが微調整なしで優れたパフォーマンスを発揮することを示し、ActFound の幅広い応用可能性をさらに証明しています。


全体として、これらの実験結果は、ActFound が基本的な生物活性モデルとして、さまざまな生物活性予測タスクで良好に機能するだけでなく、創薬および創薬の他の側面での応用の見通しも示していることを示しています。

これらの発見は、既存の生物活性予測法の限界に対する効果的な解決策を提供すると同時に、医薬品開発プロセスを加速するための新たな可能性を切り開きます。

1

著者について

この論文の筆頭著者である Feng Bin は北京大学コンピューターサイエンス学部を修士号を取得して卒業しており、彼の指導者は Zhang Ming 教授でした。 Wang Sheng と Xiao Zhiping は北京大学情報学部コンピューターサイエンス学科の卒業生でもあり、長年にわたって Zhang Ming 教授のチームと協力してきました。北京大学のチームメンバーには、博士課程の学生、リウ・ゼクン氏と修士課程の学生、スルブヒ・ミルゾヤン氏も含まれている。

すべての著者は、Bin Feng、Zequn Liu、Nanlan Huang、Zhiping Xiao#、Haomiao Zhang、Srbuhi Mirzoyan、Hanwen Xu、Jiaran Hao、Yinghui Xu、Ming Zhang#、Sheng Wang# (# は責任著者) です。

参考文献:

https://www.nature.com/articles/s42256-024-00876-w