소식

자연의 블록버스터 연구: alphafold는 바이러스의 "가계도"를 그리고 그 기원의 미스터리를 밝힙니다.

2024-09-18

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

【소개】단백질 설계 및 약물 발견 외에도 nature에 발표된 최근 논문은 alphafold와 같은 대규모 생물학적 모델의 새로운 용도를 열어 생물학적 관계와 진화의 역사를 드러냈습니다.

올해 7월 메타에 의해 해체된 esmfold 팀은 성공적으로 재출발해 '언어 모델을 활용해 5억년의 진화 시뮬레이션'이라는 슬로건과 함께 최신 대형 생명과학 모델 esm3을 출시했다.

논문 주소: https://evolutionaryscale-public.s3.us-east-2.amazonaws.com/research/esm3.pdf

이러한 용도는 생물학자들에 의해 빠르게 예리하게 포착되었습니다.

최근 발표된 많은 연구에서 과학자들은 alphafold 및 esmfold와 같은 모델을 사용하여 바이러스 계통을 다시 그려내고 몇 가지 놀라운 "친화성"을 탐구하고 있습니다.

이러한 결과는 바이러스군의 진화 역사를 밝힐 수 있을 뿐만 아니라 미래의 생화학적 위험에 더 잘 대처할 수 있게 해줍니다.

전통적인 방법을 사용하여 과학자들은 게놈 비교 결과를 기반으로 바이러스 진화를 이해해야 합니다.

하지만 바이러스의 진화 속도는 포유동물에 비해 번개처럼 빠르다고 할 수 있다. 특히 유전자가 rna로 구성된 바이러스의 경우 비교 대상이 되는 게놈의 수와 복잡성이 급격히 늘어날 것이다.

또한 바이러스의 진화는 유전적 돌연변이에서 비롯될 뿐만 아니라 다른 유기체로부터 유전 물질을 획득할 수도 있기 때문에 바이러스의 "상대적 관계"를 식별하는 것이 더욱 어렵습니다. 매우 다르게 보이는 유전자 서열은 바이러스 간의 매우 깊고 먼 관계를 숨길 수 있습니다.

바이러스 유전자에 비해 그들이 암호화하는 단백질의 모양이나 구조는 더 느리게 변하는 경향이 있다. 그러나 영국 글래스고 대학의 분자 바이러스학자인 조 그로브(joe grove)는 알파폴드(alphafold)와 같은 도구가 출현하기 전에는 심지어 전체 바이러스군의 단백질 구조는 매우 느렸습니다. 전통적인 방법으로는 연구와 비교를 완료하기가 어렵습니다.

grove와 그의 팀이 nature에 발표한 최근 논문은 대형 모델의 힘을 사용하여 당단백질의 구조를 통해 flaviviridae 계통의 진화 역사를 밝혀냈습니다.

논문 주소: https://www.nature.com/articles/s41586-024-07899-8

플라비바이러스에는 c형 간염 바이러스, 뎅기열 바이러스, 지카 바이러스뿐만 아니라 일부 주요 동물 병원체와 인간 건강에 새로운 위협을 가할 수 있는 종이 포함됩니다.

바이러스가 세포에 들어가는 방법

c형 간염은 백신 접종이 널리 보급된 이후 ​​우리에게 덜 친숙한 감염병이 되었지만, 이 바이러스는 여전히 매년 수십만 명의 사망자를 발생시키고 있습니다.

보다 효과적인 c형 간염 백신을 개발하려면 플라비바이러스가 세포에 들어가기 위해 어떤 단백질(당단백질 포함)에 의존하는지 이해해야 합니다. 이 단백질은 또한 바이러스가 어떤 숙주를 감염시킬 수 있는지 결정합니다.

서열 수준에서만 연구하고 비교해 보면 각 바이러스의 단백질이 너무 다르기 때문에 의미 있는 연관성을 찾기가 어렵다는 것을 알 수 있습니다. 그러나 대규모 생물학적 모델의 단백질 구조 예측 기능을 활용하면 이 문제는 쉽게 해결될 수 있다.

연구진은 deepmind의 alphafold 2 모델과 meta가 개발한 구조 예측 도구인 esmfold를 사용하여 458개의 플라비바이러스 단백질에 대해 33,000개 이상의 예측 구조를 생성했습니다.

c형 간염 바이러스 당단백질의 구조적 예측

alphafold와 esmfold 모델을 모두 사용하는 이유는 둘 사이의 본질적인 차이 때문입니다.

alphafold의 입력은 유사한 단백질의 여러 서열에 의존하지만 esmfold는 수천만 개의 단백질 서열에 대해 훈련된 "단백질 언어 모델"이므로 지연된 서열만 입력으로 받아들일 수 있습니다. -가장 "신비한" 바이러스에 대한 심층 분석.

이러한 구조에 대한 예측으로 인해 연구자들은 일부 예상치 못한 연관성을 발견하게 되었습니다. 겉으로 보기에 관련이 없어 보이는 플라비바이러스의 일부 친척도 유사한 단백질을 세포에 들어가는 "열쇠"로 사용할 수 있습니다.

예를 들어, c형 간염에 사용되는 세포 감염 시스템은 보다 전형적인 돼지열병 및 기타 동물 병원체를 포함하는 페스티바이러스와 매우 유사합니다.

ai 보조 도구는 또한 c형 간염과 페스티바이러스가 사용하는 "진입 시스템"이 다른 바이러스와 매우 다르다는 것을 알려줄 수 있습니다. grove는 또한 이에 대해 설명하는 데 어려움을 겪습니다. "c형 간염과 그 친척의 경우, 그들의 진입 시스템이 어디서 왔는지 모릅니다. 그러한 바이러스는 오래 전에 발명되었을 수 있습니다."

박테리아로부터 '해적' 단백질을 얻으세요

페스티바이러스 외에도 예측된 구조는 플라비바이러스가 두 가지 "친척"인 지카 바이러스와 뎅기열 바이러스를 찾는 데 도움이 되었습니다. 이들의 진입 단백질은 동일한 기원을 가지고 있는 것으로 보이며, 플라비바이러스는 박테리아로부터 이를 "훔치는" 것으로 보입니다. 그것을 자신의 것으로.

colabfold-alpahfold2를 사용하여 뎅기열 바이러스 단백질의 구조 예측

이전에 시드니 대학의 바이러스학자인 메리 페트론(mary petrone) 팀도 이상한 플라비바이러스에서 유사한 "훔치는" 행동을 발견했습니다.

“유전자 도용은 이전에 생각했던 것보다 플라비바이러스의 진화에 더 큰 역할을 했을 수도 있습니다.”라고 그녀는 말했습니다.

스위스 로잔 대학교(university of lausanne)의 컴퓨터 생물학자인 david moi는 또한 ai 지원 도구의 아직 개발되지 않은 잠재력을 고려할 때 플라비바이러스 연구는 빙산의 일각에 불과하다고 지적합니다.

인공 지능의 도움으로 다른 바이러스와 심지어 많은 세포 유기체의 진화 역사가 다시 쓰여질 수 있습니다.

"우리는 새로운 세대의 도구를 사용하여 그들의 이야기를 다시 전할 것입니다. 이제 더 자세히 볼 수 있으므로 이 모든 유기체의 진화 역사를 업데이트해야 합니다."

생명과학의 수많은 미스테리 가운데, ai가 터뜨린 엄청난 에너지는 우리에게 답의 여명을 보여주며, 이야기가 다시 쓰여질 날을 기대하게 만든다.