2024-09-26
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
텍스트 |
편집자|왕이수
"과학용 ai의 기본 논리는 현재 대규모 언어 모델의 훈련 논리와 다릅니다." shenzhen technology의 기술 이사인 lu jintan은 과학 연구 및 대규모 응용 분야에서 현재 인공 지능의 논리가 다음과 같이 솔직하게 말했습니다. 다른 산업의 언어 모델은 동일하지 않습니다.
대규모 언어 모델 훈련은 고품질 데이터를 "공급"하는 데 의존한다는 것은 업계에서 잘 알려져 있습니다. 데이터가 많을수록 대규모 언어 모델의 능력이 더욱 강력해집니다. 그러나 일부 특정 과학 연구 분야에서는 데이터의 양이 상대적으로 부족합니다. 예를 들어, 특정 유형의 단백질 구조의 경우 수백 개의 고품질 실험 데이터를 얻는 데 몇 년이 걸릴 수 있습니다.
이는 또한 과학 연구 분야에서 ai를 적용할 때 더 나은 모델 효과를 달성하기 위해 상대적으로 적은 데이터가 필요하다는 것을 의미합니다.
그렇다면 ai는 정확히 어떻게 과학을 변화시킬까요? 그리고 비즈니스 모델을 어떻게 실행해야 할까요? ai for science의 대표 기업 중 하나인 shenzhen technology는 자체적인 사고와 솔루션을 제시했습니다.
전통적인 과학 컴퓨팅에서는 분자와 원자의 구조 정보를 통해 분자와 원자의 물리적 특성을 예측하려면 일반적으로 실제 문제와 결합하여 미시적 계산을 수행해야 합니다. 현재 업계에서는 이러한 교차 규모 컴퓨팅 기능을 구현하는 데 여전히 부족하며 경험적 판단과 실험적 검증에 더 의존하고 있습니다.
동시에 컴퓨팅 시스템의 규모가 확장됨에 따라 전통적인 과학 계산의 계산 양은 기하급수적으로 증가하여 계산이 완전히 기존 물리 시스템에 의존하는 경우 수만 또는 심지어 수억에 도달합니다. 모델의 경우 전체 계산 시간은 다음과 같습니다. 주기가 매우 길어질 수 있습니다.
lu jintan은 "심천 기술은 모델이 물리적 모델의 정확도에 가까운 계산 결과를 생성하도록 하는 동시에 계산 성능을 크게 향상시킬 수 있습니다."라고 말했습니다. "우리는 ai를 사용하여 이러한 물리적 방법에 적합합니다. 이전에는 많은 양의 계산이 필요했습니다."
이미지 인식을 예로 들면, 사진의 픽셀 정보를 분석하는 것이 핵심이며, 합성곱 신경망(convolutional neural network)을 도입해 사진 내 국소적 특징을 추출하고, 원본 사진을 다양한 특징 맵으로 분해하고, 특징을 통해 근사해를 구하는 것이 핵심이다. 이것은 실제로 차원 축소 분석입니다.
실제로 ai는 과학 분야의 차원 축소 애플리케이션이기도 하며, 특히 교차 규모 계산과 관련된 초기 단계에서 강력한 모델링 기능을 통해 계산 복잡성을 줄여줍니다. 동시에 다중 모드 대형 모델 기능을 기반으로 분자 구조, 물리적 특성, 실험 데이터 등과 같은 다양한 유형의 데이터에 대한 다차원 분석 및 예측도 달성할 수 있습니다.
예를 들어, 약물 발굴 과정에서는 일반적으로 먼저 단백질 구조와 표적 지점을 분석한 다음 수십만 또는 수백만 개의 화합물 라이브러리에서 표적 지점에 대한 친화도가 높은 후보 화합물을 선별해야 합니다. 일반적으로 친화도 분석, 예측 및 제약 화학적 특성(예: 독성, 흡수, 대사 등) 평가를 포함한 다차원 평가가 수행됩니다.
"과학용 ai 분야에서 교차 규모 계산을 지원하는 대형 모델의 핵심은 거대한 매개변수 규모와 강력한 일반화 능력에 있습니다. 모델의 엄청난 수의 매개변수를 통해 복잡한 물리적, 화학적, 생물학적 현상을 포착할 수 있습니다. 그리고 강력한 일반화 능력 "기본 모델은 약물의 미세구조를 바탕으로 해당 약물의 관련 특성을 예측할 수 있으며, 모델을 이식하면 재료 분야에도 적용이 가능해 물질의 미세구조를 분석함으로써 예측이 가능합니다." 다양한 온도와 압력 하에서 재료의 안정성과 기타 물리적 상태.”
따라서 ai for science의 기본 일반 모델에 대한 shenzhen technology의 이해는 이 모델이 다양한 산업 분야에 적용되어 미세 조정을 통해 문제를 해결할 수 있다는 점에 더 가깝습니다.
현재 shenzhen technology에서 연구하는 여러 기본 모델은 제한된 데이터 교육을 통해 여전히 좋은 결과를 얻을 수 있으며, 얻은 고품질 데이터를 기반으로 더욱 최적화하고 수정할 수 있습니다. 이 모델 시스템에서는 ai가 기본적인 과학적 원리를 스스로 학습하고, 소량의 도메인 데이터로 추가적인 훈련을 통해 이미 좋은 결과를 얻을 수 있는데, 이는 대규모 언어 모델과 약간 다릅니다.
lu jintan은 light cone intelligence에 다음과 같이 말했습니다. “과학 컴퓨팅 분야의 데이터 소스는 널리 퍼져 있지 않으며 공개 데이터 세트도 많지 않습니다. 따라서 현재 우리 작업의 큰 부분은 모델의 훈련 효과를 더 높이고 작은 데이터 세트를 기반으로 하면 더 효과적입니다.”
지난 2년 동안 shenzhen technology는 dpa 분자 시뮬레이션 모델, uni-mol 3d 분자 구조 모델, uni-fold 단백질 접힘 모델, uni-rna 핵산 구조 모델, uni-mol 3d 분자 형태 모델, uni-rna 핵산 구조 모델, uni-mol 3d 분자 구조 모델 등 일련의 대규모 산업 모델을 성공적으로 출시했습니다. -고성능 약물 분자 도킹 엔진 및 uni-smart 과학 문헌 다중 모드 대형 언어 모델 등을 도킹합니다.
lu jintan에 따르면 shenzhen technology는 현재 재료 및 의약품 분야에서 수백 가지 모델을 보유하고 있으며 이러한 모델도 shenzhen technology의 제품 플랫폼에 성공적으로 통합되었습니다.동시에 shenzhen technology는 업계 내 수십 개의 주요 제약회사와 전략적 협력을 달성했으며 2023년에는 매출 1억 달러를 초과하는 상용화 돌파구를 달성할 예정입니다.
현재 shenzhen technology의 사업 분야는 대학의 스마트 교육, 생물의학 연구 개발, 새로운 배터리 재료 등을 다루고 있습니다.
그러나 현재 ai for science의 알고리즘 분류에 따르면 전반적인 개발은 아직 실험 정확도에 가까운 l2 단계에 있으며 모델 계산을 사용하여 인간을 보조하고 스트레스를 줄이는 등 인간 중심적입니다.
l3 단계에서는 ai가 직접 결과를 제공할 수 있으며 일부 시나리오에서는 인간 실험을 직접 대체할 수 있습니다.
l2에서 l3으로 이동하려면 "가장 어려운 점은 각 링크의 정확도가 특정 높이에 도달해야 한다는 것입니다. 동시에 각 링크에 알고리즘을 통합하는 방법도 큰 과제입니다." 말했다.
미래에 직면하여 lu jintan은 과학용 ai의 시장 공간이 교육 및 과학 연구, 생물 의학, 배터리 재료 등 무엇이든 ai를 추가하면 적어도 실험 수준에서는 실제로 많은 근본적인 문제를 해결할 수 있다고 믿습니다. , 사람들에게 권한을 부여합니다. 산업, 개척지 탐험 등은 더 많은 아이디어와 진입점을 제공합니다.
다음은 guangcone intelligence와 shenzhen technology 기술 이사 lu jintan의 자세한 대화입니다(guangcone intelligence에서 삭제 및 편집).
심천기술은 ai를 활용한다
과학 연구 및 개발의 품질과 효율성 향상
q: 대형 모델은 자연어 처리, 비디오 및 이미지 생성을 어떻게 변화시켰습니까?
에이:문헌 정보, 특허 정보 등의 마이닝 분야에서 대형 언어 모델이 사용되기 시작했으며, 우리는 이를 문헌 대형 모델이라고 부릅니다. 또한 그림 및 차트 해석과 같은 일부 다중 모드 응용 프로그램도 수행합니다.
전통적인 과학 컴퓨팅에서는 종종 발생하는 문제가 미시적 규모에서 거시적 규모까지입니다. 문제를 해결하기 위해 다양한 물리적 모델이 사용되지만 일부 교차 규모 컴퓨팅 시나리오에서는 여전히 기능이 부족합니다. 예를 들어, 원자의 구조 정보를 통해 분자의 거시적 특성을 예측하려면 규모에 따라 모델링할 수 있는 능력이 필요합니다.
인공 지능에는 교차 규모 모델링이 가능한 대형 모델이 포함되어 있습니다. 이러한 물리적 모델을 학습한 후 특정 문제에 적용하면 이러한 문제를 잘 해결할 수 있습니다.
일반적으로 수만 또는 수억 개의 원자가 있는 시스템에서 대규모 처리량 계산을 수행해야 하는 경우가 많습니다. 계산이 물리적 모델을 기반으로 하는 경우 시간이 상대적으로 길어집니다. 여기서 shenshi technology가 하는 일은 모델이 물리적 모델의 정확도에 가까운 계산 결과를 생성할 수 있도록 하는 동시에 컴퓨팅 성능을 크게 향상시킬 수 있도록 하는 것입니다.
q: 수억 개의 원자에 달하는 시스템 규모의 계산을 어떻게 대형 모델 분야의 계산으로 변환할 수 있나요?
에이:미시적 규모에서 두 원자 사이의 상호 작용은 고전 역학이나 양자 역학 방정식과 같은 물리적 모델을 통해 분석되어 원자 사이의 상호 작용력과 운동 궤적을 계산할 수 있습니다. 이때 계산은 두 원자의 상호 영향만 고려하면 되며 문제는 비교적 간단하다. 그러나 시스템의 원자 수가 증가하면 상황은 더욱 복잡해집니다. 예를 들어, 세 번째 원자가 도입되면 각 원자 간의 쌍별 상호작용을 고려하는 것 외에도 세 원자 간의 다체 효과도 분석해야 합니다. 이때 원자 사이의 상호작용과 궤적은 두 원자에만 의존하는 것이 아니라 전체 시스템의 상태에 의해 공동으로 결정되므로 계산량이 비선형적으로 증가한다. 과학자들은 다양한 규모의 계산을 효율적으로 처리하기 위해 밀도 함수 이론이나 분자 역학 시뮬레이션과 같은 근사 알고리즘을 도입하는 경우가 많습니다.
초기에 우리 ai가 한 일은 실제로 ai를 사용하여 이러한 물리적 방정식을 맞추고 컴퓨팅 성능을 향상시키는 것이었습니다. 이미지 인식과 비교할 수 있으며, 핵심은 컨볼루션 신경망을 추가한 후 사진을 특징 사진으로 분할한 후 근사적인 솔루션을 수행한다는 것입니다. 과학 컴퓨팅 분야에서 인공지능 초기에 우리가 했던 일은 차원 축소 조치, 즉 이전에 많은 양의 계산이 필요했던 일을 더 빠르게 만드는 작업으로도 볼 수 있습니다.
q: 기존 ai의 계산 방식과 대형 모델의 등장에는 어떤 차이가 있나요?
에이:대형 모델의 정의는 상대적으로 모호하며 일반적으로 매개변수의 개수가 지표로 사용됩니다. 우리에게는 다중 규모 계산을 제공하는 것이 더 중요합니다. 현재의 사전 훈련 모델인 uni-mol은 분자와 원자의 3차원 구조를 기반으로 관련 물리적 특성을 예측하고 구조-활성 관계를 설정하여 이를 직접 해결합니다. 과거에는 예측이 실험과 분석에 의존하는 경우가 많았습니다. 경험. 이 방법은 다양한 규모의 계산을 결합하고 재료 과학과 같은 분야에 새로운 계산 방법을 제공합니다.
대형 모델을 다룰 때 일반적으로 모델 일반화 기능에 더 중점을 둡니다. 과학용 ai 분야에서는 비교적 흔한 일이다. 예를 들어, 기본 모델은 미세 구조를 기반으로 일부 약물 관련 특성을 예측할 수 있습니다. 이 모델을 응용하면 재료 분야에도 적용할 수 있습니다. 따라서 ai for science의 기본 일반 모델에 대한 우리의 이해는 기본 사전 훈련 모델 세트에 가깝습니다. 이 모델은 미세 조정을 통해 문제를 해결하기 위해 다양한 산업 분야에 적용할 수 있습니다.
q: 멀티모달리티의 주요 역할은 무엇입니까?
에이:포괄적인 분석을 위해 분자 구조, 물리적 특성, 실험 데이터 등과 같은 다양한 유형의 데이터를 결합하는 작업이 포함됩니다. 예를 들어 약물 발견 과정에서는 일반적으로 단백질 구조와 표적 지점을 먼저 분석한 다음 스크리닝 과정에서 수십만 또는 수백만 개의 화합물 라이브러리에서 표적 지점에 대한 친화도가 높은 화합물을 선별해야 합니다. , 그 과정에는 친화성 분석, 약효 분석, 독성 여부, 인체 흡수에 유익한 여부 등이 포함될 수 있으며 다차원 분석이 될 수 있습니다. 따라서 더 나은 스크리닝 효과를 얻으려면 여러 각도와 속성에서 분석해야 합니다.
사진, 비디오 등 일반적인 다중 모드 문제는 문서 데이터 마이닝의 다중 모드 응용 프로그램에 더 가깝습니다. 예를 들어 논문에서는 논문의 텍스트 정보뿐만 아니라 그림 정보도 읽어야 합니다. , 그림 정보는 심층 마이닝을 수행한 후 텍스트 정보와 통합하여 최종적으로 결과를 출력해야 합니다. 문헌에서는 이러한 공통 다중 모드 기능도 적용합니다.
q: 과학용 ai 분야의 모델 데이터 수요는 얼마나 큰가요?
에이:물론 분야가 다르면 취득이 어렵다는 문제도 있습니다. 예를 들어, 생의학 분야와 배터리 분야의 세분화된 애플리케이션에서는 데이터 획득의 어려움이 다릅니다. r&d 및 검증 주기가 긴 산업에서는 데이터 출력이 상대적으로 적고 데이터의 절대적인 양이 제한됩니다. . 예를 들어, 일부 특정 유형의 단백질 구조의 경우 몇 년 안에 기록이 몇백 개에 불과할 수 있지만 다른 분야에서는 데이터가 확실히 그 이상입니다.
그러나 기본 물리적 모델은 더 많은 데이터를 생성할 수 있습니다. 현재 연구하고 있는 여러 기본 모델은 제한된 데이터 교육에서도 여전히 좋은 결과를 얻을 수 있으며 향후 얻을 수 있는 고품질 데이터를 기반으로 최적화하고 수정할 수 있습니다. 우리의 모델 시스템에서는 ai가 기본적인 과학 원리를 스스로 학습하고 소량의 도메인 데이터로 추가 학습을 통해 이미 좋은 결과를 얻을 수 있는데, 이는 대규모 언어 모델과 약간 다릅니다.
q: ai가 기본적인 과학 논리를 학습한 다음 특정 응용 문제를 해결하도록 하려면 어떻게 해야 합니까?
에이:일반적으로 일부 물리적 모델을 사용하여 직접 계산을 수행한 다음 결과 데이터를 훈련하고 물리적 모델을 시뮬레이션합니다.
q: 기본 대형 모델과 수직형별 대형 모델의 관계는 무엇인가요? 기본 대형 모델을 직접 학습해야 합니까, 아니면 타사 오픈 소스 대형 모델을 사용해야 합니까?
에이:다양한 시나리오가 다릅니다. 대규모 언어 모델을 참조하는 경우 종이 해석과 같은 문서 해석에 더 많이 사용됩니다. 기본 응용 프로그램은 단일 논문을 해석하는 것입니다. 비용 고려 사항으로 인해 일부 일반 대형 모델을 사용하여 논문을 해석합니다. 여러 논문을 해석하고 싶거나 대규모 논문 라이브러리에서 특허 검색 및 분석을 포함한 전체 검색을 수행하려는 경우 자체 개발한 문헌 모델을 사용하여 논문에 대한 보다 자세한 해석을 수행합니다.
따라서 우리는 사용자를 위한 제품을 계속 연구하고 있으며 어떤 모델이 우리 제품에 더 적합한지 결정할 수 있으며 비용을 고려하여 선택할 것입니다.
요즘 우리는 많은 모델을 사전 훈련 모델이라고 부릅니다. 예를 들어 작년에 출시한 dpa는 서로 다른 요소의 원자 사이의 잠재적인 기능을 계산하기 위한 사전 훈련 모델 세트입니다. 또한 일부는 openlam 대형 원자 모델 프로젝트를 시작했습니다. 일부 오픈 소스 세력을 동원하기 위해 우리는 데이터를 함께 제공하고 공유하여 모델이 더욱 성숙해지도록 훈련할 수 있습니다.
q: 심천기술에는 현재 몇 개의 모델이 있습니까?
에이:우리는 이제 재료와 의학 분야를 합쳐 수백 개의 모델을 보유하고 있습니다.
매출 1억 돌파, 수십 개의 제약회사와 협력
shenzhen technology의 비즈니스 모델
q: ai 의학 분야에서 shenzhen technology의 최신 연구 개발 진행 상황을 공유할 수 있습니까?
에이:의학 분야에서는 실제로 초기 표적 발견, 단백질 구조 분석, 표적 분석, 분자 스크리닝, 친화도 분석, 특성 예측 등 거의 모든 전임상 컴퓨팅 시나리오를 다루는 전임상 연구에 집중하고 있습니다. 이 일련의 링크에는 그러한 계산 방법이 많이 포함되어 있으며 이제 알고리즘을 구현했습니다.
의료 시나리오와 결합하여 우리는 이러한 모든 알고리즘을 약물 설계 플랫폼인 hermite라는 하나의 제품으로 패키지합니다. 이제 우리는 기본적으로 세 가지 측면, 즉 생명공학(생명공학)과 관련된 다양한 분야의 국내 상위 50개 제약회사와 협력하고 있습니다. , 하나는 cro(임상연구기관), 하나는 pharma(제약회사)로 각각 대표회사가 있습니다.
지난 주에 우리는 인플루엔자 약물인 오셀타미비르를 만드는 국내 상장회사인 eastern sunshine과 협력 계약을 체결했습니다. 또한 미국에서 3개의 일류 인증을 받았습니다. 관련사업.
dongguang sunshine과 같은 생물의학 분야의 전형적인 기업 외에도 실제로 우리는 서중국의과대학, xiangya 병원, 의과대학 등 약물 연구 및 개발에 종사하는 많은 과학 연구 기관 및 대학과 협력하고 있습니다.
q: 현재 우리 제품은 실제로 브라우저를 이용해 직접 사용할 수 있고, 전체적인 배포도 매우 가볍습니다. 핵심 제품 배포 방법도 모두 이렇나요?
에이:네, 우리가 온라인으로 수행하는 대부분의 작업은 ai 추론 작업입니다. 일반적으로 훈련 작업은 오프라인으로 완료되므로 전송되는 데이터의 양은 그리 크지 않습니다. 훈련 시나리오도 적고 기반이 더 큽니다. 사전 훈련된 모델의 미세 조정은 소규모 데이터 배치로도 수행할 수 있으며 데이터 전송 압력도 작습니다. 경량 배포는 컴퓨팅 성능을 충분히 사용하지 않는다는 의미는 아닙니다. 시스템은 시스템 뒤에서 하이브리드 클라우드와 hpc 컴퓨팅 성능을 사용하지만 사용자를 위한 브라우저 액세스로 패키지됩니다. 일부 민영화 시나리오인 경우 saas에는 필요하지 않은 컴퓨팅 성능 시스템도 배포해야 합니다.
일반적으로 대기업은 민영화되어야 한다. 데이터 개인 정보 보호에 대한 요구 사항이 특히 높기 때문에 교육과 유사한 일부 시나리오 또는 일부 연구 기관에서는 민영화된 배포 없이 특정 주제에 일시적으로 사용될 수 있습니다.
q. 현재 협력업체와의 실제 프로젝트 진행은 어떤가요? 정확히 어떤 단계에서요?
에이:제약회사와의 협력은 주로 계산과정에서 이루어집니다. 회사는 의약품을 생산하지 않기 때문에 제약회사의 의약품 개발 과정에는 참여하지 않습니다.
우리는 기본적으로 풀 링크 로드입니다. 또한 제약 회사의 요구 사항이 있기 때문에 더 많은 회사에 공동으로 서비스를 제공하기 위해 하드웨어 연구 및 개발에 초점을 맞춘 자동화된 실험실에 소프트웨어를 통합하는 등 몇 가지 새로운 영역과 탐구도 시도하고 있습니다. 아직도 꽤 크네요.
그리고 매출 기준으로 보면 지난해 매출이 1억을 넘어섰습니다.
제약회사와의 협력에는 두 가지 비즈니스 모델이 있습니다. 하나는 소프트웨어를 판매하는 것이고, 다른 하나는 공동 연구 개발입니다.
많은 대기업은 현지에서 배포하고 자체 팀을 지원할 여력이 있으며 소프트웨어 구매를 지원할 만큼 충분한 자금을 보유하고 있습니다. 그러나 일부는 고급 생산 도구 및 해당 인재가 부족한 중소 규모 또는 신규 혁신 제약 회사일 수 있습니다. 이러한 도구를 사용하면 우리는 그들이 더 많은 계산을 수행하도록 도울 수 있습니다. 여기에는 데이터 및 정보 보안이 포함되므로 두 당사자 간의 통합이 특히 가깝습니다.
하지만 많은 대형 제약회사들은 충분한 자금과 인재를 보유하고 있으며 saas를 제공하면서 맞춤형 서비스도 제공할 수 있기를 바라고 있습니다.
과학을 위한 ai의 미래
q: 자율주행의 5가지 분류와 매우 유사한 여러 가지 현재 알고리즘 분류를 보았습니다. l2 단계에서는 어떤 상태에 도달할 수 있나요? 이전 실험 모델을 어느 정도 대체할 수 있나요? 특정 시나리오의 사례를 들어주실 수 있나요?
에이:l2 시나리오에서는 인간을 지원하고 실험 부담을 줄이기 위해 실험 정확도에 더 가깝고 인간 중심적인 컴퓨팅이라고 부릅니다. 약물 설계에는 서로 다른 시스템 간에 큰 차이가 있기 때문에 일부 시스템에서는 실험적 정확도에 가까운 수준을 달성할 수 있었습니다. 따라서 사용자가 실험을 전혀 할 필요가 없다는 것은 아니지만, 사용자가 분자 스크리닝과 같은 보다 기본적인 작업을 수행하도록 도울 수는 있습니다. ai는 사용자가 수십만 가지의 약물 화합물을 선별하는 데 도움을 줄 수 있습니다. 결국, 아마도 나머지는 과학 연구자들이 실험적 검증을 수행해야 하므로 실험 규모가 크게 줄어들 것입니다.
q: l2에서 l3로 이동하는데 있어서 어려운 점은 무엇인가요?
에이:이 l3에 대한 제가 이해한 바는 ai가 결과를 직접 제공할 수 있다는 것입니다. 이는 특정 시나리오에서 인간 실험을 직접 대체하는 것과 같습니다. l3에 도달하기 어려운 이유는 주로 각 링크의 정확도가 일정 수준에 도달해야 한다는 점입니다. 또한, 관련된 알고리즘이 많고, 다양한 알고리즘을 통합하는 것도 어렵습니다. 알고리즘의 통합은 실제로 완전한 작업흐름 시스템과 유사하며, 이 시스템은 지속적으로 자체를 검토하고 최적화할 수 있습니다.
q: 과거부터 현재까지 기술 전반에 반복이 있나요? 그리고 현재 모델 개발에 병목현상은 없을까요?
에이:현재 우리는 데이터를 기반으로 다양한 알고리즘을 지속적으로 반복하고 있으며, 특히 사용자가 일반적으로 사용하는 제품의 경우 알고리즘 반복이 더 빨라졌습니다. 1세대는 단일 분야에서 사전 훈련을 지원하고, 2세대는 서로 다른 주석 방법을 가진 데이터 세트를 기반으로 병렬 훈련을 동시에 수행할 수 있다는 점이다.
병목 현상은 주로 데이터에서 발생합니다. 과학 컴퓨팅 분야에서는 데이터 소스가 널리 퍼져 있지 않고 공개 데이터 세트도 많지 않습니다. 따라서 현재 우리 작업의 큰 부분은 모델의 훈련 효과를 더 좋게 만드는 방법입니다. 작은 데이터 세트를 기반으로 합니다.
또한, 추가적으로 주목해야 할 것은 해석 가능성의 문제입니다. 과학적 컴퓨팅 요구 사항이 더욱 엄격해지고 해석 가능성에 대한 요구 사항도 높아지기 때문에 이제 매개 변수를 노출하여 모델의 해석 가능성을 높이려고 노력하고 있습니다. 번역 경로 등 섹스.
q: 데이터 부족 문제를 어떻게 해결하나요?
에이:ai for science 분야는 재료 분야든 의학 분야든 가장 기본적인 미시적 수준의 물리적 원리는 동일하기 때문에 일부 재료 분야의 데이터를 의료 분야에서 직접 재사용할 수 있다는 장점이 있다. 예를 들어 dpa 2는 다양한 표준 시스템에서 제공되는 데이터를 기반으로 사용자가 통합 모델을 교육하는 데 도움이 됩니다. 그런 다음 이 모델 세트를 업계에 구체적으로 적용하면 미세 조정에 소량의 데이터를 사용할 수 있습니다.
우리는 아직 toc 시장에 참여하지 않았지만 우리 시스템은 이미 일부 교육 시나리오를 다루었습니다. 우리는 교육, 연구 및 응용을 통합한 과학 연구 플랫폼을 보유하고 있습니다. 현재 우리가 주로 직면하는 고객은 대학과 좀 더 소비자 지향적인 사용자입니다. 대학의 경우 교사를 위한 유사한 실무 교육 플랫폼을 갖게 될 것입니다. 이 플랫폼은 교육부터 수업에 참여하는 학생, 사용, 연구 결과 구현까지 모든 것을 지원할 수 있습니다.
q:ai for science의 미래 시장 발전 공간은 무엇입니까?
에이:시장 공간은 충분히 크다고 생각합니다. 과학 연구든, 의학이든, 재료든, 적어도 실험 수준에서 ai를 추가하면 실제로 문제를 해결할 수 있고, 과학 연구자가 실험 결과를 개선하고 실험 부담을 줄이는 데 도움이 될 수 있습니다.
전반적인 고객 수용 측면에서 볼 때, 많은 시나리오에서 우리가 지출하는 비용 중 일부는 사용자를 교육하는 것입니다. 예를 들어 의약품 분야에서는 전체 검증 주기 동안 고객과 동행해야 하기 때문에 고객과 장기적인 협력 관계를 구축합니다. .
이에 비해 소재 분야는 훨씬 빠르다. 예를 들어 배터리의 연구개발 주기는 ai로 전해액 비율의 영향을 예측하면 준비 검증만 하면 충분하다.
국가 차원에서는 과학기술부가 중국 자연과학재단과 함께 al for science 특별 배치 작업을 시작했습니다. 이는 또한 사회 경제적 수준에서 국가 거시 정책에 이르기까지 모든 사람이 낙관적이며 이를 강력하게 지지한다는 점을 보여줍니다.
q: ai for science는 아직 초기 단계인데, 향후 3년 안에 어느 단계로 발전하게 될까요?
에이:나는 적어도 모든 고객이 이 문제에 대해 통일된 이해를 가질 것이라고 생각합니다. 이제 모두가 ai를 적극적으로 수용하기 시작했고, ai에 대한 이해도도 높아졌습니다. 모든 업계는 이 단어가 낯설거나 거부감을 느끼지 않을 것이며, 비교적 긍정적인 태도를 가질 것이다. 다음 단계는 어떻게 고객과 공동 창작과 유사한 협력 관계를 구축할 수 있는지입니다. 결국 이 산업은 데이터에 민감한 산업입니다. 3년이 지나면 고객이 몇 가지 실용적인 구현 시나리오를 생각해 내는 데 도움을 줄 수 있기를 바랍니다.
사실 밸류포인트를 좀 더 명확히 따져보면 여전히 고객 수용도가 상당히 높다고 생각합니다. 왜냐하면 일반적으로 말하면 제약회사든 방금 언급한 신에너지든 모두가 점점 더 혁신 투자에 관심을 기울이고 있기 때문입니다. 또한 우리는 과학 연구 인프라와 상위 시나리오를 포함한 전체 과학 연구 패러다임을 혁신하는 데 도움을 주고자 하며, 이를 통해 다양한 산업에 힘을 실어줄 수 있습니다.