소식

wuwen core qiong은 설립 16개월 만에 10억 위안의 자금을 조달했습니다. wuwen core qiong은 대형 모델 시대의 첫 번째 선택 '컴퓨팅 파워 사업자'가 되는 것을 목표로 하고 있습니다.

2024-09-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

이 신문의 사진과 정보
대형 모델 인프라 스타트업인 인피니전스 ai(infinigence ai)는 시리즈 a 파이낸싱에서 약 5억 위안을 완료했다고 오늘 발표했습니다. 지금까지 설립된 지 16개월밖에 되지 않은 wuwen xinqiong은 거의 10억 위안에 달하는 자금 조달을 완료했습니다.
wuwen xinqiong의 공동 창립자이자 ceo인 xia lixue는 ai 2.0 물결이 가져온 새로운 '8-8 법칙'이 수직적 시나리오 일반화의 80%를 지원하려면 핵심 기술 문제의 20%만 해결하면 된다고 믿습니다. 중국의 컴퓨팅 파워 생태계 우리는 공급과 수요의 불균형과 불균등한 자원 분배에 직면해 있습니다. 이는 의심의 여지 없이 wuwenxinqiong이 업스트림 및 다운스트림과 협력하여 다양하고 이질적인 컴퓨팅 파워를 효율적으로 통합할 수 있는 기회를 창출합니다.
wuwen xinqiong은 이번 자금 조달로 조달된 자금이 기술 인재 채용과 기술 연구 개발을 강화하고, 소프트웨어 및 하드웨어 협력의 기술 리더십을 유지하며, 제품의 상용화를 더욱 촉진하고 유지하는 데 사용될 것이라고 말했습니다. infini-ai 이기종 클라우드 플랫폼 제품과 시장 간의 긴밀한 통합을 통해 생태학적 협력을 강화하고 이기종 클러스터 컴퓨팅 자원을 활성화하며 "m 유형의 모델"과 "n 유형의 칩"을 지원하는 ai 컴퓨팅 파워 기반을 구축합니다. "ai 모델 컴퓨팅 파워의 슈퍼 앰프" "...wuwen xinqiong은 대형 모델 시대의 첫 번째 선택 "컴퓨팅 파워 운영자"가 되기 위해 최선을 다할 것입니다.
ai 모델 컴퓨팅 성능을 위한 "슈퍼 증폭기"가 되어 보세요.
대형 모델이 지원할 수 있는 실제 산업 규모는 ai 모델이 실제로 사용할 수 있는 컴퓨팅 성능에 따라 달라집니다. wuwen core qiong은 대형 모델의 실제 사용 가능한 컴퓨팅 성능은 칩의 이론적 컴퓨팅 성능에 달려 있을 뿐만 아니라 최적화 계수를 통해 컴퓨팅 성능 활용 효율성을 증폭시키고 클러스터 크기를 통해 전체 컴퓨팅 성능 규모를 증폭시킬 수 있다고 믿습니다. 따라서 wuwen core qiong은 "칩 컴퓨팅 성능 × 최적화 계수(소프트웨어 및 하드웨어 협업) × 클러스터 크기(다중 이기종) = ai 모델 컴퓨팅 성능" 공식을 제안했습니다. 이 공식에 따라 wuwen core qiong은 소프트웨어와 하드웨어의 공동 최적화 기술을 통해 대형 모델 작업에서 칩 컴퓨팅 성능의 활용도를 지속적으로 향상시키고, 클러스터 컴퓨팅 성능의 활용도를 향상시키며, 다중 이기종 컴퓨팅을 통해 클러스터 컴퓨팅 성능의 활용도를 확장할 것입니다. 전력 적응 기술. 업계 전반의 컴퓨팅 전원 공급 장치.
소프트웨어와 하드웨어의 공동 최적화 측면에서 wuwen xinqiong은 자체 개발한 추론 가속화 기술인 flashdecoding++를 통해 주류 및 이기종 하드웨어의 활용률을 크게 향상시켜 이전 sota를 능가했으며 amd, huawei에서 여러 주류 오픈 소스 대형 모델을 완성했습니다. ascend는 biren, cambrian, suiyuan, haiguang, tianshu zhixin, muxi, moore thread, nvidia 등과 같은 10가지 이상의 컴퓨팅 카드에 적용되었으며 일부 컴퓨팅 카드에서 업계 최고의 추론 가속 결과를 달성했습니다. . 다양한 산업 분야에서 증가하는 대형 모델 추론에 대한 수요를 효율적으로 충족합니다. 이 솔루션으로 얻은 최적화 결과를 바탕으로 wuwen core dome은 상용 ai 애플리케이션의 성능 향상을 공동으로 촉진하기 위해 amd와 전략적 협력을 체결했습니다.
다중 이기종 컴퓨팅 능력 적응 측면에서 wuwen xinqiong은 업계에서 부족한 이기종 적응 및 클러스터링 기능도 보유하고 있으며 지난 7월 출시된 대규모 이기종 분산 하이브리드 교육 시스템 hethub가 업계 최초로 출시되었습니다. tianshu zhixin, muxi, moore threads, amd 및 nvidia를 포함한 총 6개의 "4+2" 칩 조합을 사용하여 킬로칼로리 규모의 이기종 컴퓨팅 성능 혼합 교육을 달성했습니다. 평균 최고 수준인 최대 97.6%에 도달합니다. 벤치마크 솔루션은 약 30% 더 우수합니다. 이는 동일한 멀티 칩 컴퓨터실 조건 또는 클러스터 조건에서 wuwen core dome이 총 훈련 시간을 30% 단축할 수 있음을 의미합니다.
이기종 컴퓨팅 성능 활용 및 대규모 모델 애플리케이션 개발을 위한 풀 스택 기능 제공
최근 몇 년 동안 모델 레이어와 칩 레이어는 국제적으로 점차 '양두 수렴' 패턴을 형성하고 있는 반면, 중국의 모델 레이어와 칩 레이어는 'm 유형의 모델'과 'm 유형'으로 구성된 'm×n' 패턴을 계속해서 제시하고 있습니다. n 종류의 칩" . 그러나 서로 다른 하드웨어 플랫폼은 서로 다른 소프트웨어 스택과 도구 체인에 적응해야 하며, 이기종 칩 간에는 동시에 사용하기 어려운 '생태적 사일로' 현상이 오랫동안 있어 왔습니다. 점점 더 많은 국내 생산 이기종 컴퓨팅 파워 칩이 전국 각지의 로컬 컴퓨팅 파워 클러스터에서 사용됨에 따라 이기종 컴퓨팅 파워를 효과적으로 활용하기 어려운 문제가 점점 심각해지고 있으며 점차 중국 대형 모델 산업 발전의 병목 현상이 되고 있습니다. .
wuwen core dome은 소프트웨어 및 하드웨어 협업과 다중 이기종 기술의 장점을 활용하여 다중 칩 컴퓨팅 성능 기반을 기반으로 하는 infini-ai 이기종 클라우드 플랫폼을 만들었습니다. 이 플랫폼은 여러 이기종 컴퓨팅 파워 칩과 역호환되며, 현재 전국 15개 도시에서 가동 중인 컴퓨팅 파워를 효과적으로 활성화할 수 있습니다. 또한, infini-ai 이기종 클라우드 플랫폼에는 원스톱 ai 플랫폼(aistudio)과 대형 모델 서비스 플랫폼(genstudio)도 포함됩니다. 플랫폼 출시 이후 kimi, liblibai, liepin, shengshu technology, zhipu ai 등 대형 모델 산업의 많은 주요 고객이 infini-ai 이기종 클라우드 플랫폼에서 이기종 컴퓨팅 성능을 안정적으로 사용하고 번거로움 없는 대형 모델 개발을 즐겼습니다. core dome에서 제공하는 툴체인 서비스입니다.
infini-ai 이기종 클라우드 플랫폼은 하위 고객이 하드웨어 차이를 쉽게 보호하고 기본 이기종 컴퓨팅 성능을 원활하고 효율적으로 사용할 수 있도록 도울 뿐만 아니라 국내 이기종 컴퓨팅 성능의 생태학적 딜레마를 효과적으로 깨고 상위 계층의 점진적인 전환을 가속화할 것입니다. 컴퓨팅 파워 기반의 마이그레이션은 국내 대규모 모델 산업에서 사용 가능한 컴퓨팅 파워의 규모를 효과적으로 통합하고 확장하며, 실제로 이기종 컴퓨팅 파워를 사용 가능하고 충분하며 사용하기 쉬운 대규모 컴퓨팅 파워로 변환합니다. , 중국 특성을 지닌 현지화된 컴퓨팅 파워 구축을 지원합니다.
저자: 션 치우샤(shen qiusha)
글: shen qiusha 사진: 인터뷰 대상 제공 편집자: shen qiusha 편집자: ren quan
이 글을 퍼가실 때에는 출처를 꼭 밝혀주세요.
보고/피드백