소식

칭화, AI 라이트 트레이닝 칩 돌파! 네이처(Nature)에 게재된 결과

2024-08-10

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Core West는 8월 10일에 칭화대학교 전자공학과 Fang Lu 교수 연구 그룹과 칭화대학교 자동화학과 Dai Qionghai 교수 연구 그룹이 공동 연구를 진행했다고 보도했습니다.첫 번째완전한 순방향 지능형 광 컴퓨팅 교육 아키텍처, 개발됨"Tai Chi-II" 가벼운 훈련 칩, 오프라인 훈련에 대한 의존성을 탈피하고 대규모 광컴퓨팅 시스템을 구현신경망효율적이고 정확한 교육. 이번 주 국제 최고 학술지 네이처(Nature)에 관련 연구 결과가 게재됐다.

청화대학교 전자공학과에서는 다음과 같은 서문을 발표했습니다.태극권 II의 출현은 대규모 훈련에서 지능형 광학 컴퓨팅의 핵심 퍼즐의 공백을 메웠습니다.

광컴퓨팅은 높은 컴퓨팅 파워와 낮은 전력 소모라는 특징을 갖고 있으며, 지능형 컴퓨팅을 가속화하기 위한 최첨단 방향이다. 리뷰에서 언급된 Nature 리뷰어는 “이 기사에서 제안한 아이디어는 매우 참신합니다.이러한 유형의 광신경망(ONN)의 훈련 과정은 전례가 없습니다.. 제안된 방법은 효과적일 뿐만 아니라 구현하기도 쉽습니다. 그러므로 그것은광 신경망 및 기타 광 컴퓨팅 시스템을 훈련하기 위해 널리 채택되는 도구가 될 것으로 예상됩니다.”。

칭화대학교 전자학과는 이 논문의 첫 번째 단위입니다. Fang Lu 교수와 Dai Qionghai 교수는 칭화대학교 전자학과의 박사과정 학생 Xue Zhiwei와 박사후 연구원인 Zhou Tiankui가 공동 저자입니다. 이 연구에는 전자공학과 박사과정 Xu Zhihao와 Zhijiang 연구소의 Yu Shaoliang 박사가 참여했습니다. 이 프로젝트는 과학기술부, 중국 국립 자연과학 재단, 베이징 국가 정보 과학 기술 연구 센터, 칭화대학교-지장 연구소 공동 연구 센터의 지원을 받습니다.

1. 대칭을 영리하게 사용하면 광학 컴퓨팅이 GPU 의존성을 제거하는 데 도움이 됩니다.

광학 컴퓨팅은 기계 학습 애플리케이션의 속도와 에너지 효율성을 향상시킬 것을 약속합니다. 그러나 이러한 모델을 효과적으로 교육하는 현재 방법은 컴퓨터 시뮬레이션에 의해 제한됩니다.

만능 지능형 광컴퓨팅 칩 '태극권', 국제 최고 학술지 사이언스에 게재처음으로 광학 컴퓨팅이 원리 검증에서 대규모 실험 응용으로 추진되었습니다.160TOPS/W시스템 수준의 에너지 효율성은 복잡한 지능형 작업의 추론에 희망을 가져왔지만 광컴퓨팅의 '훈련력'을 방출하는 데는 실패했습니다.

추론에 비해 모델 훈련에는 많은 컴퓨팅 성능이 필요합니다. 전기 훈련 아키텍처는 순방향 전파 모델과 역방향 전파 모델 간의 높은 수준의 일치를 요구하며, 이는 광학 컴퓨팅 물리 시스템의 정확한 정렬에 대한 엄격한 요구 사항을 제시하여 어려운 기울기 계산, 느린 오프라인 모델링 및 큰 매핑 오류를 초래합니다. 광학 훈련의 규모와 효율성을 제한합니다.

Fang Lu와 Dai Qionghai 연구팀은 "광자 전파 대칭"이 열쇠를 사용해전체 전방 조명 훈련물리적 광학 컴퓨팅에 대한 전기 교육 아키텍처의 제약을 극복합니다.

논문의 첫 번째 저자인 Xue Zhiwei에 따르면 태극권 II 아키텍처를 바탕으로 다음과 같이 말했습니다.경사하강법광학계에서의 역전파는 광학계의 순전파로 변환되며, 데이터-오류 순전파를 2회 이용하여 광신경망의 훈련을 이룰 수 있다. 두 가지 순방향 전파는 자연스러운 정렬 특성을 가지므로 물리적 경사도를 정확하게 계산할 수 있습니다. 이러한 방식으로 달성된 훈련 정확도는 높으며 대규모 네트워크 훈련을 지원할 수 있습니다.

물리적 조명 시스템의 변조-전파와 신경망의 활성화-연결은 서로 매핑됩니다. 즉, 변조 모듈의 훈련은 모든 네트워크의 가중치 최적화를 추진할 수 있으므로 훈련의 속도와 에너지 효율성을 보장합니다.

역전파가 필요하지 않기 때문에 Taichi-II 아키텍처는 더 이상 오프라인 모델링 및 훈련을 위해 전기 컴퓨팅에 의존하지 않으며 대규모 신경망의 정확하고 효율적인 광학 훈련을 달성할 수 있습니다.

2. 수백만 개의 매개변수를 사용하여 광 네트워크를 훈련하면 속도가 10배 증가합니다.

빛을 컴퓨팅 매체로 사용하고 제어 가능한 빛 전파를 기반으로 컴퓨팅 모델을 구축하는 광학 컴퓨팅은 자연적으로 빛의 전체 전방 전파를 사용하여 훈련을 수행하는 특성을 가지며 속도와 에너지를 크게 향상시킬 수 있습니다. 광 네트워크 훈련의 효율성.

시스템 측정 결과에 따르면 Taichi-II는 다양한 광학 시스템을 훈련할 수 있으며 다양한 작업에서 탁월한 성능을 발휘합니다.

1. 대규모 학습 영역:계산의 정확성과 효율성 사이의 모순을 극복하고,수백만 개의 매개변수광 네트워크 훈련 속도가 향상되었습니다.1차수, 대표적인 지능형 분류 작업의 정확도가 향상됩니다.40%

2. 복잡한 장면의 지능형 이미징:저조도 환경(픽셀당 광도는 하위 광자에 불과함)에서는 에너지 효율이 달성됩니다.5.40×10^6 톱/폭전광처리, 시스템 차원의 에너지 효율 향상6차수. 비시야각과 같은 복잡한 장면 이미징 애플리케이션에서 킬로헤르츠 프레임 속도의 지능형 이미징이 달성되고 효율성이 향상됩니다.2차수

3. 토폴로지 포토닉스 분야:비-에르미트 특이점은 모델 사전에 의존하지 않고 자동으로 검색될 수 있으므로 복잡한 토폴로지 시스템의 효율적이고 정확한 분석을 위한 새로운 아이디어를 제공합니다.

3. 응용 및 이론적 진보를 촉진하고 대규모 AI 모델에 새로운 컴퓨팅 성능을 제공합니다.

Taichi-II는 또한 위상학적 포토닉스 분야에서 응용 가능성을 보여주었습니다. 이는 선험적 모델에 의존하지 않고 에르미트 특이점을 자동으로 검색할 수 있어 복잡한 위상학적 시스템의 효율적이고 정확한 분석을 위한 새로운 아이디어를 제공합니다.

예를 들어, 두 기기가 분리되면 Taichi I과 II는 각각 고에너지 효율 AI 추론과 훈련을 실현하고, 두 기기가 조화를 이루면 Taichi I과 II가 함께 대규모 지능형 컴퓨팅의 완전한 수명주기를 형성합니다. .

""태극권의 도는 두 가지 의식을 결정하고, 정의와 반우주를 통합하는 방법을 결정합니다." 이것은 태극권 시리즈의 변증법적 협력 구조를 설명하는 방법입니다. 우리는 그들이 함께 작용하여 새로운 자극을 주입할 것이라고 믿습니다. 컴퓨팅 파워를 미래의 대형 AI 모델로 발전시키고 빛을 구축하기 위해 컴퓨팅 파워의 새로운 기반을 마련합니다. "팡 루가 말했다.

연구팀은 원리 샘플을 기반으로 지능형 광 칩의 산업화를 향해 적극적으로 나아가고 있으며 이를 다양한 최종 지능형 시스템에 배포했습니다.

두 세대의 Taichi 칩은 지능형 광학 컴퓨팅의 엄청난 잠재력을 연속적으로 드러냈습니다. Taichi 시리즈를 포함한 광컴퓨팅 분야의 끊임없는 노력을 통해 지능형 광컴퓨팅 플랫폼은 자원 소비가 적고 대형 AI 모델, 일반 인공 지능 및 복잡한 지능형 시스템에 고속 및 에너지 효율적인 컴퓨팅을 제공할 것으로 기대됩니다. 더 작은 한계 비용. 새로운 길을 개척하세요.

원천:청화대학교 자연