소식

CPU와 GPU의 상호 연결이 1미터에서 100미터로 치솟았습니다. 인텔: 빛을 믿으십니까?

2024-07-27

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Jin Lei는 Aofei Temple 출신입니다.
Qubits 공개 계정 QbitAI

인텔의 경우"빛", 대형 모델 시대의 난제인 컴퓨팅 파워 문제를 돌파하다——

업계 최초로 완전 통합형 출시오시이(광 컴퓨팅 상호 연결) ​​칩.



△출처 : 인텔

대규모 AI 모델이 스케일링 법칙을 따를 때 더 나은 결과를 얻으려면 모델 규모나 데이터 규모가 더 큰 추세를 향해 발전한다는 것을 알아야 합니다.

이로 인해 대규모 AI 모델은 컴퓨팅 성능 수준에서 중간 I/O 통신을 포함하여 전체 컴퓨팅 및 스토리지에 대한 더 높은 요구 사항을 제시하게 됩니다.

이번 인텔의 돌파구는 바로I/O 통신

CPU와 GPU에서는데이터 전송에는 전기 I/O 대신 광학 I/O를 사용합니다.

용도는 무엇입니까?

간단히 말해서,데이터 전송 거리가 훨씬 깁니다.양이 많다소비전력이 낮다——대형 AI 모델에는 "체격"이 더 적합합니다.



△출처 : 인텔

그렇다면 인텔은 왜 "빛"을 사용합니까? 구체적으로 어떻게 구현되나요?

"빛"을 사용해 마차에서 트럭으로 바뀌었다

전통적인 전기 I/O(구리선 연결) 방식은 확실히 높은 대역폭 밀도와 낮은 전력 소모를 지원한다는 장점이 있지만 치명적인 문제는전송 거리가 비교적 짧습니다(1미터 미만).

랙에 배치하면 문제가 없지만, 대규모 AI 모델의 컴퓨팅 성능은 서버 클러스터 수준인 경우가 많다.

넓은 면적을 차지할 뿐만 아니라 N개의 랙에 걸쳐 있기 때문에 케이블 길이가 수십 미터, 심지어 수백 미터에 달해야 하며 전력 소비도 상당히 높아 랙에 공급되는 전력을 모두 소모하게 됩니다. 컴퓨팅과 메모리 칩 읽기 및 쓰기 작업을 수행할 전력이 충분하지 않습니다.

게다가,예금 대 계좌 비율반면, 한 번 읽고 수백 번의 계산을 수행하는 원래 비율이 이제 1:1에 가까워진 것은 바로 대형 모델의 "큰" 특성 때문입니다.



△출처 : 인텔

이를 위해서는 컴퓨팅 성능과 스토리지 밀도를 높이는 동시에 전력 소비를 줄이고 크기를 줄여 제한된 공간에 더 많은 컴퓨팅과 스토리지를 배치할 수 있는 새로운 방법이 필요합니다.

광 I/O를 사용하면 문제가 해결됩니다.

최대 100미터의 광섬유에서 한 방향으로 64개의 32Gbps 채널을 지원할 수 있습니다.

이미지 은유는 다음과 같습니다.마차(제한된 용량 및 거리) 사용자동차와 트럭상품 배송(더 많은 수량과 더 먼 거리).

뿐만 아니라, 상대적으로 가까운 거리에서 더 높은 밀도와 유연한 데이터 전송 작업을 수행하는 경우에도 OCI는 다음과 같습니다.오토바이, 더 빠르고 유연합니다.

이 OCI 방식이 단지 이론적인 것이 아니라는 점은 언급할 가치가 있습니다.

Intel에 따르면 입증된 실리콘 포토닉스 기술을 활용하여 온칩 레이저, 광 증폭기 및 전자 집적 회로가 포함된 실리콘 포토닉스 집적 회로(PIC)를 통합했습니다.

그리고 자체 CPU와 함께 패키징된 OCI 칩이 차세대 CPU, GPU, IPU 등 SOC(시스템온칩)와도 통합될 수 있음을 이전에 입증한 바 있다.

아직 완성되지 않은 인텔은 800만 개가 넘는 실리콘 광자 집적 회로를 출하했으며, 그 중 3,200만 개 이상의 레이저가 현재 사용되고 있습니다.



△출처 : 인텔

그래서 다음 질문은 다음과 같습니다.

인텔의 OCI는 어떻게 "정제"됩니까?

Intel Research 부사장 겸 Intel China Research 이사송지창의사소통 과정에서 그는 이 문제에 대해 심층적인 분석과 해석을 했다.



△송지창(Song Jiqiang) 인텔 연구소 부사장 겸 인텔 차이나 연구소 소장

실리콘 포토닉스 기술은 20세기의 가장 중요한 두 가지 발명품인 실리콘 집적 회로와 반도체 레이저를 결합합니다.

이는 Intel의 대량 실리콘 제조의 효율성을 활용하면서 기존 전자 장치보다 더 먼 거리에서 더 빠른 데이터 전송 속도를 지원합니다.



인텔이 이번에 공개한 실리콘 포토닉스 통합 기술인 OCI 칩은 광전자 공동 패키징 수준에 도달했다.

이 광전자 공동 패키지는 실리콘 광전자 집적 회로(PIC)와 전자 집적 회로(EIC)를 기판에 배치하여 통합 연결 구성 요소 역할을 하는 OCI 칩을 형성합니다.

이는 CPU를 포함한 xPU와 향후 GPU가 OCI 칩과 함께 패키징될 수 있음을 의미합니다.

OCI 코어는 데이터센터 CPU에서 나오는 모든 전기적 입출력 신호를 빛으로 변환해 광섬유를 통해 두 데이터센터의 노드나 시스템 간에 전송한다.

현재 양방향 데이터 전송 속도는 4Tbps에 달하며 상위 계층 전송 프로토콜은 PCIe 5.0과 호환되며 단방향으로 64개의 32Gbps 채널을 지원하며 이는 현재 데이터 센터에서 충분합니다.

8쌍의 광섬유를 사용하며 비트당 5피코줄(10-12줄)만 소비합니다. 이 데이터는 플러그형 광 트랜시버 모듈의 전력 소비보다 3배 낮습니다(후자는 비트당 15피코줄). ).



△출처 : 인텔

광 전송 채널에는 실제로 8개의 서로 다른 대역이 있으며 각 대역의 주파수 간격은 200GHz이며 전송을 위해 총 1.6THz 스펙트럼 간격을 차지합니다.

빛의 범위는 가시광선부터 눈에 보이지 않는 빛까지입니다. 실제로 그 스펙트럼 폭은 THz부터 매우 넓습니다.



그렇다면 OCI 코어입자는 앞으로 어떤 분야에 활용될까요?

이에 대해 송지강은 이렇게 말했다.

하나는 이를 사용하여 통신을 달성할 수 있고 CPU 및 GPU와 같은 컴퓨팅 칩과 함께 패키지할 수도 있다는 것입니다. 컴퓨팅과 통신은 매우 긴밀하게 패키지되어 있습니다.
실리콘 포토닉스 통합 및 고급 패키징 기술을 통해 고급 패키징 Intel은 또한 더 높은 밀도의 I/O 칩을 달성하고 이를 다른 xPU와 결합하여 향후 칩을 기반으로 다양한 유형의 컴퓨팅을 형성할 수 있는 다양한 기술을 보유하고 있습니다. 상호 연결 칩은 매우 좋은 응용 전망을 가지고 있습니다.

OCI I/O 인터페이스 칩의 성능 진화 로드맵에 따르면 현재 32Tbps 전송 속도의 기술 솔루션에 도달할 수 있으며 주로 다음 세 가지 지표의 반복적이고 꾸준한 개선에 의존합니다.

  • 광섬유에는 8개의 안정적인 밴드가 있습니다.
  • 각 밴드의 광 데이터 전송 속도는 32Gbps입니다.
  • 서로 영향을 주지 않고 동시에 8쌍의 광섬유를 당길 수 있습니다.

이 세 가지 지표를 곱하면 현재 데이터 전송 속도는 단방향 2Tbps, 양방향 4Tbps이다. 앞으로도 우리는 지속적으로 발전하여 대역폭 성능을 점진적으로 향상시킬 수 있습니다.



△출처 : 인텔

마지막으로 Song Jiqiang은 실리콘 포토닉스 통합 기술에 있어서 인텔의 차별화에 대해서도 설명했습니다.

가장 큰 이유는 웨이퍼 위에 고주파 레이저 이미터를 구축하고 실리콘 광 증폭기를 통합하기 때문입니다. 이는 두 가지 상대적으로 핵심 기술이며 둘 다 웨이퍼 수준에서 제조됩니다.
다음으로, 이러한 고집적 레이저를 대량 생산할 수 있습니다. 왜냐하면 이 온칩 레이저의 장점은 일반 광섬유를 사용하여 전송할 수 있다는 것입니다.
그리고 안정성 측면에서는 거의오류가 발생하는 데 100억 시간이 걸립니다.

그렇다면 인텔픽의 '가벼움'에 대해 어떻게 생각하시나요? 토론을 위해 댓글 영역에 메시지를 남겨주신 것을 환영합니다.

참조 링크:
[1]https://mp.weixin.qq.com/s/ozx_ficqlxjEPKa5AlBdfA
[2]https://community.intel.com/t5/블로그/기술-혁신/인공-지능-AI/인텔-쇼-OCI-광학-IO-칩렛-CPU와-공동-패키지-포함-CPU-at/post/1582541
[3]https://www.youtube.com/watch?v=Fml3yuPR2AU