소식

검이 가리키는 것은 32Tbps!인텔, 실리콘 포토닉스 통합 로드맵 공개, OCI 칩이 미래 AI 인프라의 기반 마련

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Xinxi는 7월 31일에 광섬유 통신 컨퍼런스(OFC)가 전 세계 광통신 분야에서 가장 높은 표준이자 최대 규모의 국제 행사로 인정받고 있으며 최첨단 광통신 기술 개발의 벤치마크라고 보도했습니다. 올해 광섬유 통신 컨퍼런스에서 인텔의 실리콘 포토닉스 통합 솔루션(IPS) 팀은 고대역폭 상호 연결 기술의 혁신을 촉진하는 획기적인 진전을 공유했습니다.실제 데이터를 실행하기 위해 Intel CPU와 함께 패키징된 업계 최고의 완전 통합형 OCI(Optical Computing Interconnect) 다이

데이터센터와 고성능 컴퓨팅(HPC) 애플리케이션을 위해 인텔이 개발한 OCI 코어는 광 I/O 코패키지를 구현해 최대 100미터 광섬유에서 단방향으로 64개의 32Gbps 채널을 지원할 수 있다. AI 인프라에 대한 수요 증가 더 높은 대역폭, 더 낮은 전력 소비 및 더 긴 전송 거리에 대한 수요 증가.

인텔은 OCI 알갱이의 정확한 크기를 공개하지 않았지만 최근 공개된 사진은 표준 2호 연필 끝에 달린 지우개와 OCI 알갱이를 비교한 모습이다.

OCI 코어 칩에 대한 보다 기술적인 세부 사항과 관련하여 Intel 연구소 부사장이자 Intel China 연구소 소장인 Song Jiqiang은 최근 코어 미디어 및 기타 미디어와 심도 있는 교류를 가졌습니다.Song Jiqiang은 실리콘 포토닉 통합을 위한 인텔의 미래 혁신 로드맵을 공유했습니다. 라인 속도, 광섬유당 파장 수, 광섬유 수 및 편광 모드를 증가시켜 차세대 OCI 코어의 성능을 확장하고 최대 대역폭32Tbps장치.

인텔은 다양한 내부 및 외부 고객에게 OCI 칩을 공급하고 있습니다. 특정 고객 애플리케이션과 제품 요구 사항에 따라 이러한 확장 계획의 순서와 시기가 결정됩니다.

1. 실리콘 조명으로 전기를 대체하다 ≒ 자전거가 오토바이로 변신하다

생성적 AI의 개발이 가속화됨에 따라 대형 모델에는 높은 컴퓨팅 밀도, 대용량 메모리 및 대역폭이 필요하며 단일 서버 노드에 배포하기 어렵기 때문에 크로스 랙 연결이 필요합니다. 대규모 컴퓨팅 클러스터는 더 긴 전송 거리와 더 높은 I/O 대역폭 요구 사항을 의미합니다.

Song Jiqiang은 AI 애플리케이션이 메모리 대 컴퓨팅 비율 측면에서 새로운 수준에 도달했으며 메모리 액세스가 필요한 경우가 많기 때문에 메모리 채널과 지연이 향후 대규모 애플리케이션 서비스를 제공하는 방법에 영향을 미칠 것이라고 말했습니다. 이를 위해서는 몇 가지 새로운 방법을 모색해야 합니다.컴퓨팅 성능과 스토리지 밀도를 높이는 동시에 전력 소비를 줄이고 크기를 줄여 제한된 공간에 더 많은 컴퓨팅 및 스토리지(칩)를 배치합니다.

과거 전기 I/O는 구리선을 사용하여 칩 간의 상호 연결을 완성했습니다. 구리선 속도는 충분히 빠르고 전력 소모도 낮지만 유효 전송 거리는 매우 제한적입니다.약 1미터

데이터센터 전체에 클러스터를 구축하게 되면 클러스터 면적이 크고, 케이블이 길고, 장거리 전송에 필요한 전력 소모가 많아 높은 컴퓨팅 파워와 에너지 절약을 동시에 달성하기 어렵다는 문제도 직면하게 된다. 데이터 센터에는 많은 서버 노드가 배치되어 있으며, 공급할 수 있는 전력에는 상한선이 있습니다. 칩 외에도 랙에서 전력을 소비하는 I/O 및 기타 장소도 있습니다. 각 칩에 할당되는 양은 매우 제한적입니다.

Song Jiqiang에 따르면 지난 20~30년 동안 전체 컴퓨팅 산업의 I/O에는 점점 더 많은 전력이 필요했습니다. 현재 기술을 사용하고 현재 규모를 사용하여 성장하면 공급되는 전력을 모두 소모하게 됩니다. 결과적으로 컴퓨팅 및 저장 칩에서 읽기 및 쓰기 작업을 수행할 전력이 충분하지 않습니다.I/O 부분에 사용되는 전력을 억제하려면 새로운 기술 솔루션을 사용해야 합니다.

인텔은 전통적인 전기 I/O를 전송 속도와 거리가 제한된 말이 끄는 마차에 비유합니다.100미터 이내더 높은 밀도와 더 유연한 데이터 전송을 달성하기 위해 실리콘 광자 통합 방법은 빠르고 유연하며 효과적이며 에너지를 절약하는 경량 오토바이와 같습니다.100미터 이상장거리 전송의 경우 플러그형 광트랜시버를 사용하는 것은 더 큰 용량과 충분히 빠른 속도로 자동차를 교체하는 것과 같습니다.

광 I/O 및 플러그형 광 트랜시버는실리콘 포토닉 인터커넥트이 솔루션은 전력 소모가 낮다는 장점이 있어 장거리 전송에 적합하다.

플러그형 광트랜시버이 솔루션은 상대적으로 완성도가 높으며 전자 집적 회로(EIC) 인터페이스에 직접 연결할 수 있어 전송 거리를 늘릴 수 있습니다. 그러나 크기가 더 크고 일반적으로 고속 직렬 변환기 및 역직렬 변환기(SerDes) 또는 디지털 신호 처리가 필요합니다. (DSP) 기술로 인해 기능이 제한되고, 대역폭 밀도가 낮아지며, 지연 시간이 길어집니다.

그리고 사용하여실리콘 포토닉스 통합기술, 광학 I/O는 AI 확장 요구 사항을 충족하기 위해 낮은 전력 소비, 높은 대역폭 밀도, 낮은 대기 시간 및 긴 전송 거리로 멀티 Tbps 대역폭을 달성할 수 있습니다.

OCI 핵심입자(또는 모든 광학 I/O 솔루션)은 CPU, GPU 또는 SoC와 공동 밀봉되어 I/O 대역폭 밀도, 총 에너지 효율성, 대기 시간 및 비용을 최적화하고 향상시킬 수 있을 뿐만 아니라 HBM과 같은 리소스 분리를 ​​지원하는 새로운 아키텍처를 통해 개선할 수 있습니다. 또는 CXL 메모리 풀링)을 통해 보다 효율적인 리소스 활용을 달성할 수 있습니다.

앞으로 인텔은 OCI 광전자 공동 패키징 및 플러그형 솔루션을 포함하여 다양한 전송 거리에 맞는 다양한 솔루션을 제공할 것입니다.

둘,CPU와 공동으로 패키지되어 있으며,인텔 OCI 칩은 어떻게 에너지 효율성을 제공합니까?

Intel OCI 다이는 온칩 고밀도 파장 분할 다중화 레이저 및 반도체 광 증폭기를 갖춘 실리콘 포토닉스 집적 회로(PIC)와 PIC를 제어하고 호스트에 연결하기 위한 EIC를 포함하는 완전한 물리 계층 광 I/O 장치입니다. .

EIC의 기능은 특정 신호가 어떻게 사용되고 어떤 부분이 연결되는지에 더 가깝습니다. 프로토콜의 변환 및 적응 계층이 됩니다. PIC는 빛의 안정적인 전송 문제 해결, 신호 업그레이드 및 전송, 유전체와 광 미디어 간의 우수한 변환을 완료하는 방법과 같은 지속 가능한 진화에 관한 것입니다.

EIC는 표준 CMOS 프로세스 노드를 사용하고 PIC는 300mm 실리콘 웨이퍼를 기반으로 하는 Intel의 실리콘 포토닉스 제조 프로세스를 사용합니다. 일반적으로 EIC는 지원되는 메인 칩에 근접하거나 정렬하기 위해 상대적으로 진보된 프로세스를 사용하는 반면, PIC는 보다 성숙한 프로세스를 사용합니다.

플러그형 방법이 없기 때문에 이러한 컴퓨팅 구성 요소 자체는 대역폭을 늘리고 전송 거리를 연장하는 동시에 실리콘 광학 상호 연결의 통합을 효과적으로 개선하여 성능과 에너지 소비를 개선하고 클러스터 밀도를 높이는 데 도움이 됩니다.

Intel의 완전 통합형 OCI 칩은 최대 양방향 데이터 전송 속도를 가능하게 합니다.4테라바이트, 그리고 호환 가능PCIe 5세대, 단방향 지원32Gbps의 64레인(Song Jiqiang은 현재 데이터 센터에서는 이 정도면 충분하다고 말했습니다.) 전송 거리는 최대100미터(전송 지연으로 인해 실제 적용 시 거리는 수십 미터로 제한될 수 있습니다.)

8개 파장의 DWDM(밀집파장분할다중화)을 가진 8쌍의 광섬유를 사용하며, 전력 소모는비트당 5pJ(피코줄), 플러그형 광트랜시버 모듈만 전력 소비1/3

Song Jiqiang에 따르면 Intel은 장치 및 패키징 설계, 제조 공정 및 대역폭 확장의 다양한 개선을 통해 다음 세대 제품에서 에너지 효율성을 10%까지 낮출 것이라고 확신합니다.비트당 3.5PJ다음과 같은.

2024년 광섬유 통신 컨퍼런스에서 인텔은 단일 모드 광섬유(SMF) 점퍼를 통해 두 데이터 센터 CPU 플랫폼 간의 송신기와 수신기 상호 연결을 보여주는 라이브 광학 링크 시연을 진행했습니다.

CPU는 비트 오류율을 생성하고 측정합니다. 두 개의 데이터 센터 CPU는 서로 데이터를 주고받습니다. OCI 코어는 CPU의 모든 전기적 I/O 신호를 광섬유를 통해 빛으로 변환하여 두 데이터 센터에서 전송합니다. 노드나 시스템 사이를 왔다 갔다 합니다.

그림에서 볼 수 있듯이 양쪽 시스템 호스트에는 전기 신호가 있으며, 이는 광전 변환 칩을 통해 빛으로 변합니다. 송신기는 단일 광섬유에서 200GHz 간격의 8개 파장을 포함하여 총 1.6THz 스펙트럼을 가지며 32Gbps 송신기 아이 다이어그램은 강력한 신호 품질을 나타냅니다.

색깔이 있는 부분은 빛이고, 서로 다른 색깔은 서로 다른 파장의 빛을 나타내며, 변조와 복조 시 서로 간섭하지 않도록 주파수 간격이 충분합니다. 이러한 빛은 함께 결합되어 광섬유를 통해 전송될 수 있습니다. 즉, 여러 대역이 광섬유에서 "다중화"될 수 있습니다. 이는 무선 통신 분야의 주파수 분할 다중화와 동일합니다.

빛의 대역폭은 매우 크기 때문에 상대적으로 안정적인 대역폭을 선택하고 이를 다양한 파장대로 잘라 인간의 눈에는 다양한 색상의 빛으로 나타날 수 있습니다. 실제로 이들은 서로 다른 주파수의 대역이며, 전송되는 신호는 각 대역에서 안정적으로 변조될 수 있습니다. 광전 변조 후 신호는 광섬유를 통해 전송됩니다.

Song Jiqiang은 Intel OCI 칩의 성능 진화 로드맵을 공유했습니다. 기술 반복에는 세 가지 주요 방향이 있습니다.광파의 파장수, 광섬유의 전송속도, 광섬유의 수.

광섬유는 여러 대역으로 분할되어 전송될 수 있으며, 현재 8개 대역으로 전송이 가능하며, 각 대역에 따라 디버깅된 데이터 전송 속도는 동시에 결합할 수 있는 광섬유 쌍 수는 32Gbps입니다. 8. 서로 영향을 주지 않고 하는 것이 맞다. 이 3을 곱하면 단방향 데이터 전송 속도는 2Tbps, 양방향 속도는 4Tbps가 됩니다.

앞으로는 8밴드 대역을 유지하고 광섬유 전송 속도를 64Gbps로 높이면 단방향 데이터 전송 속도는 4Tbps로 두 배로 늘어난다. 이후 16밴드로 바뀌면 전송 속도가 빨라진다. 8Tbps로. 앞으로도 계속 발전하여 점차적으로 대역폭을 늘릴 수 있습니다.

3. 미래에는 GPU와도 통합될 수 있습니다.차별화된 장점을 해체

별도의 솔루션과 플러그인 솔루션에 비해,OCI 칩과 CPU를 함께 밀봉하는 경우 열 관리를 전체적으로 고려해야 하며, 패키징 수준에서 신호 전송 밀도와 전송 주파수가 보장되어야 합니다. . 인텔의 현재 기술은 이미 이러한 요구를 충족할 수 있습니다.

미래에는 OCI 칩을 이용해 통신을 구현할 수도 있고, CPU, GPU, IPU 등 컴퓨팅 칩과 통합될 수도 있다.실리콘 포토닉스 통합 및 고급 패키징 기술을 통해 인텔은 더 높은 밀도의 I/O 칩을 달성한 다음 이를 다른 xPU와 결합하여 장래에 유망한 애플리케이션 전망과 함께 칩을 기반으로 다양한 유형의 컴퓨팅 및 상호 연결 칩을 형성할 수 있습니다.

Song Jiqiang은 또한 다른 유형의 칩과의 후속 통합 문제는 기술 수준이 아니라 구현 수준에서 주의해야 할 사항은 다음과 같다고 설명했습니다.대역폭 밀도 예를 들어, 광전 인터페이스 사이의 거리가 제한되어 있는 경우 이러한 광전 변환 인터페이스를 어떻게 배치합니까? 특정 크기 범위 내에서 달성 가능한 대역폭 밀도가 충분합니까?

그에 따르면 OCI 칩의 유연성을 높이고 통합 과정에서 작업량을 줄이기 위해일반적으로 UCIe, PCIe, 이더넷 등과 같은 강력한 IP 에코시스템을 통해 표준화된 호스트 xPU와 I/O 사이의 전기 인터페이스 사용을 고려할 수 있습니다.

그는 또한 인텔 솔루션의 차별화된 장점에 대해서도 이야기했습니다.

첫째, 인텔은 더 높은 출력과 신뢰성, 더 낮은 총 비용으로 고집적 레이저를 웨이퍼 수준에서 대량 생산할 수 있습니다. 이론을 고수율 생산으로 전환한 후에야 산업화 역량이 형성될 수 있습니다.

기존 외부 레이저 솔루션은 특수 광섬유를 사용해야 하는데, 이는 비용이 많이 들고 대규모 구축 사례가 없습니다.온칩 레이저의 장점은 일반 광섬유를 사용해 전송할 수 있다는 점이다. 외부 광원이 필요하지 않기 때문에 편광을 유지하는 광섬유가 필요하지 않다.(PMF, 외부 광원을 수동 실리콘 광자 집적 회로에 연결하는 데 필요한 특수 광섬유).

레이저 송신기를 만들 때 별도의 장치를 만드는 것이 비교적 간단합니다. 웨이퍼에 레이저를 만드는 데는 기술적 한계가 있다. 다양한 종류의 반도체를 웨이퍼 레벨에서 잘 접착해야 하며, 이후 반도체 제조 공정을 통해 제어 회로를 형성할 수 있다. 광원, 변조기, 증폭기, 광 도파관, 검출기 등을 포함한 광학 장치는 웨이퍼 수준에서 구현되어야 합니다.

둘째, 인텔은 업계 최고의 안정성을 갖춘 입증된 대용량 플랫폼과 장치를 보유하고 있습니다.

Intel OCI 칩은 2015년부터 하이퍼스케일 데이터 센터에서 연결 애플리케이션을 100% 이상 제공해온 자체 생산 검증된 실리콘 포토닉스 통합 플랫폼을 기반으로 구축되었습니다.800만광트랜시버 모듈(이상 포함)800만실리콘 포토닉스 집적 회로 및 그 이상3,200만통합 레이저), 100Gbps, 200Gbps 및 400Gbps의 전송 속도가 필요한 애플리케이션에 사용됩니다.

수백만 대의 장치에서 신뢰성이 검증되었으며 데이터에 따르면 레이저의 FIT(시간 기반 오류율)는0.1, 이는 오류가 100억 시간마다 한 번만 발생할 수 있다고 말하는 것과 같습니다.

또한 두 개의 별도 칩(실리콘 포토닉스 집적 회로 및 전자 집적 회로)에 포토닉 및 CMOS 회로를 구축하여 확장성과 성능 최적화를 보장합니다., 단일 칩에 크게 다른 두 가지 기술을 결합하는 데 필요한 타협이나 절충이 필요하지 않습니다.

인텔의 고급 패키징, 시스템 및 플랫폼 축적을 통해 광학 I/O 솔루션을 최적화할 수도 있습니다.인텔은 선도적인 장치 성능 향상, 더 높은 밀도, 더 나은 결합 및 더 높은 경제적 이점을 달성하기 위해 새로운 실리콘 포토닉스 제조 프로세스 노드의 연구 개발에 투자하고 있습니다. 또한 온칩 레이저 및 광 트랜시버의 성능과 비용을 지속적으로 개선할 것입니다. .그리고 신뢰성.

결론: 기술 프로토타입에서 상용화 솔루션으로 전환

실리콘 포토닉스 분야에서 인텔 연구소는 25년 이상 실리콘 포토닉스에 깊이 관여해 왔으며 실리콘 포토닉스 통합의 선구자이자 리더입니다. 인텔은 업계 최초로 실리콘 광자 연결 장치를 개발하여 대규모 클라우드 서비스 제공업체에 대량으로 제공하고 있으며 고객과 협력하여 OCI 칩 기술 프로토타입을 확장 가능한 상용 솔루션으로 전환하고 있습니다.

비용 측면에서 Intel은 시간이 지남에 따라 볼륨이 증가함에 따라 광학 I/O의 비트당 총 상호 연결 비용이 시스템 수준의 전기 I/O와 비슷해질 것이라고 믿습니다. 강력한 광 I/O 성능은 시스템 수준의 성능 향상에도 도움이 됩니다.

이 목표를 달성하기 위해 인텔은 현재 2세대 실리콘 포토닉스 제조 공정 노드를 개발하고 있으며, 이를 통해 칩 면적을 40% 이상, 전력 소모를 15% 이상 줄여 경제적 이익을 향상시키고 광결합 효율을 향상시킬 것으로 예상된다. 레이저 파워 등이 발전합니다.