notícias

A espada aponta para 32Tbps!Intel revela roteiro de integração fotônica de silício, chips OCI estabelecem bases para futura infraestrutura de IA

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

A Xinxi informou em 31 de julho que a Conferência de Comunicações de Fibra Óptica (OFC) é reconhecida como o maior e mais alto evento internacional na área de comunicações ópticas do mundo e é uma referência para o desenvolvimento de tecnologias de comunicações ópticas de ponta. Na Conferência de Comunicações de Fibra Óptica deste ano, a equipe Silicon Photonics Integrated Solutions (IPS) da Intel compartilhou seu progresso revolucionário na promoção da inovação em tecnologia de interconexão de alta largura de banda -Matriz OCI (Optical Computing Interconnect) líder do setor e totalmente integrada, empacotada com CPUs Intel para executar dados reais

Para aplicações de data center e computação de alto desempenho (HPC), o núcleo OCI criado pela Intel realiza um co-pacote de E/S óptica e pode suportar 64 canais de 32 Gbps em uma direção em fibra óptica de até 100 metros, o que deve atender aos crescente demanda por infraestrutura de IA Demanda crescente por maior largura de banda, menor consumo de energia e maior distância de transmissão.

A Intel não divulgou as dimensões exatas dos pellets OCI, mas fotos divulgadas recentemente mostram os pellets OCI em comparação com a borracha na ponta de um lápis padrão nº 2.

Em relação a mais detalhes técnicos dos chips principais da OCI, Song Jiqiang, vice-presidente do Intel Research Institute e diretor do Intel China Research Institute, recentemente teve intercâmbios aprofundados com a mídia principal e outras mídias.Song Jiqiang compartilhou o futuro roteiro de inovação da Intel para integração fotônica de silício. Ao aumentar a taxa de linha, o número de comprimentos de onda por fibra, o número de fibras e o modo de polarização, espera-se expandir o desempenho das futuras gerações de núcleos OCI e criar um. largura de banda de até32 Tbpsdispositivo.

A Intel está fornecendo chips OCI para vários clientes internos e externos. As aplicações específicas dos clientes e os requisitos do produto determinarão a sequência e o momento desses planos de expansão.

1. Eletricidade substituída por luz de silicone ≈ bicicleta transformada em motocicleta

À medida que o desenvolvimento da IA ​​generativa acelera, modelos grandes exigem alta densidade computacional, grande capacidade de memória e largura de banda, e são difíceis de implantar em um único nó de servidor, portanto, são necessárias conexões entre racks. Grandes clusters de computação significam distâncias de transmissão mais longas e maiores requisitos de largura de banda de E/S.

Song Jiqiang disse que os aplicativos de IA atingiram um novo nível em termos de relação memória-computação, e o acesso à memória é frequentemente necessário. Portanto, os canais de memória e os atrasos afetarão a forma de fornecer serviços de aplicativos em grande escala no futuro. Isto requer explorar alguns novos métodos,Ao mesmo tempo que aumenta o poder de computação e a densidade de armazenamento, reduz o consumo de energia e diminui o tamanho, colocando assim mais computação e armazenamento (chips) num espaço limitado.

No passado, as E/S elétricas usavam fios de cobre para completar a interconexão entre os chips. A velocidade do fio de cobre é rápida o suficiente e o consumo de energia é baixo, mas a distância efetiva de transmissão é muito limitada, tão curta quanto.Cerca de 1 metro

Se você construir um cluster em todo o data center, também enfrentará problemas de grande área de cluster, cabos longos e alto consumo de energia para transmissão de longa distância, dificultando a obtenção de alto poder de computação e economia de energia. Existem muitos nós de servidor colocados em um data center e há um limite máximo de energia que pode ser fornecida. Além dos chips, também há E/S e outros locais que consomem energia no rack. alocado para cada chip é muito limitado.

De acordo com Song Jiqiang, nos últimos 20 a 30 anos, a E/S em toda a indústria de computação exigiu cada vez mais energia. Se a tecnologia atual for usada e a escala atual for usada para crescer, ela consumirá toda a energia fornecida. ao rack Como resultado, não há eletricidade suficiente para realizar operações de leitura e gravação nos chips de computação e armazenamento.Novas soluções técnicas devem ser utilizadas para suprimir a potência utilizada na parte de E/S.

A Intel compara a E/S elétrica tradicional a uma carruagem puxada por cavalos, com velocidade e distância de transmissão limitadas;Dentro de 100 metrosPara obter maior densidade e transmissão de dados mais flexível, o método de integração fotônica de silício é como uma motocicleta leve, que é rápida, flexível, eficaz e economiza energia;Mais de 100 metrosPara transmissão de longa distância, usar um transceptor óptico conectável é como substituir um carro com maior capacidade e velocidade suficientemente rápida.

E/S óptica e transceptores ópticos conectáveis ​​sãoInterconexão fotônica de silícioA solução tem a vantagem de baixo consumo de energia e é adequada para transmissões em longas distâncias.

Transceptor óptico conectávelA solução é relativamente madura e pode ser conectada diretamente à interface do circuito integrado eletrônico (EIC), o que pode aumentar a distância de transmissão. No entanto, é maior em tamanho e geralmente requer serializador e desserializador de alta velocidade (SerDes) ou processamento de sinal digital. (DSP) Portanto, a funcionalidade é limitada. O consumo é maior, a densidade da largura de banda é menor e o atraso é maior.

E usandoIntegração Fotônica de SilícioTecnologia, E/S óptica pode atingir largura de banda multi-Tbps com baixo consumo de energia, alta densidade de largura de banda, baixa latência e maior distância de transmissão para atender às necessidades de expansão de IA.

Partículas do núcleo OCI(ou qualquer solução de E/S óptica) co-selada com a CPU, GPU ou SoC pode otimizar e melhorar a densidade da largura de banda de E/S, eficiência energética total, latência e custo, bem como através de novas arquiteturas que suportam desagregação de recursos, como HBM ou pool de memória CXL) para obter uma utilização de recursos mais eficiente.

No futuro, a Intel fornecerá soluções diferentes para diferentes distâncias de transmissão, incluindo pacotes optoeletrônicos OCI e soluções conectáveis.

dois,Embalado em conjunto com a CPU,Como o chip Intel OCI traz eficiência energética?

A matriz Intel OCI é um dispositivo de E/S óptica de camada física completa, incluindo um circuito integrado fotônico de silício (PIC) com lasers de multiplexação por divisão de comprimento de onda denso no chip e amplificadores ópticos semicondutores, e um EIC para controlar o PIC e conectar ao host .

A função do EIC está mais próxima de como os sinais específicos são usados ​​e quais partes estão conectadas a ele. Ele se tornará uma camada de conversão e adaptação em um protocolo. PIC trata mais de resolver o problema de transmissão estável de luz, atualização e envio de sinais e evolução sustentável, como completar uma boa conversão entre meios dielétricos e ópticos.

O EIC usa nós de processo CMOS padrão e o PIC usa o processo de fabricação de fotônica de silício da Intel baseado em wafers de silício de 300 mm. Normalmente o EIC utiliza um processo relativamente avançado para estar próximo ou alinhado com o chip principal a ser suportado, enquanto o PIC utiliza um processo mais maduro.

Como não existe um método conectável, esses próprios componentes de computação têm menor potência. Ao mesmo tempo que aumentam a largura de banda e estendem a distância de transmissão, eles podem efetivamente melhorar a integração das interconexões ópticas de silício, melhorando assim o desempenho e o consumo de energia e ajudando a aumentar a densidade do cluster.

O chip OCI totalmente integrado da Intel permite velocidades de transmissão de dados bidirecionais de até4 Tbpse compatível comPCIe 5ª geração, suporte unilateral64 pistas de 32 Gbps(Song Jiqiang disse que isso é suficiente nos data centers atuais), com uma distância de transmissão de até100 metros(Devido a atrasos na transmissão, a distância pode ser limitada a dezenas de metros em aplicações reais).

Ele usa 8 pares de fibras ópticas, cada um com 8 comprimentos de onda de multiplexação por divisão de comprimento de onda densa (DWDM), e o consumo de energia é de apenas5pJ por bit(picojoules), apenas consumo de energia do módulo transceptor óptico conectável1/3

De acordo com Song Jiqiang, a Intel está confiante de que, por meio de várias melhorias no design de dispositivos e embalagens, processos de fabricação e expansão da largura de banda, reduzirá a eficiência energética para até 10% nas gerações subsequentes de produtos.3,5PJ por bita seguir.

Na Conferência de Comunicações de Fibra Óptica de 2024, a Intel conduziu uma demonstração de link óptico ao vivo, mostrando a interconexão de transmissor e receptor entre duas plataformas de CPU de data center por meio de jumpers de fibra monomodo (SMF).

A CPU gera e mede a taxa de erro de bit. Duas CPUs de data center enviam e recebem dados uma para a outra. Um núcleo OCI e uma CPU são empacotados juntos. O núcleo OCI converte todos os sinais elétricos de E/S da CPU em luz, por meio de fibras ópticas, nos dois data centers. para frente e para trás entre nós ou sistemas.

Conforme mostrado na figura, existem sinais elétricos nos hosts do sistema em ambos os lados, que são transformados em luz por meio de chips de conversão fotoelétrica. O transmissor tem um espectro total de 1,6 THz, incluindo 8 comprimentos de onda espaçados em 200 GHz em uma única fibra, e um diagrama ocular do transmissor de 32 Gbps indica forte qualidade de sinal.

A parte colorida é a luz, e cores diferentes representam luz de diferentes comprimentos de onda, com intervalos de frequência suficientes para que não interfiram entre si durante a modulação e desmodulação. Essas luzes podem ser combinadas e transmitidas em uma fibra óptica, ou seja, múltiplas bandas podem ser "multiplexadas" em uma fibra óptica, o que é o mesmo que multiplexação por divisão de frequência no campo das comunicações sem fio.

Como a largura de banda da luz é muito grande, você pode selecionar uma largura de banda relativamente estável e cortá-la em muitas bandas de ondas diferentes, que aparecem ao olho humano como luz de cores diferentes. Na verdade, são bandas de frequências diferentes e o sinal a ser transmitido pode ser modulado de forma estável em cada banda. Após a modulação fotoelétrica, o sinal é transmitido através de fibra óptica.

Song Jiqiang compartilhou o roteiro de evolução do desempenho dos chips Intel OCI. Existem três direções principais para a iteração da tecnologia:O número de comprimentos de onda das ondas de luz, a taxa de transmissão das fibras ópticas e o número de fibras ópticas.

Uma fibra óptica pode ser dividida em diferentes bandas para transmissão Atualmente, 8 bandas podem garantir uma transmissão estável. A taxa de transmissão de dados depurada à luz de cada banda é de 32 Gbps. sem afetar um ao outro está 8. certo. Multiplicada por três, a velocidade de transmissão de dados unidirecional chega a 2Tbps e a velocidade bidirecional é de 4Tbps.

No futuro, se a banda de 8 bandas permanecer inalterada e a taxa de transmissão de fibra aumentar para 64 Gbps, a velocidade de transmissão de dados unidirecional será duplicada para 4 Tbps. Mais tarde, se passar a 16 bandas, a velocidade de transmissão será aumentada. para 8 Tbps. Pode continuar a evoluir no futuro e aumentar gradualmente a largura de banda.

3. No futuro, também pode ser integrado com GPU, váriosDesmontando as vantagens diferenciais

Comparado com soluções separadas e plug-in,Quando o chip OCI e a CPU são co-selados, o gerenciamento térmico precisa ser considerado como um todo, e a densidade e a frequência de transmissão do sinal devem ser garantidas no nível do pacote. . A tecnologia atual da Intel já é capaz de atender a essas necessidades.

No futuro, os chips OCI podem ser usados ​​para implementar comunicações e também podem ser integrados a chips de computação como CPU, GPU e IPU.Por meio da integração fotônica de silício e da tecnologia de empacotamento avançada, a Intel pode obter chips de E/S de maior densidade e, em seguida, combiná-los com outros xPUs para formar muitos tipos diferentes de chips de computação e interconexão baseados nos chips no futuro, com perspectivas de aplicação promissoras.

Song Jiqiang explicou ainda que o desafio da integração subsequente com outros tipos de chips não está no nível técnico, mas no nível de implementação, o que precisa ser prestado atenção édensidade de largura de banda , por exemplo, quando a distância entre as interfaces fotoelétricas é limitada, como colocar essas interfaces de conversão fotoelétrica? A densidade de largura de banda alcançável é suficiente dentro de uma determinada faixa de tamanho?

Segundo ele, para flexibilizar o chip OCI e reduzir a carga de trabalho durante o processo de integração,Normalmente, seria considerado o uso de uma interface elétrica entre o host xPU e a E/S que foi padronizada por meio de um ecossistema IP robusto, como UCIe, PCIe, Ethernet, etc.

Ele também falou sobre as vantagens diferenciais da solução da Intel.

Primeiro, a Intel pode produzir em massa lasers altamente integrados no nível do wafer, com maior produção e confiabilidade e menor custo total. Somente depois de transformar a teoria em produção de alto rendimento é que as capacidades de industrialização podem ser formadas.

As soluções de laser externo existentes requerem o uso de fibras ópticas especializadas, que são caras e não possuem casos de implantação em grande escala.A vantagem dos lasers no chip é que eles podem ser transmitidos usando fibras ópticas comuns. Como não é necessária nenhuma fonte de luz externa, não há necessidade de fibras que mantenham a polarização.(PMF, uma fibra óptica especial necessária para conectar fontes de luz externas a circuitos integrados fotônicos de silício passivos).

Ao fabricar um transmissor laser, é relativamente simples fabricar um dispositivo separado. Existe um limite técnico para fazer um laser em um wafer. Diferentes tipos de semicondutores devem estar bem ligados no nível do wafer e, então, o circuito de controle pode ser formado por meio do processo de fabricação do semicondutor. Dispositivos ópticos, incluindo fontes de luz, moduladores, amplificadores, guias de onda ópticos, detectores, etc. devem ser implementados no nível do wafer.

Em segundo lugar, a Intel possui plataformas e dispositivos comprovados de alto volume com confiabilidade líder do setor.

Os chips Intel OCI são construídos em uma plataforma interna de integração fotônica de silício comprovada em produção que já forneceu mais de 100% das aplicações de conectividade em data centers de hiperescala desde 2015.8 milhõesMódulos transceptores ópticos (incluindo mais de8 milhõesCircuitos integrados de fotônica de silício e muito mais32 milhõesLaser integrado), usado para aplicações que exigem taxas de transmissão de 100 Gbps, 200 Gbps e 400 Gbps.

Sua confiabilidade foi verificada em milhões de dispositivos, e os dados mostram que a taxa de falha de base de tempo (FIT) do laser é inferior a0.1, o que equivale a dizer que uma falha pode ocorrer apenas uma vez a cada 10 bilhões de horas.

Além disso, a construção dos circuitos fotônicos e CMOS em dois chips separados (circuito integrado fotônico de silício e circuito integrado eletrônico) garante escalabilidade e otimização de desempenho, sem os compromissos e compensações necessários para combinar duas tecnologias muito diferentes em um único chip.

O acúmulo de pacotes, sistemas e plataformas avançados da Intel também permite otimizar soluções de E/S ópticas.A Intel está investindo na pesquisa e no desenvolvimento de novos nós de processo de fabricação de fotônica de silício para obter melhorias líderes no desempenho dos dispositivos, maior densidade, melhor acoplamento e maiores benefícios econômicos. Ela também continuará a melhorar o desempenho e o custo dos lasers e transceptores ópticos no chip. . e confiabilidade.

Conclusão: Passando do protótipo tecnológico à solução de comercialização

No campo da fotônica do silício, o Intel Research Institute está profundamente envolvido na fotônica do silício há mais de 25 anos e é pioneiro e líder na integração da fotônica do silício. A Intel é a primeira na indústria a desenvolver e fornecer dispositivos de conectividade fotônica de silício em volume para grandes provedores de serviços em nuvem e está trabalhando com clientes para transformar protótipos de tecnologia de chip OCI em soluções comerciais escaláveis.

Em termos de custo, a Intel acredita que com o tempo e à medida que os volumes aumentam, o custo total de interconexão por bit para E/S óptica se tornará comparável ao de E/S elétrica no nível do sistema. O desempenho de E/S óptica mais forte também ajuda a melhorar o desempenho no nível do sistema.

Para atingir esse objetivo, a Intel está atualmente desenvolvendo um nó de processo de fabricação fotônica de silício de segunda geração, que deverá reduzir a área do chip em mais de 40% e o consumo de energia em mais de 15%, melhorando assim os benefícios econômicos e melhorando a eficiência do acoplamento óptico. potência do laser, etc. fazer progressos.