notícias

A interconexão entre CPU e GPU disparou de 1 metro para 100 metros Intel: Você acredita na luz?

2024-07-27

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Jin Lei vem do Templo Aofei
Qubits | Conta pública QbitAI

Para Intel"Luz", rompendo o espinhoso problema do poder de computação na era dos grandes modelos ——

Lançou o primeiro totalmente integrado do setorOCI(Interconexão de Computação Óptica).



△Fonte: Intel

Você deve saber que quando grandes modelos de IA seguem a Lei de Escala, para obter melhores resultados, tanto a escala do modelo quanto a escala de dados estão se desenvolvendo em direção a uma tendência maior.

Isso fará com que grandes modelos de IA apresentem requisitos mais elevados em toda a computação e armazenamento, incluindo comunicação de E/S intermediária, no nível de potência computacional.

O avanço da Intel desta vez é exatamenteComunicação de E/S

Em CPU e GPU,Use E/S óptica em vez de E/S elétrica para transmissão de dados.

Qual é a utilidade?

Em poucas palavras,A distância de transmissão de dados é muito maiorA quantidade é grandeO consumo de energia é baixo——O “físico” é mais adequado para grandes modelos de IA.



△Fonte: Intel

Então, por que a Intel usa “light”? Como isso é implementado especificamente?

Usando "light", passou de carruagem a caminhão

O método tradicional de E/S elétrica (conexão com fio de cobre) certamente tem suas vantagens, como suportar alta densidade de largura de banda e baixo consumo de energia, mas o problema fatal éA distância de transmissão é relativamente curta (menos de 1 metro)

Não há problema se isso for colocado em um rack, mas o poder computacional de grandes modelos de IA geralmente está no nível de um cluster de servidores.

Não só ocupa uma grande área, mas também abrange N racks. Os cabos precisam ter dezenas ou até centenas de metros de comprimento, e o consumo de energia é bastante alto, pois consumirá toda a energia fornecida aos racks. que não há energia suficiente para realizar operações de leitura e gravação de chips de memória e computação.

além do mais,Relação depósito-contaPor outro lado, é precisamente por causa das "grandes" características dos grandes modelos que a proporção original de ler uma vez e fazer centenas de cálculos tornou-se agora próxima de 1:1.



△Fonte: Intel

Isso requer um novo método que possa aumentar o poder de computação e a densidade de armazenamento, ao mesmo tempo que reduz o consumo de energia e diminui o tamanho, colocando assim mais computação e armazenamento em um espaço limitado.

Com E/S óptica, o problema está resolvido:

Ele pode suportar 64 canais de 32 Gbps em uma direção em fibra óptica de até 100 metros.

Uma metáfora de imagem é, assim como usartransporte(capacidade e distância limitadas) para usarcarros e caminhõespara entregar mercadorias (maiores quantidades e distâncias maiores).

Além disso, mesmo que seja para concluir algum trabalho de transmissão de dados de maior densidade e mais flexível a uma distância relativamente curta, o OCI pode ser comparado amotocicleta, mais rápido e flexível.

Vale ressaltar que este método OCI não é apenas teórico.

De acordo com a Intel, eles aproveitaram a comprovada tecnologia fotônica de silício para integrar circuitos integrados fotônicos de silício (PICs) contendo lasers no chip, amplificadores ópticos e circuitos integrados eletrônicos.

E já demonstrou anteriormente que os chips OCI embalados com sua própria CPU também podem ser integrados ao SOC (sistema no chip), como CPUs, GPUs e IPUs de próxima geração.

Ainda não concluído, a Intel já vendeu mais de 8 milhões de circuitos integrados fotônicos de silício, dos quais mais de 32 milhões de lasers estão em uso.



△Fonte: Intel

Então a próxima pergunta é:

Como o OCI da Intel é “refinado”?

Vice-presidente de pesquisa da Intel e diretor de pesquisa da Intel ChinaCanção JiqiangDurante o processo de comunicação, fez uma análise e interpretação aprofundada desta questão.



△Song Jiqiang, vice-presidente do Intel Research Institute e diretor do Intel China Research Institute

A tecnologia fotônica de silício combina duas das invenções mais importantes do século 20: circuitos integrados de silício e lasers semicondutores.

Ele suporta velocidades de transferência de dados mais rápidas em distâncias mais longas do que os eletrônicos tradicionais, ao mesmo tempo em que aproveita a eficiência da fabricação de silício em alto volume da Intel.



A tecnologia de integração fotônica de silício lançada pela Intel desta vez, os chips OCI atingiram o nível de co-embalagem optoeletrônica.

Este co-pacote optoeletrônico coloca um circuito integrado fotônico de silício (PIC) e um circuito integrado eletrônico (EIC) em um substrato para formar um chip OCI, que serve como um componente de conexão integrado.

Isso significa que xPU, incluindo CPU, e futuras GPUs podem ser empacotadas com chips OCI.

O núcleo OCI converte todos os sinais elétricos de E/S da CPU do data center em luz e os transmite entre os nós ou sistemas dos dois data centers por meio de fibras ópticas.

A atual velocidade de transmissão de dados bidirecional atinge 4 Tbps. Seu protocolo de transmissão de camada superior é compatível com PCIe 5.0 e suporta 64 canais de 32 Gbps em uma direção, o que é suficiente nos data centers atuais:

Ele usa 8 pares de fibras ópticas e consome apenas 5 picojoules (pJ) por bit, ou 10-12 joules. Esses dados são três vezes menores que o consumo de energia de módulos transceptores ópticos conectáveis ​​(este último é de 15 picojoules por bit). ).



△Fonte: Intel

Em um canal de transmissão óptica, ele possui, na verdade, 8 bandas diferentes. O intervalo de frequência de cada banda é de 200 GHz, ocupando um espaçamento total de espectro de 1,6 THz para transmissão.

A luz varia da luz visível à luz invisível. Na verdade, sua largura de espectro é muito ampla. A partir de THz, está próxima da comunicação óptica.



Então, em quais campos as partículas do núcleo OCI serão usadas no futuro?

A este respeito, Song Jiqiang disse:

Uma é que você pode usá-lo para obter comunicação e também pode empacotá-lo com chips de computação, como CPU e GPU. A computação e a comunicação são compactadas de maneira muito compacta.
Por meio da integração fotônica de silício e da tecnologia de empacotamento avançada, a Intel também possui muitas tecnologias diferentes para obter chips de E/S de maior densidade e, em seguida, combiná-los com outros xPUs para formar muitos tipos diferentes de chips no futuro. e os chips de interconexão terão perspectivas de aplicação muito boas.

A julgar pelo roteiro de evolução de desempenho do chip de interface de E/S OCI, ele pode atualmente atingir uma solução técnica de velocidade de transmissão de 32 Tbps, contando principalmente com a melhoria iterativa e constante de três indicadores, a saber:

  • Existem 8 bandas estáveis ​​em uma fibra óptica
  • A taxa de transmissão óptica de dados de cada banda é de 32 Gbps
  • Pode puxar 8 pares de fibras ópticas ao mesmo tempo sem afetar um ao outro

Multiplicado por esses três indicadores, a velocidade atual de transmissão de dados é de 2Tbps em uma direção e 4Tbps em ambas as direções. No futuro, podemos continuar a evoluir e melhorar gradualmente as capacidades de largura de banda.



△Fonte: Intel

Finalmente, Song Jiqiang também explicou a diferenciação da Intel na tecnologia de integração fotônica de silício:

A principal razão é que construímos emissores de laser de alta frequência no wafer e integramos amplificadores ópticos de silício. Essas são duas tecnologias relativamente centrais, ambas fabricadas no nível do wafer.
Em seguida, podemos produzir em massa esses lasers altamente integrados, porque a vantagem desse laser no chip é que ele pode ser transmitido usando fibras ópticas comuns.
E em termos de estabilidade, é quaseSão necessários 10 bilhões de horas para que um erro ocorra

Então, o que você acha da escolha “light” da Intel? Bem-vindo a deixar uma mensagem na área de comentários para discussão.

Links de referência:
[1]https://mp.weixin.qq.com/s/ozx_ficqlxjEPKa5AlBdfA
[2]https://community.intel.com/t5/Blogs/Tech-Innovation/Artificial-Intelligence-AI/Intel-Mostra-OCI-Optical-IO-Chiplet-Co-empacotado-com-CPU-at/post/1582541
[3]https://www.youtube.com/watch?v=Fml3yuPR2AU