minhas informações de contato
Correspondência[email protected]
2024-07-27
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Jin Lei vem do Templo Aofei
Qubits | Conta pública QbitAI
Para Intel"Luz", rompendo o espinhoso problema do poder de computação na era dos grandes modelos ——
Lançou o primeiro totalmente integrado do setorOCI(Interconexão de Computação Óptica).
△Fonte: Intel
Você deve saber que quando grandes modelos de IA seguem a Lei de Escala, para obter melhores resultados, tanto a escala do modelo quanto a escala de dados estão se desenvolvendo em direção a uma tendência maior.
Isso fará com que grandes modelos de IA apresentem requisitos mais elevados em toda a computação e armazenamento, incluindo comunicação de E/S intermediária, no nível de potência computacional.
O avanço da Intel desta vez é exatamenteComunicação de E/S:
Em CPU e GPU,Use E/S óptica em vez de E/S elétrica para transmissão de dados.
Qual é a utilidade?
Em poucas palavras,A distância de transmissão de dados é muito maior,A quantidade é grande,O consumo de energia é baixo——O “físico” é mais adequado para grandes modelos de IA.
△Fonte: Intel
Então, por que a Intel usa “light”? Como isso é implementado especificamente?
O método tradicional de E/S elétrica (conexão com fio de cobre) certamente tem suas vantagens, como suportar alta densidade de largura de banda e baixo consumo de energia, mas o problema fatal éA distância de transmissão é relativamente curta (menos de 1 metro)。
Não há problema se isso for colocado em um rack, mas o poder computacional de grandes modelos de IA geralmente está no nível de um cluster de servidores.
Não só ocupa uma grande área, mas também abrange N racks. Os cabos precisam ter dezenas ou até centenas de metros de comprimento, e o consumo de energia é bastante alto, pois consumirá toda a energia fornecida aos racks. que não há energia suficiente para realizar operações de leitura e gravação de chips de memória e computação.
além do mais,Relação depósito-contaPor outro lado, é precisamente por causa das "grandes" características dos grandes modelos que a proporção original de ler uma vez e fazer centenas de cálculos tornou-se agora próxima de 1:1.
△Fonte: Intel
Isso requer um novo método que possa aumentar o poder de computação e a densidade de armazenamento, ao mesmo tempo que reduz o consumo de energia e diminui o tamanho, colocando assim mais computação e armazenamento em um espaço limitado.
Com E/S óptica, o problema está resolvido:
Ele pode suportar 64 canais de 32 Gbps em uma direção em fibra óptica de até 100 metros.
Uma metáfora de imagem é, assim como usartransporte(capacidade e distância limitadas) para usarcarros e caminhõespara entregar mercadorias (maiores quantidades e distâncias maiores).
Além disso, mesmo que seja para concluir algum trabalho de transmissão de dados de maior densidade e mais flexível a uma distância relativamente curta, o OCI pode ser comparado amotocicleta, mais rápido e flexível.
Vale ressaltar que este método OCI não é apenas teórico.
De acordo com a Intel, eles aproveitaram a comprovada tecnologia fotônica de silício para integrar circuitos integrados fotônicos de silício (PICs) contendo lasers no chip, amplificadores ópticos e circuitos integrados eletrônicos.
E já demonstrou anteriormente que os chips OCI embalados com sua própria CPU também podem ser integrados ao SOC (sistema no chip), como CPUs, GPUs e IPUs de próxima geração.
Ainda não concluído, a Intel já vendeu mais de 8 milhões de circuitos integrados fotônicos de silício, dos quais mais de 32 milhões de lasers estão em uso.
△Fonte: Intel
Então a próxima pergunta é:
Vice-presidente de pesquisa da Intel e diretor de pesquisa da Intel ChinaCanção JiqiangDurante o processo de comunicação, fez uma análise e interpretação aprofundada desta questão.
△Song Jiqiang, vice-presidente do Intel Research Institute e diretor do Intel China Research Institute
A tecnologia fotônica de silício combina duas das invenções mais importantes do século 20: circuitos integrados de silício e lasers semicondutores.
Ele suporta velocidades de transferência de dados mais rápidas em distâncias mais longas do que os eletrônicos tradicionais, ao mesmo tempo em que aproveita a eficiência da fabricação de silício em alto volume da Intel.
A tecnologia de integração fotônica de silício lançada pela Intel desta vez, os chips OCI atingiram o nível de co-embalagem optoeletrônica.
Este co-pacote optoeletrônico coloca um circuito integrado fotônico de silício (PIC) e um circuito integrado eletrônico (EIC) em um substrato para formar um chip OCI, que serve como um componente de conexão integrado.
Isso significa que xPU, incluindo CPU, e futuras GPUs podem ser empacotadas com chips OCI.
O núcleo OCI converte todos os sinais elétricos de E/S da CPU do data center em luz e os transmite entre os nós ou sistemas dos dois data centers por meio de fibras ópticas.
A atual velocidade de transmissão de dados bidirecional atinge 4 Tbps. Seu protocolo de transmissão de camada superior é compatível com PCIe 5.0 e suporta 64 canais de 32 Gbps em uma direção, o que é suficiente nos data centers atuais:
Ele usa 8 pares de fibras ópticas e consome apenas 5 picojoules (pJ) por bit, ou 10-12 joules. Esses dados são três vezes menores que o consumo de energia de módulos transceptores ópticos conectáveis (este último é de 15 picojoules por bit). ).
△Fonte: Intel
Em um canal de transmissão óptica, ele possui, na verdade, 8 bandas diferentes. O intervalo de frequência de cada banda é de 200 GHz, ocupando um espaçamento total de espectro de 1,6 THz para transmissão.
A luz varia da luz visível à luz invisível. Na verdade, sua largura de espectro é muito ampla. A partir de THz, está próxima da comunicação óptica.
Então, em quais campos as partículas do núcleo OCI serão usadas no futuro?
A este respeito, Song Jiqiang disse:
Uma é que você pode usá-lo para obter comunicação e também pode empacotá-lo com chips de computação, como CPU e GPU. A computação e a comunicação são compactadas de maneira muito compacta.
Por meio da integração fotônica de silício e da tecnologia de empacotamento avançada, a Intel também possui muitas tecnologias diferentes para obter chips de E/S de maior densidade e, em seguida, combiná-los com outros xPUs para formar muitos tipos diferentes de chips no futuro. e os chips de interconexão terão perspectivas de aplicação muito boas.
A julgar pelo roteiro de evolução de desempenho do chip de interface de E/S OCI, ele pode atualmente atingir uma solução técnica de velocidade de transmissão de 32 Tbps, contando principalmente com a melhoria iterativa e constante de três indicadores, a saber:
Multiplicado por esses três indicadores, a velocidade atual de transmissão de dados é de 2Tbps em uma direção e 4Tbps em ambas as direções. No futuro, podemos continuar a evoluir e melhorar gradualmente as capacidades de largura de banda.
△Fonte: Intel
Finalmente, Song Jiqiang também explicou a diferenciação da Intel na tecnologia de integração fotônica de silício:
A principal razão é que construímos emissores de laser de alta frequência no wafer e integramos amplificadores ópticos de silício. Essas são duas tecnologias relativamente centrais, ambas fabricadas no nível do wafer.
Em seguida, podemos produzir em massa esses lasers altamente integrados, porque a vantagem desse laser no chip é que ele pode ser transmitido usando fibras ópticas comuns.
E em termos de estabilidade, é quaseSão necessários 10 bilhões de horas para que um erro ocorra。
Então, o que você acha da escolha “light” da Intel? Bem-vindo a deixar uma mensagem na área de comentários para discussão.
Links de referência:
[1]https://mp.weixin.qq.com/s/ozx_ficqlxjEPKa5AlBdfA
[2]https://community.intel.com/t5/Blogs/Tech-Innovation/Artificial-Intelligence-AI/Intel-Mostra-OCI-Optical-IO-Chiplet-Co-empacotado-com-CPU-at/post/1582541
[3]https://www.youtube.com/watch?v=Fml3yuPR2AU