notícias

Projeto inicial | Startup do Vale do Silício “Aizip” lança modelo de linguagem pequena e coopera com Renesas Technology

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Autor: Chang Minxiao

Editor丨Qiu Xiaofen

Desde a guerra de centenas de modelos nos últimos dois anos até a implementação gradual do LLM (Large Language Model), a IA no dispositivo sempre foi uma parte crucial do desenvolvimento da tecnologia de inteligência artificial.

A chamada IA ​​do lado do terminal significa que os usuários não dependem de servidores em nuvem durante o uso e usam os serviços de IA diretamente no dispositivo terminal.

Em comparação com os principais modelos de linguagem de grande porte, como ChatGPT4.0 e o recém-lançado Llama3.1, que dependem de interfaces de nuvem, a IA no dispositivo tem forte privacidade e também tem muitas vantagens, como operação personalizada e economia de custos.

Embora várias empresas, representadas pela Microsoft, já tenham proposto no mercado produtos "AI PC", que reduzirão com sucesso o grande modelo de linguagem na nuvem e podem ser usados ​​​​offline em terminais móveis, como telefones celulares e computadores, garante que pode ser usado em dispositivos inteligentes de baixo custo. O uso de programas automatizados a qualquer hora e em qualquer lugar continua sendo um grande desafio para modelos pequenos.

Uma start-up americana quer resolver o problema de implementação de terminais.

"Aizip" foi fundada no Vale do Silício, nos Estados Unidos, em 2020. Ela se concentra na aplicação final de IA de pequena inteligência artificial (Tiny AI) em hardware inteligente, como extremidade de percepção e extremidade de borda.

Atualmente, a “Aizip” criou uma série de modelos de linguagem pequena (SLM) e agentes de IA, denominados Gizmo, com tamanhos que variam de 300 milhões a 2 bilhões de parâmetros.

Este modelo suporta o uso em diversas plataformas, permitindo melhor compatibilidade entre diferentes dispositivos e permitindo aos usuários experimentar operações e funções consistentes ao alternar entre diferentes dispositivos.

"Aizip" fornece principalmente uma série de serviços como atendimento inteligente ao cliente, suporte técnico, suporte financeiro e suporte humano para clientes empresariais. Os usuários individuais podem usar o serviço de assistente de voz personalizado do Gizmo em terminais de dispositivos inteligentes, como telefones celulares, tablets, relógios, carros e eletrodomésticos.

Entende-se que “Aizip” espera permitir que os usuários usem aplicativos de IA em qualquer lugar, construindo um modelo de IA que possa ser implantado em dispositivos móveis a qualquer momento e tenha forte escalabilidade. A empresa está atualmente fazendo avanços em tecnologias importantes, como eficiência de modelos centrados em dados e automação de design de IA.

Em comparação com modelos grandes, modelos pequenos podem ser implantados em chips que custam menos de dez dólares. Seus custos de aplicação e promoção são muito mais baixos e podem ser amplamente utilizados em terminais móveis de dispositivos inteligentes.

Isso significa que a IA pode fornecer sugestões aos usuários com mais rapidez e precisão. Os usuários também podem usar a tecnologia de IA de forma mais conveniente em telefones celulares e tablets para lidar com o trabalho diário e o entretenimento, e usar os serviços personalizados da IA ​​off-line.

Em termos de comercialização, entende-se que “Aizip” cooperou recentemente com a Renesas Technology para lançar SLM (Small Language Model) ultraeficiente e agentes de IA compactos baseados em unidade de microprocessador ARM (MPU). A Renesas Technology oferece uma ampla gama de microcontroladores, system-on-chip (SoC), IC de gerenciamento de energia e outros produtos.

Em termos de equipe, os membros da equipe "Aizip" vêm de universidades conhecidas como Stanford, Berkeley, MIT e Carnegie Mellon. Muitos membros trabalharam para Google e Meta.

Weier Wan, um dos membros fundadores da "Aizip" e chefe de desenvolvimento do Aizip SLM e AI Agents, disse: "Estamos testemunhando um momento crítico na IA eficiente. Os AI Agents no dispositivo podem realmente fazer tudo pensar. Em um computador rodando a 1,2 GHz No RZ/G2L com um único núcleo A55, o tempo de resposta do modelo pode ser reduzido para menos de 3 segundos.”

fim

fim