notícias

Por que todas as montadoras dizem que querem se tornar empresas de IA?

2024-08-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Algumas empresas estão começando a construir o “cérebro” para carros inteligentes


Autor | Cao Siqi
editar|

"Uma empresa de veículos elétricos inteligentes de sucesso deve ser uma empresa de IA de sucesso."

Esta é a expressão mais moderna na área automotiva nos últimos dois anos, e a mais recente veio do CEO da NIO, Li Bin. Li Bin agora muitas vezes esconde uma série de títulos, como empresário e investidor, e se autodenomina uma pessoa que trabalha com mídia própria. Seu objetivo principal é permitir que mais pessoas conheçam o verdadeiro Weilai, e ele não pode ser rotulado como um “bom serviço” por causa de seu. passado. Acho que a tecnologia da NIO não é boa.

Ele disse: “A inovação é a base da NIO”.

NIO não é o único que fez expressões semelhantes. No passado, cada montadora teria seu próprio rótulo, como controle, luxo, potência, economia... Mas agora, todos têm um novo consenso: rotular-se como IA.


Li Bin e Qin Lihong compartilharam as últimas ideias da NIO no campo da inovação tecnológica |

Tornar os carros mais inteligentes é a primeira questão fundamental e é também uma capacidade importante que as empresas automóveis precisam de demonstrar aos utilizadores o mais rapidamente possível nesta fase.

Mas as próprias palavras “tornar-se mais inteligente” são uma descrição difícil de quantificar. O que torna uma máquina inteligente? Mira Murati, diretora de tecnologia da OpenAI, certa vez tentou comparar as capacidades dos modelos de IA com os níveis de inteligência humana em um podcast: GPT-4 é equivalente a um estudante inteligente do ensino médio, enquanto espera-se que o GPT-5 atinja o nível de um Ph.D.

Embora esta afirmação seja fácil de entender, na verdade é difícil aplicá-la diretamente aos automóveis.Porque comparado ao próprio modelo grande, um carro inteligente, como um enorme portador de hardware inteligente, não deve apenas ter “inteligência” para entender os problemas, mas também resolvê-los por meio de “habilidades” específicas.

Se um carro inteligente for comparado a um robô, então, no processo de tornar essa “pessoa” inteligente, ele precisa de um “cérebro inteligente” – não apenas deve ter a inteligência do próprio modelo, mas também deve ser responsável por formular um modelo razoável; conjunto de gerenciamento de tarefas para o “órgão” e um sistema de distribuição para determinar a prioridade com que diferentes “órgãos” precisam lidar com uma série de tarefas diferentes em momentos diferentes.

Por exemplo: A suspensão ativa é um novo recurso muito popular nos últimos dois anos. Seu núcleo é permitir que o veículo ajuste os parâmetros da suspensão durante a condução com base na memória e no cálculo para lidar com os solavancos das diferentes superfícies da estrada, proporcionando uma melhor experiência de direção. . Isto envolve cooperação entre diferentes áreas, como chassis e condução inteligente. Se não houver uma coordenação cerebral unificada, devido a questões técnicas como largura de banda e atraso, a cooperação tornar-se-á facilmente descoordenada e a experiência desejada não será alcançada.

Em 27 de julho, no 2024 NIO IN NIO Innovation and Technology Day, a NIO lançou o "cérebro do veículo" - SkyOS, o sistema operacional global do veículo. Isto representa o pensamento da NIO sobre a era da IA: segundo relatos, com base neste sistema, ele pode fornecer uma melhor experiência na execução de tarefas entre domínios, alocação de poder de computação, etc.

E todos esses esforços visam o mesmo objetivo: tornar os carros inteligentes ainda mais inteligentes.


01

modelo mundial,

Deixe o carro inteligente "raciocinar"

A direção inteligente é o cenário que mais chama a atenção quando a IA é usada nos carros, e é também uma área onde o percurso técnico mudou mais rapidamente nos últimos anos.

Nos últimos anos, a condução inteligente passou por várias iterações de sua rota técnica, incluindo a mudança de uma solução de mapa de alta precisão para um modo sem mapa, e algumas empresas representadas pela Tesla tentaram uma rota puramente visual (sem lidar).

No entanto, estas mudanças de rota servem essencialmente apenas para reduzir custos e não alteram a natureza “orientada por regras” da condução inteligente. Este sistema ainda requer que um grande número de programadores gastem tempo escrevendo código e corrigindo bugs. Por outras palavras, este é apenas um processo no qual os humanos traduzem o seu conhecimento de condução para máquinas através de linguagens de programação. O sistema de condução inteligente em si não produz inteligência.

O surgimento da tecnologia ponta a ponta mudou esse conjunto de regras. Orientado por regras está evoluindo para orientado por dados. Os seres humanos estão tentando copiar a Lei de Scalling, que tem se mostrado bem-sucedida no campo de grandes modelos de linguagem. Ao alimentar uma grande quantidade de dados de vídeo, o sistema de direção inteligente é treinado em uma grande quantidade. modelo de rede neural que pode emergir inteligência.

O resultado mais ideal deste modelo é o modelo de pensamento de direção humana que Musk descreveu uma vez, ou seja: vídeo de entrada (as informações da estrada vistas), controle de saída (pedal e controle de direção).


Diagrama de arquitetura de condução inteligente ponta a ponta Fonte da imagem: NIO |

Aplicando a teoria dos "três pilares da IA", para atingir esse objetivo, precisamos resolver as três questões principais de poder de computação, algoritmo e dados.

A NIO adota uma abordagem de "inteligência de enxame" aos dados, ou seja, obtém uma grande quantidade de dados reais com base em um grande número de veículos produzidos em massa pré-instalados com alto poder de computação e hardware de detecção de última geração. Segundo relatos,

O poder computacional é uma questão externa e não é determinado pelas próprias montadoras.

Portanto, o foco da próxima etapa é partir do próprio algoritmo e melhorar a eficiência do treinamento e as capacidades de raciocínio do próprio modelo. A próxima resposta dada pela NIO é: Nio World Model (doravante denominado NWM).

Você pode pensar no NWM como uma variante do Sora e, até certo ponto, um produto de geração de vídeo. A pequena diferença é que Sora ainda é baseado principalmente em "Vincent Video", enquanto o modelo mundial da NIO é uma espécie de "Video Born Video": De acordo com a introdução oficial, NWM pode usar 3 segundos de vídeo de direção real como uma palavra de alerta para gerar vídeo de até 120 segundos de duração.


NIO descreve as responsabilidades do NWM como “deduzir milhares de mundos paralelos” |

Mas a geração de vídeo obviamente não é o objetivo do NIO, e o NIO não deseja usar os vídeos gerados pelo NWM como dados de treinamento.

Ainda usando o modelo de pensamento humano como analogia: antes de um motorista humano decidir ultrapassar, ele avaliará diferentes mudanças de faixa e escolherá diferentes oportunidades de ultrapassagem com base nas condições da estrada em tempo real. Este processo de tomada de decisão e raciocínio é expresso concretamente pela NWM através de um vídeo gerado.

De acordo com a introdução oficial, o NWM pode deduzir 216 cenários possíveis e encontrar a solução ideal em 100 milissegundos.

Portanto, o surgimento da NWM encontra, na verdade, um novo caminho para que os sistemas de condução inteligentes se tornem mais inteligentes sob novos métodos de trabalho (ponta a ponta) através da rota técnica da IA ​​generativa.

02

Descubra o “toque humano” no cockpit

Outro cenário de aplicação aprofundado de IA em automóveis é o cockpit inteligente.

Se você já experimentou um “carro tradicional” e um “excelente carro inteligente”, respectivamente, provavelmente não pensará que as várias funções do cockpit inteligente são simplesmente sofisticadas. O autor sempre acreditou que a forma mais segura de interação humano-veículo durante a condução deveria ser através da voz – ela pode garantir que seus olhos e mãos continuem focados na direção.

Pode-se dizer que, quando se trata de inteligência de cabine, as novas forças de fabricação de automóveis com genes da Internet estão claramente à frente de muitas empresas automobilísticas tradicionais.

Agora, quando a onda de IA chega, eles já começaram a enfrentar a próxima escolha, como disse o ex-presidente do conselho do Alibaba, Zhang Yong:

Use métodos de IA para refazer todos os produtos.


NIO espera usar IA para redefinir o paradigma da interação homem-veículo Fonte da imagem: NIO |

Por enquanto, a NIO basicamente transferiu todo o software de IA e jogabilidade de hardware atualmente no mercado para o carro.

Por exemplo, a música AI+ usa algoritmos de qualidade de som alimentados por IA para otimizar fontes de som que não possuem som panorâmico e, em seguida, usa o hardware do próprio carro para reprodução.

Com o apoio da IA, a função de guarda de estacionamento torna-se um produto semelhante aos minutos de videoconferência. A IA irá filtrar e gerar momentos-chave dignos de atenção. Se infelizmente você encontrar um arranhão ao estacionar, este produto pode se tornar uma ferramenta de melhoria de eficiência.

Há também uma função de memória de viagem que estará disponível em breve. A coletiva de imprensa mostrou um vlog que foi editado e gerado automaticamente com base no cenário ao longo do caminho capturado pela câmera de bordo após uma viagem autônoma. Alguns picos icônicos também foram marcados com locais. Funções semelhantes de edição de IA foram usadas em cenas como câmeras de ação no passado, e agora a NIO também as colocou em carros.

Além disso, o NIO também demonstrou a evolução do NOMI com o apoio de capacidades multimodais: pode ver o gesto “shh” e diminuir automaticamente o volume, também pode expressar cuidado emocional adequado com base em diferentes ambientes;

NIO usa “inteligência emocional” para descrever a evolução da IA ​​no campo do cockpit. Mas, na opinião do autor, essas funções únicas não representam um grande avanço nas capacidades da própria IA. Em vez disso, elas pensam nesses cenários de aplicação prática, e a decisão de implementá-los é digna de atenção. No campo do cockpit, talvez a exploração dos cenários de aplicação atuais preceda a evolução das capacidades do modelo.

Na noite de 27 de julho, Li Bin terminou sua entrevista à mídia e entrou em outra transmissão ao vivo online quase sem parar. Assim como inúmeras vezes no passado, quando falou online, ele se deparou com algumas perguntas embaraçosas ou incisivas, então optou por lê-las diretamente:

“Pare de mexer com Douyin todos os dias e administre a empresa com o coração.”

Li Bin sorriu e explicou que esta era apenas sua quinta transmissão ao vivo.Mas, assim como aquelas pequenas ideias que estão escondidas em cockpits inteligentes e que podem não ser muito utilizadas agora, ele sente que o pensamento e os esforços de inovação da NIO precisam ser apresentados a todos: “Caso contrário, todos falarão sobre os serviços da NIO todos os dias. é como se nossas habilidades não fossem boas.”

Com certeza, esta expressão recebeu muitos comentários positivos. Li Bin riu de si mesmo na reunião de comunicação com a mídia. No passado, as pessoas diziam que não comprariam um carro por causa de uma pessoa (referindo-se ao próprio Li Bin). está muito feliz por ele poder fazer isso.

Qin Lihong ao lado acrescentou: No passado, o que todos mais esperavam era o NIO DAY (NIO Day, o maior evento para proprietários de automóveis NIO) no final do ano. Esperamos que o NIO NIO IN possa se tornar o evento favorito. da mídia e dos proprietários de automóveis no futuro.

Espero que este dia chegue o mais rápido possível.

*Fonte da imagem do cabeçalho: NIO

Este artigo é um artigo original de Geek Park. Para reimpressão, entre em contato com Geek Jun no WeChat geekparkGO.

Geek perguntou

O que você acha da direção inteligente?Quais são as expectativas?

Musk: As redes sociais são falsas e estão gradualmente destruindo a sua autoconfiança.

Curta e sigaConta de vídeo do Geek Park