notícias

Dialogue 360 ​​​​Zhou Hongyi: Magia versus magia, a segurança dos modelos grandes depende dos modelos grandes

2024-08-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Produzido pela coluna de diálogo "Attitude AGI" da NetEase Technology

Autor|Zong Shuxian

Editor|Ding Guangsheng

Doze anos se passaram desde a primeira Conferência sobre Segurança na Internet. Na Conferência de Segurança da Internet deste ano, a abreviatura da conferência foi atualizada de ISC para ISC.AI, e a segurança da Internet entrou oficialmente na era da IA. “Os ataques cibernéticos na era da IA ​​​​têm um impacto maior na segurança pessoal e na sociedade. O incidente da tela azul da Microsoft lembra ao público que a digitalização e a inteligência tornaram o mundo da Internet particularmente vulnerável.”360Fundador e CEO do grupoZhou Hong Yiexpressar.

Ele ressaltou que você tem que usar magia para combater magia, usarmodelo grande Para resolver o problema de segurança de modelos grandes, este é o ponto de partida de “AI + segurança”. Atualmente, a 360 está desenvolvendo ativamente duas linhas de negócios principais: modelo grande de segurança e "modelo grande + pesquisa" para fornecer serviços gratuitos para pequenas e médias empresas e usuários individuais e construir grandes modelos de segurança gratuitos. Zhou Hongyi disse em uma entrevista que a 360 não pretende se envolver diretamente na acirrada competição de modelos supergrandes, mas opta por se concentrar no desenvolvimento e aplicação de modelos grandes e seguros. A 360 cooperará com 15 grandes empresas nacionais de modelos para abrir seus próprios cenários e promover a popularização e aplicação de grandes modelos.

Em outras palavras, o posicionamento da 360 é fazer bem três coisas: primeiro, como fabricante de segurança, deve construir um grande modelo de segurança. Por um lado, usa um grande modelo de segurança para resolver problemas de segurança. deve resolver os problemas encontrados no processo de desenvolvimento do grande modelo de desafios de segurança. Em segundo lugar, o próprio 360 tem cenários de usuário 2C, como navegador 360, pesquisa 360, relógios e câmeras infantis 360, e modelos grandes são necessários para capacitar os produtos. Terceiro, promover a popularização de grandes modelos, permitindo que empresas e governos treinem e utilizem os seus próprios grandes modelos profissionais de forma muito barata.

Zhou Hongyi disse francamente que as opiniões da indústria convergiram. Em vez de acumular modelos, é necessário acumular aplicativos. Quando os modelos grandes se tornarem "invisíveis", a tecnologia estará madura e terá que funcionar "nos bastidores". .

Em relação às oportunidades de pesquisa de IA muito discutidas, 360, como um importante player no mercado de pesquisa, Zhou Hongyi também deu seu próprio julgamento. Ele ressaltou que, seja o Search ou o Chat mais fáceis de usar no momento, eles podem ser divididos igualmente ou um pode ser substituído pelo outro no futuro. A pesquisa de IA é uma entrada importante na cena que ninguém pode perder. “O SearchGPT da OpenAI prova que a OpenAI também está abalada.”

“Mas ainda tem muitos problemas que precisam ser resolvidos. Por exemplo, é fácil produzir ‘alucinações’, por exemplo, algumas pessoas estão ‘envenenando dados’, como o desafio da comercialização. e não é realista que os usuários paguem. Isso é o que todos enfrentam.

A seguir está uma transcrição selecionada da conversa entre a NetEase Technology e outros com Zhou Hongyi (com ajustes feitos sem alterar o significado original):

P: Algumas pessoas acreditam que o futuro será dominado por alguns modelos supergrandes, enquanto outras acreditam que muitos modelos verticais pequenos coexistirão. O que você acha da estrutura da indústria e como o 360 se posicionará?

Zhou Hong Yi:Acho que os dois caminhos existirão. Uma grande empresa com recursos e capacidades financeiras como a OpenAI definitivamente deseja desenvolver inteligência artificial supergeral. No entanto, com o nascimento dos grandes modelos de código aberto representados por Lama3 e Qianwen2, os grandes modelos não serão apenas monopolizados por 30 empresas. Os grandes modelos se tornarão nós funcionais e componentes funcionais importantes na digitalização de todas as empresas e governos. No futuro, grandes modelos serão utilizados por empresas e governos. Haverá muitos grandes modelos verticais de indústria ou grandes modelos verticais dentro do governo.Ao mesmo tempo, há uma tendência em modelos grandes, os chamados milhares de lares, além do celular de todos, do computador de todos, do carro de todos e dos eletrônicos em todas as casas.robôSempre haverá modelos grandes, então modelos grandes estarão em toda parte e trabalharão juntos no futuro.

A 360 se posiciona para fazer bem três coisas: primeiro, como fabricante de segurança, deve construir um grande modelo de segurança. Por um lado, usa o grande modelo de segurança para resolver problemas de segurança e, por outro lado, deve resolver vários. problemas encontrados no futuro durante o desenvolvimento do grande modelo de problema de segurança. Em segundo lugar, o próprio 360 tem muitos cenários de usuário 2C, como navegador 360, pesquisa 360, relógios infantis 360 e câmeras. Usaremos modelos grandes profissionais para capacitar os produtos. Terceiro, promover a popularização de grandes modelos, permitindo que empresas e governos treinem e utilizem os seus próprios grandes modelos profissionais de forma muito barata.

Numa palavra, os modelos em grande escala não podem ser feitos por algumas pessoas, mas devem entrar em milhares de lares e indústrias. Somente quando o modelo é reduzido ele pode ser incorporado em produtos pessoais.

P: Do seu ponto de vista, em quais indústrias existentes o desenvolvimento da grande indústria modelo trará impacto ou mudança disruptiva?

Zhou Hong Yi:Penso que os grandes modelos trarão grandes mudanças a todas as indústrias, mas não são necessariamente chamados de disrupções. Penso que seria melhor utilizar o conceito de “remodelação”. Mais importante ainda, melhoram directamente a eficiência e reduzem os custos. Por exemplo, dividimos os recursos de grandes modelos em vários níveis. Os recursos básicos são mais refletidos no uso pessoal, como escritório, educação, aprendizagem, processamento de linguagem, geração de gráficos e geração de vídeos curtos. Em segundo lugar, existem muitas capacidades de negócios dentro da empresa, como ajudar as empresas a realizar a gestão do conhecimento, a análise de inteligência e a tomada de decisões de negócios. Em terceiro lugar, os grandes modelos também serão combinados com a condução autónoma, os robôs, a investigação científica básica tradicional, os produtos farmacêuticos biomédicos e a indústria agrícola, o que produzirá novos efeitos explosivos.

Pergunta: Como podemos nos tornar campeões versáteis como o ChatGPT e como podemos enfrentar nossas deficiências?

Zhou Hongyi: Falando francamente, se seguirmos o caminho da OpenAI e implementarmos a superinteligência artificial, não acho que todas as empresas a implementarão. A China não será capaz de implementar 100 empresas, e o poder de computação não será. suficiente. Sentimos que a China, liderada pelo Alibaba, fará o acompanhamento através da comunidade de código aberto com base em Qianwen e Baichuan. Este acompanhamento será muito rápido.

Mas isto não é a mesma coisa que o grande modelo profissional de que estou a falar. O grande modelo profissional de que estou a falar visa promover grandes modelos em empresas e governos para promover a revolução industrial, não para indivíduos. Isso só exige que eu dê o meu melhor em habilidades profissionais e combine-as com a cena. Portanto, o campo dos grandes modelos profissionais se desenvolverá muito ricamente no futuro. No futuro, definitivamente haverá mais de 10.000 grandes modelos profissionais desempenhando um papel na Guerra dos Dez Mil Modelos.

Recentemente, as opiniões da indústria convergiram. Não acumule o modelo, acumule o aplicativo, e Carrot Run é o aplicativo. Na verdade, no futuro, quando esta tecnologia de grande modelo se tornar “invisível”, esta tecnologia amadurecerá. Modelos grandes são mais parecidos com motores elétricos, decidindo a direção do desenvolvimento de acordo com diferentes campos e trabalhando nos bastidores.

Pergunta: "Construir um ecossistema de segurança + IA, segurança + inovação em IA pode acelerar a atualização."

Zhou Hongyi: A segurança AI+ trata principalmente da construção de um grande modelo de segurança para resolver dois problemas: um é usar grandes capacidades de modelo e capacidades de IA para melhorar os pontos problemáticos e as necessidades rígidas da segurança de rede tradicional de hoje. Para ser franco, o maior problema da segurança de rede tradicional hoje é a falta de talentos profissionais em segurança de rede. Eles não conseguem acompanhar os requisitos da época em termos de detecção de ataques, resistência a ataques, tratamento de situações e operações automatizadas. treinamos grandes modelos de segurança e usamos automação de IA para resolver o problema de detecção de ataques. Resolver problemas de ataque e processamento operacional pode preencher a lacuna de talentos. Em segundo lugar, muitos países estão agora conscientes da questão da governação da segurança da IA. Com o desenvolvimento da IA, ela trará muitas novas ameaças e desafios de segurança, além da segurança da rede e da segurança dos dados. O conteúdo ainda pode ser seguro agora, mas os problemas de segurança humana que surgirão no futuro são desconhecidos. A partir de agora, alguém terá que resolver o problema da segurança da IA.Portanto, precisamos usar magia para lidar com o pensamento mágico e usar modelos grandes para resolver os problemas de segurança de modelos grandes. Este é um ponto de partida para nossa segurança AI+.

Pergunta: Algumas pessoas dizem que a pesquisa por IA substituirá a pesquisa tradicional anterior. Como a pesquisa por IA do 360 pode ser autêntica, confiável e fácil de usar?

Zhou Hongyi: A pesquisa de IA pode representar um verdadeiro avanço. Até a OpenAI começou a fazer pesquisas de IA. Também tive dúvidas sobre como usar o chat para resolver problemas hoje. Por exemplo, quando nós dois conversávamos, às vezes era muito eficiente, e às vezes era muito difícil de entender, principalmente quando tínhamos que escrever palavras complexas, o que era difícil. para mim. Portanto, a pesquisa deve ser combinada com IA. Todos podem usar a pesquisa. Você não precisa inserir uma solicitação longa, apenas algumas palavras-chave. A pesquisa de IA usa modelos grandes para adivinhar as intenções de pesquisa durante a pesquisa, decompõe as informações em pesquisas em várias etapas, recupera resultados de pesquisas múltiplas e, em seguida, usa os resultados para agregá-los.

Modelos grandes + pesquisa são propensos a alucinações, mas agora, quando criamos uma pesquisa + modelo grande, os dados são principalmente pesquisa, o que equivale a um aprimoramento de pesquisa e alinhamento de conhecimento. Claro, haverá problemas aqui, como alguém envenenando os dados. Neste momento, o reconhecimento de conteúdo precisa ser adicionado para identificar algum conteúdo ridículo. Também existem modelos grandes aqui. Quando os modelos grandes são combinados para fazer essas coisas, os problemas que você mencionou podem ser resolvidos.

Além disso, muitas pesquisas de IA agora são relativamente simples, apenas reescrevendo os resultados da pesquisa. O que estamos fazendo agora é que cada intenção de pesquisa pode ter um agente para concluí-la para você, o que chama vários modelos grandes para concluir tarefas complexas.

Hoje em dia, a pesquisa por IA está se tornando cada vez mais complexa. O maior desafio é resolver o problema da comercialização. Sem publicidade, é impossível para os usuários pagarem por ela, porque a pesquisa é originalmente gratuita. É por isso que o Baidu e o Google estão hesitantes e a GPT está atacando o Google.

Portanto, não existe um grande modelo por trás da pesquisa 360AI, porque um grande modelo simplesmente não pode fazer isso.Para usar uma metáfora inadequada, isto está se tornando cada vez mais parecido com o que chamamos de estrutura de agente ouFluxo de trabalho Programas. Portanto, existe um processo para a indústria compreender os grandes modelos, e a indústria de segurança está mais atenta. Hoje em dia, os principais gigantes de modelos grandes na China estão falando sobre mais do que apenas grandes modelos. O conhecimento determina a capacidade de grandes modelos, e a capacidade de usar bem modelos grandes não depende da estrutura do agente. , , se ele pode trazer ajuda direta ao negócio depende de integrá-lo ao fluxo de trabalho.

P: Qual você acha que é a tendência de desenvolvimento da pesquisa de IA? Agora há uma voz dizendo que AI search+Agent+Work Flow é uma tendência.

Zhou Hongyi: Hoje em dia, se quisermos fazer bom uso da IA, não podemos confiar apenas em um modelo grande, porque não importa quão poderoso seja o modelo grande, ele não pode completar a tarefa sem agente, inteligência ou WorkFlow. Modelos grandes podem aprimorar ferramentas, conhecimento, raciocínio e memória. O mais importante é que a estrutura do Agente seja usada para resolver problemas nos quais modelos grandes só conseguem pensar rapidamente. As pessoas têm dois sistemas, um para pensar rápido e outro para pensar devagar. Na verdade, não é realista empurrar grandes modelos de pensamento rápido para a frente e tentar resolver todos os problemas. A coisa mais importante sobre a estrutura do Agente é resolver o problema do pensamento lento. Não importa o que a IA esteja fazendo, seja pesquisa de IA ou pesquisa + IA, essas funções são indispensáveis.

A razão pela qual sinto que, em termos de experiência do usuário atual, pesquisa + IA é melhor do que modelo grande + aprimoramento de pesquisa.Primeiro, os usuários já desenvolveram o hábito de pesquisa e não precisam de educação. No entanto, pode ser muito difícil usar palavras de prompt de modelos grandes para se comunicar. Em segundo lugar, a expectativa de pesquisa é diferente da expectativa de robôs de bate-papo de modelos grandes. a pesquisa é encontrar respostas. Terceiro, a dificuldade não é a mesma. Da mesma forma, se você não definir a cena e usar um modelo grande para testar algumas de suas capacidades, poderá melhorar muito bem a experiência de pesquisa.

Nosso tráfego de pesquisa de IA se desenvolveu rapidamente e agora a atividade de pesquisa mensal da 360AI ultrapassou 10 milhões. Acho que modelos grandes são muito poderosos, mas devem ser combinados com vários cenários para potencializar cada cenário. Esse tipo de experiência do usuário é o melhor. Recentemente, notei um fenômeno. A startup americana Perplexity está crescendo muito rapidamente. O SearchGPT da OpenAI prova que a OpenAI também vacilou.Qual é melhor, Pesquisa ou Chat, pode ser dividido igualmente, e um pode ser substituído pelo outro no futuro, masPelo menos mostra que a pesquisa por IA é uma entrada importante na cena que ninguém pode perder.

P: O que você acha de modelos grandes serem gratuitos?

Zhou Hongyi: Grandes modelos de uso geral não são gratuitos. O custo dos grandes modelos de uso geral é muito alto e são fornecidos na forma de nuvem pública. Com um custo tão alto, o Token já é muito barato, mas não importa. quão barato é, definitivamente não será de graça. O pacote de escritório que lançamos é suportado por recursos gerais de raciocínio de grandes modelos e também tem um custo. Tem um período de uso gratuito, mas não é gratuito.

Existem duas condições para o grande modelo de segurança gratuito que mencionei: primeiro, ele não fornece big data geral, mas 6 grandes modelos profissionais. Ele é adquirido de meus 360 produtos de segurança empresarial, como meu cérebro de segurança e minha segurança de terminal. Aqueles que adquiriram meu serviço de servidor de segurança receberão uma atualização gratuita para os usuários que adquiriram meus produtos. Em segundo lugar, estes grandes modelos dedicados não são implementados publicamente na nuvem, mas são implementados de forma privada dentro da empresa do utilizador, pelo que este custo sem poder de computação pode, naturalmente, ser gratuito. Os dois produtos são diferentes, um é um produto toB e o outro é um produto toC.

Pergunta: Gostaria de perguntar sobre a relação entrada-saída, não sei se o método específico de cooperação com esses grandes modelos é a substituição de recursos ou preços específicos. levar a um ROI para este assunto no futuro? Quais foram as considerações para a escolha deste modelo de cooperação?

Zhou Hongyi: Em primeiro lugar, cada token tem uma cotação, e a taxa por mil palavras de token já é muito baixa. Pagamos tanto quanto usamos o token. Eles vêm me apoiar no uso de seus recursos, o que equivale ao fato de que minha plataforma modelo básica é muito poderosa. Eu tento o meu melhor para trazer mais tráfego, atrair mais usuários e encontrar maneiras de criar mais produtos para que os usuários. pode usá-los mais a cada dia.

A situação atual dos grandes modelos nacionais é que cada empresa tem vantagens e desvantagens e não existe uma liderança esmagadora. Se você usar Baidu, Alibaba e Doubao, poderá combinar suas capacidades para formar a equipe mais forte. A China precisa de dezenas de fabricantes para desenvolver uma AGI universal? Se eu achar que isso não pode ser feito, não apoiarei.

Portanto, meu pensamento atual é que todos treinam o modelo sem expandir o aplicativo. Não importa quão poderoso seja o modelo, ele não será capaz de exercer suas capacidades. Portanto, nem sempre fale sobre encorajar os desenvolvedores de aplicativos a usar APIs para shelling. Há shelling profundo e shell superficial que fazemos, incluindo vários cenários de navegador, e o ajuste da API não pode ser chamado de shell. Eles fazem APIs apenas na esperança de que haja pessoas. Coloque isso dentro.

Sobre "Atitude AGI"

A NetEase Technology lança uma série de colunas de diálogo "Attitude AGI". Nos últimos três anos, as mudanças na IA têm surgido, a ordem tecnológica global está a ser reestruturada e o caminho para a AGI pode estar a aproximar-se silenciosamente. Com o tema AGI, esta coluna conversará com 100 especialistas, empreendedores e investidores em IA, tentando limpar o ar e testemunhar a chegada da era AGI para todos. O fundador do 10º Diálogo 360, Zhou Hongyi.

Revisão de edições anteriores:

A primeira edição da "Attitude AGI":Conversa com Kai-Fu Lee: O empreendedorismo de grandes modelos está em alta há um ano, a distância entre a China e os Estados Unidos diminuiu e não vou sacar dinheiro em dez anos

A segunda edição da "Attitude AGI":Conversa com Wang Xiaochuan: Não acompanharemos a guerra de preços para modelos grandes

A terceira edição da "Attitude AGI":Diálogo com Dai Wenyuan: A guerra de preços para modelos grandes não resolve o problema central

A quarta edição da "Attitude AGI":Wang Zhongyuan, presidente do Instituto de Pesquisa Zhiyuan: GPT4 não é o fim dos grandes modelos domésticos

A quinta edição da "Attitude AGI":Conversa com Zhu Xiaohu: Em 5 anos não haverá grandes empresas modelo independentes porque não haverá modelo de negócios

A sexta edição da "Attitude AGI":Conversa com Wu Shichun da Meihua Venture Capital: É muito difícil para os “Cinco Tigres do Grande Modelo da China” escaparem

A sétima edição da "Attitude AGI":Diálogo com Li Yong, CEO da Yueran Innovation: Como ampliar aplicações de modelos e competir com gigantes

A oitava edição da "Attitude AGI":Diálogo com Zhang Peng, CEO da Zhipu AI: A geração de vídeo é o único caminho para AGI, e superaplicativos chegarão “sem saber”

A nona edição da "Attitude AGI":Diálogo com o vice-presidente e instituto de pesquisa da iFlytek, Dean Liu Cong: Os grandes modelos da China passaram da atualização dos benchmarks para a originalidade independente