o discurso interno de robin li expôs: discutindo três grandes mal-entendidos cognitivos sobre grandes modelos, a lacuna entre os modelos se tornará maior no futuro

2024-09-16

“o mundo exterior tem muitos mal-entendidos sobre grandes modelos”, de acordo com relatos recentes da mídia, foi exposto um discurso interno de robin li. em uma comunicação recente com os funcionários, robin li falou sobre três mal-entendidos sobre grandes modelos, abrangendo a competição de grandes modelos, a eficiência do modelo de código aberto e o agente inteligentetendênciaespere por tópicos quentes.

robin li disse que a diferença entre os modelos grandes pode se tornar cada vez maior no futuro. ele disse que o teto dos modelos grandes é muito alto e ainda está longe da situação ideal. portanto, o modelo deve continuar a iterar, atualizar e atualizar rapidamente, precisa ser capaz de investir continuamente por vários anos ou mais; dez anos para atender continuamente às necessidades do usuário e reduzir custos.

a seguir está o conteúdo do discurso interno

pergunta: algumas pessoas pensam que não existem barreiras entre as capacidades dos grandes modelos?

robin li:eu não concordo com esta afirmação. acho que o mundo exterior tem muitos mal-entendidos sobre os grandes modelos. cada vez que um novo modelo é lançado, eles definitivamente querem dizer o quão bom ele é e segui-lo sempre.para comparação com o gpt-4o, pego conjuntos de testes ou faço algumas listas e digo que minha pontuação é quase igual ou até superior em alguns itens individuais, mas isso não prova que esses modelos recém-lançados sejam os mais avançados com openal comparado com o modelo, não existe uma lacuna tão grande.

a lacuna entre os modelos é multidimensional. uma dimensão é a capacidade, seja a lacuna nas habilidades básicas, como capacidade de compreensão, capacidade de geração, capacidade de raciocínio lógico ou capacidade de memória, a outra dimensão é o custo;，se você quiser ter essa habilidade ou responder a essas perguntas, quanto isso vai custar? alguns modelos podem ter velocidades de inferência muito lentas, embora alcancem o mesmo efeito, mas sua experiência não é tão boa quanto a dos modelos mais avançados. e para o conjunto de testesover-fitting, todo modelo que quiser provar sua habilidade irá para o ranking. ao fazer o ranking, ele tem que adivinhar o que os outros estão testando, e quais perguntas posso usar e quais técnicas posso acertar, então a partir do ranking. ou conjuntos de teste pelo que parece, você acha que os recursos estão muito próximos, mas na aplicação real ainda há uma lacuna clara.

parte do hype da mídia, juntamente com a motivação para publicidade quando cada novo modelo é lançado, dá a todos a impressão de que a diferença de capacidades entre os modelos é relativamente pequena. no processo de uso real, não permito que nossa equipe técnica faça classificações. o que realmente mede as capacidades do grande modelo wenxin é se você pode atender às necessidades dos usuários em cenários de aplicação específicos e se pode gerar ganhos de valor. com o que realmente nos importamos.

precisamos ver que, por um lado, existe uma lacuna relativamente óbvia entre as capacidades do modelo e, por outro lado, o teto é muito alto. o que você faz hoje ainda está longe do que você realmente quer fazer e do que você realmente quer fazer. estado ideal, então o modelo também precisa ser iterado, atualizado e atualizado de forma contínua e rápida.mesmo se você perceber que a diferença não é tão grande hoje, você verá se a diferença aumentará em outro ano? quem pode continuar a investir neste sentido durante vários anos ou mesmo mais de dez anos, para que possa responder cada vez mais às necessidades dos utilizadores, aos cenários e às necessidades de melhoria de eficiência ou redução de custos?a lacuna entre os diferentes modelos não está diminuindo cada vez mais, mas aumentará cada vez mais. no entanto, quando não conhecem as reais necessidades, podem sentir que é quase suficiente apenas responder às perguntas do conjunto de testes.

o chamado líderdoze meses ou 18 meses atrasados, não acho que isso importe muito. cada uma de nossas empresas está em um ambiente de mercado totalmente competitivo. não importa a direção que você tome, haverá muitos concorrentes. se você sempre puder garantir que estará 12 a 18 meses à frente de seus concorrentes, não será invencível. pense que 12 a 18 pessoas estão à sua frente. um mês é muito pouco tempo,mesmo que você possa garantir que estará sempre à frente de seus concorrentes6 meses e depois ganhe, sua participação no mercado pode ser70%, enquanto o adversário pode ter apenas 20% ou até 10% de participação.

p: algumas pessoas dizem que o modelo de código aberto está diminuindo a lacuna com o modelo de código fechado. isso destruirá o modelo de negócios das grandes empresas com modelo de código fechado?

robin li:esta questão está altamente relacionada com a questão anterior. acabei de dizer que, além das capacidades ou efeitos, um modelo também precisa ser eficiente. os modelos de código aberto não são bons. para ser mais preciso, o modelo de código fechado deveria ser chamado de modelo de negócios. um modelo comercial é aquele em que inúmeros usuários ou clientes compartilham os mesmos recursos e compartilham os custos de p&d, recursos de máquina e recursos de raciocínio.gpu e o modelo de código aberto exigem que você mesmo implante um conjunto de coisas. qual é a taxa de uso da gpu após a implantação? nossomodelo grande wenxin3.5、4não importa 0,0, a taxa de uso é superior a 90%. quantas pessoas estão usando um modelo de código aberto que você implanta? dizemos ao público que o modelo wenxin é chamado mais de 600 milhões de vezes por dia e o número de tokens gerados todos os dias ultrapassa um trilhão. qual modelo de código aberto pode dizer quantas chamadas faz por dia e quantos tokens gera? como o custo será dividido se ninguém o usar? como o custo da inferência pode ser comparado com os modelos comerciais?

antes da era dos grandes modelos, todos estavam acostumados com o código aberto, que significava gratuito e de baixo custo. naquela época, para produtos comerciais no mercado, era preciso pagar por cada versão, como comprar a instalação de um computadorwindows, a microsoft pode ter que cobrar muito dinheiro com isso, mas você não precisa gastar esse dinheiro se rodar linux. como o linux é de código aberto, todos os programadores podem ver o código. se algo não for bem feito, posso atualizá-lo. após a atualização, posso fazer o check-in. de gigantes. mas essas coisas não são verdade na era dos modelos grandes. na era dos modelos grandes, as pessoas costumam falar sobre o quão caras as gpus são, e o poder da computação é um fator chave que determina o sucesso ou o fracasso dos modelos grandes.o modelo de código aberto oferece poder de computação? se não lhe dá poder computacional, como pode ser usado de forma eficiente? o modelo de código aberto não pode resolver este problema.

no passado, você já havia pago pelo poder de computação quando comprou um computador, mas esse não é o caso para inferência de modelos grandes. essa inferência é, na verdade, muito cara. portanto, o valor dos grandes modelos de código aberto está nas áreas de ensino e pesquisa. se você quiser entender como funcionam os grandes modelos, se não conhecer o código-fonte, certamente haverá uma desvantagem. campo, quando você busca eficiência, efeito, quando a busca é o menor custo, o modelo de código aberto não tem vantagem.

perguntar:como evoluirão os aplicativos de ia? por que a ênfase na inteligência?

robin li: o processo de desenvolvimento de grandes modelos deve passar por essas etapas. no início, as pessoas são atendidas e, finalmente, quando algo sai, as pessoas precisam passar pela verificação final.ok, só será liberado se for bom em todos os aspectos. este é o estágio do copiloto, mais abaixo está a inteligência do agente. o mundo exterior tem várias definições diferentes de agente. de autonomia, com a capacidade de usar ferramentas de forma independente, refletir, auto-evoluir, etc.; se este grau de automação for mais longe, ele se tornará um chamado al worker, capaz de realizar uma variedade de trabalhos mentais e físicos, como um ser humano, e todos os aspectos do trabalho podem ser concluídos de forma independente. deve haver tal processo.

o julgamento de que "os agentes inteligentes são a direção de desenvolvimento mais importante dos grandes modelos" não é, na verdade, um consenso. na conferência baidu create, lançamos três produtos, agentbuilder, appbuilder e modelbuilder e appbuilder, ambos sobre agentes. depois de explicarmos, algumas pessoas finalmente começaram a entender que essa coisa é realmente interessante, pode produzir valor e pode ser feita com um limite relativamente baixo que todos considerem utilizável. desde então, a popularidade dos agentes inteligentes aumentou gradualmente e muitas pessoas começaram a ficar otimistas quanto à direção do desenvolvimento dos agentes inteligentes.mas até hoje, a inteligência não é um consenso. não há muitas empresas como a baidu que considerem a inteligência a estratégia mais importante e a direção de desenvolvimento mais importante de grandes modelos.

por que colocamos tanta ênfase nos agentes? porque o limite para agentes inteligentes é realmente muito baixo. no ano passado, dissemos que deveríamos lançar aplicativos e que todos deveriam fazer aplicativos. na verdade, muitas pessoas ainda dizem que não sabem como fazê-lo, se podem fazê-lo. nessa direção e quais habilidades preciso utilizar. são inúmeras as incertezas em conseguir gerar valor nesse cenário e nem todos sabem como passar do modelo à aplicação.mas o agente fornece uma maneira muito direta, muito eficiente e muito simples. é bastante conveniente construir um agente sobre o modelo., razão pela qual dezenas de milhares de novos agentes são criados na plataforma wenxin todas as semanas.

em termos de agentes, já vimos a tendência e temos pré-requisitos relativamente bons. além das fortes capacidades do próprio modelo, também temos bons canais de distribuição. baiduapp, especialmente a pesquisa baidu tembilhões de pessoasem uso, os usuários expressam ativamente suas necessidades para nós, qual agente inteligente pode responder melhor às suas perguntas e atender às suas necessidades. este é um processo de correspondência natural, por isso somos mais capazes de ajudar esses desenvolvedores a distribuí-los de forma inteligente.

relatório/comentários

notícias

o discurso interno de robin li expôs: discutindo três grandes mal-entendidos cognitivos sobre grandes modelos, a lacuna entre os modelos se tornará maior no futuro

introdução

minhas informações de contato