notícias

discurso interno de robin li exposto: o modelo de código aberto não é eficiente e não pode resolver o problema do poder da computação

2024-09-11

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

“o mundo exterior tem alguns mal-entendidos sobre grandes modelos.” ​​recentemente, um discurso interno de robin li foi exposto. robin li acredita que a diferença entre os grandes modelos pode aumentar no futuro. ele explicou ainda que o “teto” dos modelos grandes é muito alto e ainda está longe da situação ideal. portanto, o modelo deve continuar a iterar, atualizar e atualizar rapidamente; anos ou mais de dez anos para atender continuamente às necessidades do usuário, reduzir custos e aumentar a eficiência.

quanto à afirmação da indústria de que “não há barreiras entre as capacidades dos grandes modelos”, robin li deu uma visão diferente: “cada vez que um novo modelo é lançado, deve ser comparado com o gpt-4o, dizendo que a minha pontuação é quase a da mesma forma, até mesmo as pontuações em alguns itens individuais o ultrapassaram, mas isso não significa que não haja lacuna em relação aos modelos de última geração.

ele disse que, para provar seu valor, muitos modelos irão para o ranking depois de serem lançados, e adivinharão as perguntas do teste e as habilidades de resposta a partir dos rankings, as capacidades dos modelos podem ser muito próximas, "mas na verdade. aplicações, a força ainda existe. há uma lacuna óbvia.”

robin li destacou que a lacuna entre os modelos é multidimensional. a indústria muitas vezes presta mais atenção à lacuna de compreensão, geração, lógica, memória e outras habilidades, mas ignora dimensões como custo e velocidade de raciocínio. embora alguns modelos possam atingir o mesmo efeito, eles ainda são inferiores aos modelos avançados devido ao seu desempenho. alto custo e lenta velocidade de raciocínio.

robin li também disse: “antes da era dos grandes modelos, todos estavam acostumados com o código aberto, o que significa que é gratuito e de baixo custo”. ele explicou que, por exemplo, linux open source, porque você já tem um computador, usar linux é grátis. mas isso não é verdade na era dos modelos grandes. a inferência de modelos grandes é muito cara e os modelos de código aberto não fornecem poder de computação. você precisa comprar seu próprio equipamento, o que não pode atingir a utilização eficiente do poder de computação.

"o modelo de código aberto não é eficiente em termos de eficiência." ele disse: "o modelo de código fechado deveria ser chamado de modelo de negócios, para ser mais preciso. ele permite que inúmeros usuários compartilhem os custos de p&d e os recursos de máquina e gpus usados ​​para raciocínio. .a eficiência de uso da gpu é a mais alta. artigo do baidu o uso da gpu dos modelos xinda 3.5 e 4.0 atingiu mais de 90%.

robin li analisou que em áreas como ensino e pesquisa científica, o modelo de código aberto é valioso, mas na área comercial, quando a busca pela eficiência, eficácia e menor custo, o modelo de código aberto não apresenta vantagens;

no nível de aplicação do modelo em grande escala, robin li acredita que o copilot aparecerá primeiro para ajudar as pessoas, seguido pela inteligência do agente, que tem um certo grau de autonomia e pode usar ferramentas de forma independente, refletir e evoluir; da automação se desenvolve, ele se tornará um trabalhador de ia e poderá concluir todos os aspectos do trabalho de forma independente.

ele também disse que embora “muitas pessoas estejam otimistas sobre a direção do desenvolvimento da inteligência, a partir de hoje, a inteligência não é um consenso, e empresas como a baidu, que consideram a inteligência como a estratégia mais importante e a direção de desenvolvimento mais importante de grandes modelos, não o fazem. muitos".

robin li acredita que o limite para agentes inteligentes é realmente muito baixo. muitas pessoas não sabem como transformar grandes modelos em aplicativos. é uma forma muito direta, eficiente e simples de construir agentes inteligentes. de modelos.