notícias

competição, eficiência, inteligência, o grande modelo com o qual robin li se preocupa

2024-09-15

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

“o teto dos modelos grandes é muito alto e ainda está longe da situação ideal”. em 11 de setembro, foi exposto um discurso interno do ceo do baidu, robin li. ele afirmou sem rodeios que o mundo exterior tem três mal-entendidos sobre os grandes modelos: "a diferença entre os diferentes modelos não está diminuindo cada vez mais, mas ficará cada vez maior." modelos de código aberto não podem resolver este problema." esta questão "não há consenso de que os agentes inteligentes são a direção de desenvolvimento mais importante de grandes modelos."

o tema dos grandes modelos é frequentemente discutido. o debate entre código aberto e código fechado, o valor da lista, etc., é tudo baseado nisso. robin li, que identificou o grande modelo no estágio inicial, está disposto. para compartilhar suas opiniões.

“cada vez que um novo modelo é lançado, eu definitivamente quero dizer o quão bom ele é. cada vez que o comparo com o gpt-4o, faço um conjunto de testes ou faço algumas listas e digo que minha pontuação é quase a mesma, e até mesmo alguns a pontuação em itens individuais excedeu, mas isso não prova que esses modelos recém-lançados não estejam mais tão atrás dos modelos mais avançados do openal. "robin li acredita que o mundo exterior tem mal-entendidos sobre modelos grandes.

na sua opinião, a lacuna se reflete nas capacidades e nos custos “a partir da lista ou do conjunto de testes, você sente que as capacidades estão muito próximas, mas nas aplicações reais ainda há uma lacuna clara. quando se trata de classificações, o que realmente mede as capacidades do modelo wenxin é se você pode atender às necessidades dos usuários em cenários de aplicação específicos e se pode gerar ganhos de valor. é com isso que realmente nos importamos."

valores e cenários também são frequentemente mencionados pelos pares. "a adoção da ia ​​pela indústria empresarial não se trata de buscar tecnologia interessante, nem de 'procurar pregos com um martelo'. o núcleo é resolver os pontos problemáticos do negócio. desde o ano passado (2023), todos têm estado um pouco otimistas demais sobre modelos grandes, pensando que podem mudar o mundo rapidamente recentemente, há alguns pessimistas que pensam que modelos grandes são bonitos, mas não são fáceis de usar. na verdade, não é aconselhável 'superestimar o progresso no curto prazo. e subestimar o efeito a longo prazo.'" tang daosheng, vice-presidente executivo sênior do grupo tencent e ceo do cloud and intelligence industry group. do ponto de vista do cliente, os cenários são a chave para desbloquear a ia. é melhor que as empresas combinem dados profissionais exclusivos para encontrar oportunidades de reduzir custos e aumentar a eficiência nos fluxos de trabalho e cenários de negócios existentes e, então, continuar a melhorar e investir no longo prazo.

código aberto e código fechado são temas debatidos há muito tempo. como representante do código fechado, robin li mais uma vez fez uma comparação: “além das capacidades ou efeitos, um modelo também depende da eficiência. de eficiência, os modelos de código aberto não são bons."

"o modelo de código fechado deveria ser chamado com precisão de modelo de negócios. o modelo comercial é que inúmeros usuários ou clientes compartilham os mesmos recursos, compartilham os custos de p&d e compartilham os recursos da máquina e gpu (unidade de processamento gráfico) usados ​​para raciocínio, enquanto o modelo de código aberto o modelo exige que você mesmo implante um conjunto de coisas.” ele disse ainda: “antes da era do grande modelo, todos estavam acostumados com o código aberto, o que significa que é gratuito e de baixo custo. era, e todo mundo costuma usá-lo na era dos grandes modelos. é sobre o quão caras as gpus são. o poder de computação é um fator chave para determinar o sucesso ou o fracasso de modelos grandes. para lhe dar poder de computação, como o modelo de código aberto pode ser usado de forma eficiente? este problema não pode ser resolvido.”

há dois meses, robin li declarou na conferência mundial de inteligência artificial de 2024: ele está mais otimista em relação aos agentes inteligentes. no início de setembro, muitos empresários e especialistas acreditaram, na conferência do bund de inclusão de 2024, que os corpos inteligentes são uma nova forma terminal e criarão uma nova geração de superplataformas.

em relação a este tema cada vez mais acalorado, robin li falou mais uma vez: "por que enfatizamos tanto os agentes? porque o limite para os agentes é realmente muito baixo. os agentes fornecem uma maneira muito direta, muito eficiente e muito simples de construir inteligência sobre parte superior do modelo. o corpo é bastante conveniente", ele perguntou e respondeu a si mesmo.

ele acredita que "o julgamento de que 'os agentes são a direção de desenvolvimento mais importante de grandes modelos' não é na verdade um consenso. até agora, não há consenso sobre os agentes. o baidu, por exemplo, considera os agentes como a estratégia mais importante e o aspecto mais importante dos grandes modelos." não há muitas empresas que estão se desenvolvendo nessa direção.”

wei wei, repórter do beijing business daily

relatório/comentários