notícias

Foi revelado que a conta do OpenAI Strawberry é na verdade um agente inteligente? Startups sediadas em Stanford promovem AgentQ

2024-08-14

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Relatório do coração da máquina

Editor: Du Wei, Jiaqi

Quando o hype cria um “tremendo tráfego”, ninguém se importa se o produto é ótimo ou não.

Recentemente, o projeto secreto “Q*” da OpenAI tem recebido ampla atenção de pessoas internas. No mês passado, um projeto baseado nele e de codinome “Morango” foi exposto novamente. Presumivelmente, o projeto é capaz de fornecer capacidades avançadas de raciocínio.

Nos últimos dias, em relação a este projeto, surgiram várias ondas de rumores na Internet de que “um pombo morto não pagará pela sua vida”. Principalmente o relato do “Irmão Morango”, que promove sem parar, dá expectativa às pessoas, mas também as decepciona.



Inesperadamente, onde quer que esse Sam Altman aparecesse, a “conta de marketing” onde ele postou a mensagem acabou sendo um agente inteligente sob sua pele?

Hoje, o fundador de uma empresa iniciante de agentes de IA "MultiOn" veio diretamente para afirmar: Embora não tenhamos esperado que a OpenAI lançasse "Q *", emitimos o código para controlar a conta "Strawberry Brother".Novo agente inteligente Agente Q, venha jogar conosco online!



Div Garg, cofundador e CEO da MultiOn, fez uma pausa nos estudos para abrir um negócio enquanto cursava doutorado em ciência da computação em Stanford.

Essa onda de operações de marketing parece ter deixado todos confusos com a operação de marketing da OpenAI de fabricar roupas de casamento para si mesma. Afinal, muitas pessoas ficaram acordadas a noite toda esperando pelas “grandes novidades” da OpenAI recentemente. Isso remonta à interação entre Sam Altman e “Irmão Morango”. Abaixo da foto de morangos postada por Sam Altman, ele respondeu ao “Irmão Morango”: A surpresa virá em breve.



No entanto, Div Garg, o fundador da “MultiOn”, excluiu discretamente a postagem alegando que o Agente Q é o “Irmão Morango”.

Desta vez, “MultiOn” anunciou que lançouAgente Q é um agente inovador de IA. Seu método de treinamento combina Monte Carlo Tree Search (MCTS) e autocrítica, e aprende com o feedback humano por meio de um algoritmo chamado Direct Preference Optimization (DPO).

Ao mesmo tempo, como um agente de IA de próxima geração com recursos de planejamento e autocura de IA, o desempenho do Agente Q é 3,4 vezes maior do que o desempenho de amostra zero da linha de base do LLama 3. Ao mesmo tempo, na avaliação de tarefas em cenários reais, a taxa de sucesso do Agente Q atingiu 95,4%.



O que o Agente Q pode fazer? Vamos primeiro dar uma olhada na demonstração oficial.

Ele pode reservar um lugar para você em um determinado restaurante em um determinado horário.



Em seguida, execute operações na página da web para você, como verificar a disponibilidade. Finalmente reservado com sucesso.



Além disso, reserve voos (como neste sábado de Nova York a São Francisco, só de ida, assento na janela e classe econômica).



No entanto, os internautas não parecem acreditar no Agente Q. O que mais preocupa todos é se estão realmente usando a conta “Strawberry Brother” para promover coisas. Algumas pessoas até os chamam de mentirosos descarados.



Essa onda de operações de marketing parece ter deixado todos confusos com a operação de marketing da OpenAI de fabricar roupas de casamento para si mesma. Afinal, muitas pessoas ficaram acordadas a noite toda esperando pelas “grandes novidades” da OpenAI recentemente. Isso remonta à interação entre Sam Altman e “Irmão Morango”. Abaixo da foto de morangos postada por Sam Altman, ele respondeu ao “Irmão Morango”: A surpresa virá em breve.



No entanto, Div Garg, o fundador da “MultiOn”, excluiu discretamente a postagem alegando que o Agente Q é o “Irmão Morango”.

Desta vez, “MultiOn” anunciou que lançouAgente Q é um agente inovador de IA. Seu método de treinamento combina Monte Carlo Tree Search (MCTS) e autocrítica, e aprende com o feedback humano por meio de um algoritmo chamado Direct Preference Optimization (DPO).

Ao mesmo tempo, como um agente de IA de próxima geração com recursos de planejamento e autocura de IA, o desempenho do Agente Q é 3,4 vezes maior do que o desempenho de amostra zero da linha de base do LLama 3. Ao mesmo tempo, na avaliação de tarefas em cenários reais, a taxa de sucesso do Agente Q atingiu 95,4%.



O que o Agente Q pode fazer? Vamos primeiro dar uma olhada na demonstração oficial.

Ele pode reservar um lugar para você em um determinado restaurante em um determinado horário.



Em seguida, execute operações na página da web para você, como verificar a disponibilidade. Finalmente reservado com sucesso.



Além disso, reserve voos (como neste sábado de Nova York a São Francisco, só de ida, assento na janela e classe econômica).



No entanto, os internautas não parecem acreditar no Agente Q. O que mais preocupa todos é se estão realmente usando a conta “Strawberry Brother” para promover coisas. Algumas pessoas até os chamam de mentirosos descarados.