repentino! o chefe da openai sora desertou e mudou para o google deepmind

2024-10-04

novo relatório de sabedoria

editor: qiao yangtaozi

[introdução à nova sabedoria]óoutra figura importante da penai renunciou.o responsável por sora acaba de anunciar oficialmente que deixará a openai para ingressar no google deepmind, o que é a ocasião do lançamento do canvas hoje.

cada vez que a openai anuncia algo grande, alguém tem que sair.

não, o canvas acaba de ser lançado, mas más notícias surgiram novamente do projeto sora - o responsável, tim brooks, anunciou oficialmente sua demissão no twitter e se juntou ao google deepmind.

irei ingressar no google deepmind para trabalhar na geração de vídeos e simuladores mundiais! mal posso esperar para trabalhar com uma equipe tão talentosa.
eu estou aquiopenaios dois anos que levou para criar sora foram incríveis. obrigado a todas as pessoas apaixonadas e gentis com quem trabalho. animado para a próxima etapa!

aperte a cabaça e comece o furo. parece que o anúncio oficial de demissão no dia do lançamento pode se tornar uma tradição da openai.

os chefes do google comemoraram na área de comentários, incluindo jeff dean, cientista-chefe da deepmind e google research, e logan kilpatrick, líder de produto do google ai studio.

denny zhou, fundador e líder da equipe de inferência deepmind——

embora alexis conneau, o chefe do projeto "her" que renunciou antes do lançamento completo do gpt-4o, não tenha ingressado no google, ele também começou a fazer piadas online - bem-vindo para se tornar um ex-funcionário da openai.

parece que o modelo de geração de vídeo do google, veo, deverá superar o sora.

atualmente, bill peebles, outro colíder de sora, ainda trabalha na openai.

embora tenha sido lançado em fevereiro deste ano, sora ainda é um “modelo de futuro” e está aberto apenas a um pequeno grupo de testadores e artistas do red team.

a openai não deu um prazo claro para quando estará online, ao contrário do projeto “her”, que tem a bandeira “este outono”.

, e encontrou o cto e o responsável saindo um após o outro, o futuro de sora era mais uma vez incerto.

experiência pessoal

tim brooks co-lidera o projeto sora na openai, onde sua pesquisa se concentra no desenvolvimento de modelos generativos em grande escala que podem simular o mundo real.

esse cara recebeu seu doutorado do berkeley ai research center, e seu orientador de doutorado foi alyosha efros. durante seu doutorado, ele propôs uma tecnologia chamada instructpix2pix.

antes de ingressar na openai, ele participou do desenvolvimento de tecnologia de ia para câmeras móveis pixel no google, e tambémnvidiatrabalhou em modelos de geração de vídeo.

ao mesmo tempo, é também o pesquisador principal do dall·e 3.

outra parte de seu currículo é realmente emocionante - seus trabalhos fotográficos ganharam prêmios da "national geographic", "nature's best photography" e "national wildlife federation".

suas fotos de animais:

ele também se apresentou no beacon theatre na broadway, em nova york, e ganhou prêmios em competições internacionais de ventríloquo a cappella.

os internautas expressaram sua inveja por ele ter esse tipo de liberdade.

além disso, tim brooks também declarou em seu currículo um tanto “versalhes”: “sou apaixonado por ia e, felizmente, essa paixão combina perfeitamente com meus hobbies em fotografia, cinema e música”.

depois de ingressar na deepmind, disse que continuarei engajado em trabalhos relacionados à geração de vídeos e simuladores mundiais, e continuarei a integrar minha paixão por ia com meus hobbies por fotografia e filmes.

da geração de vídeo ao mundo simulado

em abril deste ano, apenas dois meses após o lançamento do modelo sora, os co-líderes tim brooks e bill peebles participaram de um discurso organizado pela agi house e expressaram suas opiniões sobre a tecnologia de geração de vídeo - "vai simular tudo. implementando agi ".

os modelos de vídeo de vincent, como a capacidade demonstrada de sora de gerar cenas complexas, revelam gradualmente uma compreensão detalhada da interação humana e do contato físico, o que é um passo importante para agi.

para gerar vídeos com conteúdo e imagens realistas, é necessário um modelo interno para entender como todos os objetos e humanos se movem e interagem no ambiente. portanto, eles acreditam que sora contribuirá para o desenvolvimento da inteligência artificial geral.

em termos de metodologia, tanto tim brooks como bill peebles enfatizaram particularmente a escalabilidade do modelo. eles acreditam que a razão pela qual o modelo de linguagem é tão bem sucedido é a sua capacidade de expansão, e citaram os pontos de vista em "the bitter lesson":

no longo prazo, os métodos que melhoram o desempenho à medida que aumentam a escala acabarão por vencer à medida que o poder de computação aumenta.

ao criar uma estrutura baseada em transformer e comparar diferentes modelos sora, eles demonstraram o impacto do aumento da computação no treinamento de modelos nas melhorias de desempenho.

do modelo básico para um modelo com aumento de 32 vezes nos cálculos, é possível perceber uma melhora gradativa na compreensão de cenas e objetos.

sempre nos esforçamos para manter a nossa abordagem simples, embora às vezes a realidade seja mais desafiadora do que parece.
nosso foco principal é tornar algo o mais simples possível e depois dimensioná-lo massivamente.

referências:

notícias