2024-10-04
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
nouveau rapport de sagesse
je rejoindrai google deepmind pour travailler sur la génération de vidéos et les simulateurs de monde ! j'ai hâte de travailler avec une équipe aussi talentueuse.
je suis làopenailes deux années qu’il a fallu pour créer sora ont été une période incroyable. merci à toutes les personnes passionnées et gentilles avec qui je travaille. hâte de voir la prochaine étape !
appuyez sur la gourde et lancez le scoop. il semble que l'annonce officielle de la démission le jour de la sortie puisse devenir la tradition d'openai.
les patrons de google ont célébré dans la zone de commentaires, notamment jeff dean, scientifique en chef de deepmind et google research, et logan kilpatrick, chef de produit de google ai studio.
denny zhou, fondateur et chef de l'équipe d'inférence deepmind——
bien qu'alexis conneau, le responsable du projet "her" qui a démissionné avant la sortie complète de gpt-4o, n'ait pas rejoint google, il a également commencé à faire des blagues en ligne - bienvenue pour devenir un ancien employé d'openai.
il semble que le modèle de génération vidéo de google, veo, devrait surpasser sora.
actuellement, bill peebles, l’autre co-responsable de sora, travaille toujours chez openai.
bien qu'il soit sorti en février de cette année, sora reste un "modèle futur" et n'est ouvert qu'à un petit groupe de testeurs et d'artistes de l'équipe rouge.
openai n'a pas donné de date limite claire pour sa mise en ligne, contrairement au projet « her » qui a un drapeau « cet automne ».
, et a rencontré le cto et le responsable qui partaient l'un après l'autre, l'avenir de sora était une fois de plus incertain.
expérience personnelle
tim brooks codirige le projet sora chez openai, où ses recherches portent sur le développement de modèles génératifs à grande échelle capables de simuler le monde réel.
ce type a obtenu son doctorat au berkeley ai research center et son directeur de thèse était alyosha efros. au cours de son doctorat, il a proposé une technologie appelée instructpix2pix.
avant de rejoindre openai, il a participé au développement de la technologie ia pour les caméras mobiles pixel chez google, et égalementnvidiatravail sur des modèles de génération vidéo.
parallèlement, il est également le chercheur principal du dall·e 3.
une autre partie de son cv est vraiment passionnante : ses travaux photographiques ont remporté des prix du « national geographic », de la « nature's best photography » et de la « national wildlife federation ».
ses photos d'animaux :
il s'est également produit au beacon theatre de broadway à new york et a remporté des prix lors de concours internationaux de ventriloque a cappella.
les internautes ont exprimé leur envie qu’il bénéficie de ce genre de liberté.
d'ailleurs, tim brooks a également déclaré d'une manière plutôt "versaillaise" dans son cv : "je suis passionné par l'ia, et heureusement, cette passion se marie parfaitement avec mes passe-temps que sont la photographie, le cinéma et la musique."
après avoir rejoint deepmind, j'ai dit que je serai toujours engagé dans des travaux liés à la génération vidéo et aux simulateurs de monde, et que je continuerai à intégrer ma passion pour l'ia avec mes passe-temps pour la photographie et le cinéma.
de la génération vidéo au monde simulé
en avril de cette année, deux mois seulement après la sortie du modèle sora, les co-responsables tim brooks et bill peebles ont participé à un discours d'ouverture organisé par agi house et ont exprimé leur point de vue sur la technologie de génération vidéo : « elle simulera tout. implémentation d'agi ".
les capacités de génération de scènes complexes démontrées par les modèles vidéo vincentiens tels que sora, qui révèlent progressivement une compréhension détaillée de l'interaction humaine et du contact physique, constituent une étape importante vers l'agi.
pour générer des vidéos avec un contenu et des images réalistes, un modèle interne est nécessaire pour comprendre comment tous les objets et les humains se déplacent et interagissent dans l'environnement. ils pensent donc que sora contribuera au développement de l'intelligence artificielle générale.
en termes de méthodologie, tim brooks et bill peebles ont particulièrement souligné l'évolutivité du modèle. ils estiment que la raison pour laquelle le modèle de langage a autant de succès est sa capacité à s'étendre, et ont cité les points de vue dans « the bitter lesson » :
à long terme, les méthodes qui améliorent les performances à mesure qu’elles évoluent finiront par s’imposer à mesure que la puissance de calcul augmente.
en créant un framework basé sur transformer et en comparant différents modèles sora, ils ont démontré l'impact de l'augmentation des calculs dans la formation des modèles sur l'amélioration des performances.
du modèle de base à un modèle avec des calculs multipliés par 32, vous pouvez constater une amélioration progressive de la compréhension des scènes et des objets.
nous nous sommes toujours efforcés de garder notre approche simple, même si la réalité est parfois plus difficile qu'il n'y paraît.
notre objectif principal est de créer quelque chose d’aussi simple que possible, puis de le faire évoluer massivement.