2024-10-04
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
새로운 지혜 보고서
저는 google deepmind에 합류하여 비디오 생성 및 월드 시뮬레이터 작업을 할 예정입니다! 이렇게 재능 있는 팀과 함께 일할 수 있기를 기대합니다.
나는 여기 있다오픈aisora를 만드는 데 걸린 2년은 정말 놀라운 시간이었습니다. 함께 일하는 열정적이고 친절한 모든 분들께 감사드립니다. 다음 무대도 기대됩니다!
조롱박을 누르고 특종을 시작하면 출시일에 공식적인 사임 발표가 openai의 전통이 될 수 있을 것 같습니다.
deepmind 및 google research의 수석 과학자인 jeff dean과 google ai studio의 제품 리더인 logan kilpatrick을 포함하여 google 상사들이 댓글 영역에서 축하했습니다.
deepmind 추론 팀의 창립자이자 리더인 denny zhou——
gpt-4o가 정식 출시되기 전에 사임한 "her" 프로젝트 책임자인 alexis conneau는 google에 합류하지 않았지만 온라인에서 농담을 하기 시작했습니다. 전 openai 직원이 된 것을 환영합니다.
구글의 자체 동영상 생성 모델인 비오(veo)가 소라를 능가할 것으로 예상된다.
현재 sora의 다른 공동 리더인 bill peebles는 여전히 openai에서 일하고 있습니다.
올해 2월에 출시되었지만 sora는 여전히 '미래 모델'이며 소수의 레드팀 테스터 및 아티스트에게만 공개됩니다.
openai는 "올 가을" 플래그가 있는 "her" 프로젝트와 달리 언제 온라인에 공개될지에 대한 명확한 마감일을 제시하지 않았습니다.
, 차례로 떠나가는 cto와 담당자를 만나면서 소라의 미래는 다시 한번 불확실해졌다.
개인적인 경험
tim brooks는 openai에서 sora 프로젝트를 공동으로 이끌고 있으며, 여기서 그의 연구는 실제 세계를 시뮬레이션할 수 있는 대규모 생성 모델 개발에 중점을 두고 있습니다.
이 사람은 버클리 ai 연구센터에서 박사학위를 받았으며 그의 박사 지도교수는 alyosha efros였습니다. 박사 과정에서 그는 instructpix2pix라는 기술을 제안했습니다.
openai에 합류하기 전 google에서 pixel 모바일 카메라용 ai 기술 개발에 참여했으며,엔비디아비디오 생성 모델 작업을 했습니다.
동시에 dall·e 3의 주요 연구원이기도 하다.
그의 이력서의 또 다른 부분은 정말 흥미롭습니다. 그의 사진 작품은 "national geographic", "nature's best photography" 및 "national wildlife federation"에서 상을 받았습니다.
그의 동물 사진:
그는 또한 뉴욕 브로드웨이의 비컨 극장(beacon theatre)에서 공연했으며 국제 아카펠라 대회에서 상을 받았습니다.
네티즌들은 그런 자유로움에 부러움을 표했다.
더욱이 팀 브룩스(tim brooks)는 이력서에서 다소 "베르사유" 방식으로 다음과 같이 말했습니다. "나는 ai에 대한 열정이 있습니다. 다행히도 이 열정은 사진, 영화, 음악에 대한 나의 취미와 완벽하게 조화를 이룹니다."
저는 딥마인드에 합류한 후에도 여전히 비디오 생성 및 월드 시뮬레이터 관련 작업에 종사할 것이며, ai에 대한 열정과 사진 및 영화에 대한 취미를 계속 통합할 것이라고 말했습니다.
비디오 생성에서 시뮬레이션 세계까지
소라 모델이 출시된 지 불과 두 달 만인 올해 4월, 공동대표인 팀 브룩스와 빌 피블스는 agi 하우스가 주관한 기조연설에 참석해 비디오 생성 기술에 대해 “모든 것을 시뮬레이션할 것이다. agi를 구현하는 것”이라고 말했다. ".
인간 상호 작용과 신체 접촉에 대한 상세한 이해를 점차적으로 드러내는 sora와 같은 vincentian 비디오 모델이 보여주는 복잡한 장면 생성 기능은 agi를 향한 중요한 단계입니다.
실감나는 콘텐츠와 실감나는 이미지를 담은 영상을 제작하기 위해서는 환경 속에서 모든 사물과 인간이 어떻게 움직이고 상호작용하는지 이해하는 내부 모델이 필요하기 때문에 소라가 일반 인공지능 발전에 기여할 것으로 믿고 있다.
방법론 측면에서 tim brooks와 bill peebles는 특히 모델의 확장성을 강조했습니다. 그들은 언어 모델이 그토록 성공한 이유가 확장 능력 때문이라고 믿으며 "the bitter lesson"에서 다음과 같은 견해를 인용했습니다.
장기적으로는 컴퓨팅 성능이 향상됨에 따라 확장에 따라 성능을 향상시키는 방법이 궁극적으로 승리하게 될 것입니다.
transformer 기반 프레임워크를 생성하고 다양한 sora 모델을 비교함으로써 모델 훈련에서 계산 증가가 성능 향상에 미치는 영향을 입증했습니다.
기본 모델부터 계산량이 32배 늘어난 모델까지, 장면과 사물에 대한 이해도가 점진적으로 향상되는 모습을 볼 수 있습니다.
때로는 현실이 생각보다 더 어려울 때도 있지만, 우리는 접근 방식을 단순하게 유지하기 위해 항상 노력해 왔습니다.
우리의 주요 초점은 가능한 한 단순하게 만든 다음 대규모로 확장하는 것입니다.