소식

황런순(huang renxun)의 예측이 현실이 됐다. 구글이 실시간 게임 생성 ai 모델 gamengen을 시연했다.

2024-08-29

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

① 연구진은 머신러닝을 통해 gamengen 모델을 통해 1990년대 1인칭 슈팅 게임 '둠'을 실시간으로 성공적으로 생성할 수 있었습니다. ② 완성된 결과물은 아직 미흡하지만, 이번 연구는 향후 ai 기반 게임의 전망을 더욱 보여줍니다. ; ③ 엔비디아 ceo 젠슨 황(jensen huang)은 한때 예측한 대로, 약 5~10년 안에 ai로 게임이 완전히 생성되는 것을 볼 수 있습니다.

financial associated press, 8월 29일(편집자 shi zhengcheng)ai 모델을 통한 실시간 게임 생성 시대가 조용히 다가왔습니다.

이번 주 google과 tel aviv university의 연구원은 "확산 모델은 실시간 게임 엔진입니다."이 논문에서는 신경망 모델이 완벽하게 지원되는 컴퓨터 역사상 최초의 게임 엔진인 gamengen을 소개합니다.

(출처: github)

연구자들은 논문에서 다음과 같이 썼습니다.오늘날 비디오 게임은 인간에 의해 프로그래밍되며 gamengen은 게임이 코드 라인이 아닌 신경 모델의 가중치가 되는 게임 엔진의 새로운 패러다임에 대한 개념 증명의 일부입니다.。”

좀 더 이해하기 쉽게 표현하자면, 현재의 모든 비디오 게임은 미리 디자인되어 있습니다. 개발자는 코드를 작성하고 게임 텍스트와 텍스처 모델을 준비한 다음 게임 맵에 배치해야 합니다. 게임 화면의 렌더링 및 상태 업데이트는 이에 따라 다릅니다. 수동으로 편집된 규칙의 경우 켜짐. 그러나 gamengen 모델은 완전히 다른 아이디어를 제시합니다.ai 생성 모델을 사용하여 플레이어의 행동과 반응을 기반으로 게임 이미지를 실시간으로 계산하고 생성합니다.

이번 시연에서 연구진은 머신러닝을 활용해 1990년대 1인칭 슈팅 게임 '둠(doom)'을 gamengen 모델로 실시간 생성하는데 성공했다. 영상은 ai가 생성한 게임에서 플레이어가 현장에서 무기를 돌리고 발사하는 동시에 남은 총알 수, 공격을 받은 후 남은 혈액량, 필요한 조건 여부를 정확하게 반영할 수 있음을 보여줍니다. 다음 레벨을 열려면 충족됩니다.

(출처: 시연 영상)

위에 보이는 일련의 이미지는 모두 ai가 실시간으로 생성한 이미지라는 점에 유의해야 합니다.또한 최근 진행 상황에 따르면 ai 모델은 텍스트, 이미지, 오디오 및 짧은 비디오를 성공적으로 생성한 후 훨씬 더 높은 논리, 일관성 및 실시간 상호 작용이 필요한 게임 장면을 생성할 수 있는 능력을 갖게 될 수 있습니다.

그들은 어떻게 했나요?

연구팀에 따르면 실시간으로 게임을 생성할 수 있는 이 ai를 훈련시키기 위해서는 먼저 강화학습(rl) 에이전트를 훈련시켜 게임을 플레이한 뒤, 녹화된 클립을 사용해 생성 확산 모델을 훈련해야 한다. 과거 장면과 플레이어 행동을 기반으로 예측합니다. ai 생성 게임이 체력과 탄약의 변화는 물론 공격받는 적의 애니메이션을 표시할 수 있는 이유는 다음과 같습니다.

더 큰 과제는 ai가 생성한 이미지를 시간적, 논리적으로 일관성을 유지하는 것입니다. 추론 중 자동회귀 드리프트를 완화하기 위해 연구원들은 훈련 중에 인코딩된 프레임에 가우시안 노이즈를 추가하여 컨텍스트 프레임을 파괴했으며, 이를 통해 ai가 이전 프레임에서 샘플링된 정보를 수정할 수 있도록 하여 시간이 지나도 이미지 생성의 안정성을 유지할 수 있었습니다.

(출처: 연구논문)

연구원들은 다음과 같이 밝혔습니다.이 모델을 실행하려면 초당 20프레임의 생성 속도를 달성할 수 있는 단일 tpu(google이 자체 개발한 ai 프로세서)만 필요합니다.

물론 위 단락에서는 gamengen의 한계도 보여줍니다. 이 ai는 게임을 생성하기 위해 기존 게임(또는 텍스트, 그림 및 기타 자료)의 입력에 의존해야 합니다.

nvidia의 수석 연구 관리자이자 embodied intelligence group의 책임자인 dr. jim fan은 소셜 미디어에 다음과 같이 말했습니다.gamengen은 비디오 생성 모델이라기보다는 nerf(neural radiation field)에 더 가깝습니다. neural radiation field는 다양한 각도에서 장면의 이미지를 촬영하여 장면의 3d 표현을 생성합니다. 그러나 이는 모델이 일반화할 수 없고 새로운 시나리오를 "상상"할 수 없다는 의미이기도 합니다. 이는 gamengen과 sora의 차이점이기도 합니다. 즉, 새로운 장면이나 상호 작용 메커니즘을 생성할 수 없습니다.

(출처: x)

연구진은 논문에서도 이를 언급하면서 이 기술의 도움으로미래의 게임 개발자는 "텍스트 설명 및 샘플 이미지"를 사용하여 새로운 게임을 만들 수 있으며, 이를 통해 세련된 이미지 세트를 프로그래밍 기술이 아닌 예제만을 기반으로 기존 게임의 새로운 플레이 가능한 레벨이나 캐릭터로 전환할 수 있습니다. .

jen-hsun huang: 5~10년 안에 ai로 완전히 생성된 게임이 나올 것입니다.

ai 렌더링을 기반으로 하는 실시간 게임은 새로운 아이디어가 아닙니다. 올해 3월 최신 세대의 블랙웰 아키텍처 칩이 출시되었을 때 엔비디아 ceo 젠슨 황(jensen huang)은 다음과 같이 예측했습니다.5~10년 정도 지나면 ai가 완전히 게임을 만드는 모습을 볼 수 있을 것이다.

사실 이러한 방향으로 나아가는 것은 google 팀만이 아닙니다.openai는 올해 sora 데모를 처음 출시했을 때 픽셀 게임 '마인크래프트'를 시뮬레이션하는 능력도 시연했습니다.

(출처: 오픈ai)

이번 전개는 최근 '사퇴 설득' 논란을 불러일으킨 미호요(mihoyo) 전 회장 차이하오위(cai haoyu)와도 겹친다.

cai haoyu는 이번 주에 공개적으로 다음과 같이 말했습니다.aigc는 게임 개발에 혁명을 일으켰습니다. 이제 이 현상이 완전히 펼쳐지는 데는 시간이 걸립니다.. 그는 미래에는 두 가지 유형의 게임 개발자, 즉 상위 0.0001%의 천재와 자신의 필요에 맞는 게임을 만드는 99%의 비즈니스 매니아만이 업계에서 계속 일할 수 있을 것이라고 믿습니다. "일반에서 프로로" 남은 게임 개발자들은 모두 하루빨리 직업을 바꿔야 한다.

(출처 : 인터넷)