2024-08-19
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
타오러(Tao Le)는 아오페이 사원(Aofei Temple)에서 유래되었습니다.
Qubits 공개 계정 QbitAI
AGI는 언제 구현되나요? Google딥마인드 Hassabis CEO는 최근 인터뷰에서 다음과 같이 예측했습니다.
10년.
만약에AGI앞으로 10년 안에 그런 일이 나타난다면 나는 놀라지 않을 것이다.
이번 인터뷰에서 허사비스는 AI의 발전 동향에 대해 이야기했다.
다음과 같이 모든 사람이 관심을 갖는 몇 가지 주제가 있습니다.
AI는 단기적으로 과대평가될 수 있지만 장기적으로 그 잠재력과 영향력은 여전히 과소평가되어 있습니다.
Google의 '슈퍼 팀'인 Google DeepMind는 상업적 이익과 과학적 연구 사이의 균형을 찾아야 합니다.
오픈 소스는 기술 발전에 중요하지만, 오용될 수 있는 기술을 접하게 되면 오용을 평가하고 제한하기 위해 오픈 소스로 만들기 전에 1년을 기다려야 할 수도 있습니다.
보다 구체적인 내용은 아래 텍스트 버전을 참고해주세요~
큐: 오늘 인터뷰에는 DeepMind의 공동 창업자이자 현 Google DeepMind의 CEO인 Hassabis를 초대했습니다.
허사비스: 감사합니다. 귀하의 인터뷰에 참여할 수 있게 되어 매우 기쁩니다. 이전에는 시뮬레이션 환경이나 주변 세계를 이해하는 데 필요할 수 있는 실제 지능을 보유한 로봇과 같은 현실 세계에서 개념과 언어가 어떻게 사용될 수 있는지 살펴보았습니다.
그러나 이러한 시스템은 아직 이상적인 수준에 이르지 못했고 많은 실수를 저지르며 실제로 완전한 세계 모델을 구축하지 못했다는 점을 인정해야 합니다. 그럼에도 불구하고 그들은 언어 학습만으로 우리의 기대를 훨씬 뛰어넘는 발전을 이루었습니다.
큐: 네, 지난 시간에 현실 세계에서 언어를 구현하는 방법에 대해 많이 논의했습니다. 그런데 '착륙'이 무슨 뜻인지 간략하게 설명해주실 수 있나요? 혹시 저희 인터뷰를 처음 보시는 친구들이 이해를 못하실까봐요.
허사비스:"착륙"이 개념은,1980년대와 1990년대 MIT와 같은 학술 기관에서 구축한 고전적인 AI 시스템에서 유래되었습니다.이러한 시스템의 대부분은 상호 연관된 많은 단어를 포함하는 거대한 데이터베이스로 상상할 수 있는 거대한 논리 시스템입니다.
그러나 문제는 데이터베이스에서 "개는 다리가 4개 있습니다"와 같은 구문을 찾을 수 있지만 시스템이 실제 개 사진을 접할 때 해당 픽셀을 데이터베이스의 기호와 연관시킬 수 없다는 것입니다. , 이것이 소위 "착륙 문제"입니다.
즉, 시스템은 상징적이거나 추상적인 표현을 가지고 있지만 현실 세계에서는 이러한 표현의 구체적인 의미를 이해할 수 없습니다. 그 이후로 사람들은 이 문제를 해결하려고 노력했지만 결코 완벽함을 이루지 못했습니다.
과거 시스템과 달리 오늘날의 AI 시스템은 데이터에서 직접 학습하고 처음부터 데이터와 현실 세계를 연결합니다.
흥미롭게도 이러한 시스템은 처음에는 언어를 기반으로만 학습하더라도 실제 시뮬레이터, 로봇 또는 기타 형태의 입력에 연결되어 있지 않기 때문에 이론적으로 "시작"하는 데 필요한 많은 정보가 부족해야 합니다. 언어 공간에서 학습하는 것입니다.
그러나 놀랍게도 이러한 시스템은 여전히 현실 세계에 대한 일부 지식을 추론할 수 있습니다.
큐: 이는 사람들이 시스템과 상호작용하면서 시스템에 어떤 대답이 맞고 틀린지 알려주기 때문일 수 있습니다. 이러한 방식의 피드백을 통해 시스템은 '착륙' 정보의 일부를 수신하여 점차 현실 세계와의 연결을 구축할 수 있습니다.
허사비스: 실제로 이전 버전의 시스템이 "개는 어떻게 짖는가?"와 같은 질문에 잘못 대답하는 등 "착륙" 정보가 부족하여 잘못된 대답을 했다면 사람들의 피드백을 통해 이를 수정했을 것입니다.
이 피드백은 우리 자신의 "구현된" 지식을 기반으로 합니다.시스템은 이 피드백으로부터 정보를 흡수하고 학습합니다.
큐: 그리고 AI에 대한 과대평가에 대해서도 묻고 싶습니다. 우리의 현재 상황, 현 상황이 과소평가되거나 과대평가되었다고 생각하십니까?
허사비스: 내 생각에는 후자에 가까운 것 같다. 나는 말하고 싶다.단기적으로는 과대광고가 너무 멀리 나아갔습니다.
사람들은 AI가 온갖 일을 할 수 있다고 말하지만 실제로는 사람들이 말하는 것만큼 강력하지 않습니다. 아직 성숙되지 않은 비현실적인 아이디어를 추구하는 스타트업과 VC가 많습니다.
하지만 한편으로는 지금도 여전히 저평가되거나 충분히 주목받지 못하고 있는 것 같아요. 특히 AGI와 Post-AGI 단계에 접어들면서 사람들은 이것이 얼마나 큰 변화가 될지, 그에 따른 책임을 완전히 이해하지 못하는 것 같습니다.
그래서,단기적으로는 확실히 과대평가됐지만, 장기적으로는 여전히 저평가됐다고 생각합니다.
큐: 자, 이제 이번 인터뷰에서는 좀 더 중요한 질문을 드리고 싶습니다. Gemini와 다른 연구실에서 출시한 대규모 언어 모델의 차이점은 무엇이라고 생각하시나요?
허사비스: 우리는 Gemini 프로젝트 초기부터 여러 유형의 데이터를 동시에 처리할 수 있도록 한다는 목표를 세웠습니다. 텍스트를 이해할 수 있을 뿐만 아니라 소리, 비디오, 그림, 코드 등 기본적으로 모든 형태의 정보를 분석할 수 있기를 바랍니다.
우리는 시스템이 현실 세계의 다양한 정보를 이해하고 처리할 수 있도록 함으로써만이 세상을 진정으로 이해하고 보다 정확하고 포괄적인 세계 모델을 구축할 수 있다고 굳게 믿습니다.
이것은 실제로 위에서 언급한 "착륙" 문제의 확장이지만 이번에는 이를 달성하기 위한 기반으로 언어를 사용하고 있습니다.
큐: 그럼 "구현"이 여전히 전체 프로젝트의 핵심인가요?
허사비스: 사실 이게 제일 중요해요.
우리에게도 궁극적인 목표가 있습니다.만능 어시스턴트 만들기. 우리는 다음과 같은 도구를 개발했습니다.아스트로프로젝트 프로토타입인 Astro는 귀하의 입력을 이해할 뿐만 아니라 환경의 맥락도 감지합니다.
질문의 맥락이나 자신이 처한 상황을 더 깊이 이해한다면 개인 비서나 디지털 비서가 얼마나 더 강력해질지 상상해 보세요. 따라서 우리는 이러한 유형의 시스템이 더 실용적일 것이라고 항상 굳게 믿습니다.
이를 위해 우리는 프로젝트 초기부터 시스템에 다중 모드 기능을 구축했습니다. 당시에는 이 기능을 갖춘 유일한 모델이었는데, 지금은 다른 모델들도 따라잡으려고 노력하고 있습니다.
큐:Project Astro는 비디오 및 오디오 데이터를 처리할 수 있는 신흥 범용 AI 에이전트입니다.Google I/O 컨퍼런스에서 Astro가 사용자가 안경의 위치를 기억하는 데 어떻게 도움이 되는지 보여주는 예가 기억납니다. 이 기술의 기원에 관심이 있습니다. 이것은 단지 기존 Google Glass의 발전된 진화에 불과합니까?
허사비스: Google은 2012년경부터 안경 기반 기기 개발에 오랜 역사를 갖고 있습니다. 따라서 그들은 이 분야에서 상당한 선점자 이점을 가지고 있습니다. 스마트 비서가 자신이 보고 있는 것을 이해하는 데 필요한 기술이 부족했을 수도 있습니다. 하지만 지금은,이 디지털 비서가 옆에 있으면 주변 세계를 이해할 수 있습니다., 매우 자연스러운 느낌입니다.
큐: Gemini는 조직 내의 서로 다른 두 부서에서 시작되었고 그 부서에서 수행되었기 때문에 Gemini의 기원을 추적하고 싶습니다.
허사비스: 사실 작년에 우리는 Alphabet을 넣었어요.(구글 모회사)원작의 두 연구 부서딥마인드그리고구글 브레인, 새로운 부서로 합병되어 이를 호출합니다."슈퍼부서"。
이런 식으로 회사 내 최고의 인재들이 모두 하나의 팀으로 모여서, 모든 연구 분야, 특히 언어 모델 분야의 최고의 지식을 결합합니다.
우리는 Trin Chilla 및 Gopher와 같은 일부 이전 프로젝트를 진행했으며 모두 Palm 및 Lambda와 같은 초기 언어 모델 개발에 참여했습니다. 이러한 모델 각각에는 고유한 장점과 단점이 있으며, 합병 후 첫 번째로 매우 중요한 프로젝트인 Gemini 프로젝트에 이를 통합했습니다.
게다가 특히 중요한 점이 또 있는데, 바로 우리가모든 컴퓨팅 리소스를 함께 통합. 이러한 방식으로 우리는 실제로 모든 컴퓨팅 성능을 통합하는 대규모 교육 실행을 수행할 수 있습니다.Gemini를 더욱 강력하고 효율적으로 만들어 보세요.。
이 두 팀은 항상 AI의 최전선에 집중해 왔습니다. 이전에도 개인 연구에서 많은 협력을 해왔지만 전략적으로 그렇게 가깝지는 않을 수 있습니다. 이제 합쳐진 팀을 Google의 팀이라고 표현하겠습니다."엔진룸"。
실제로 두 팀의 작업 방식은 큰 차이 없이 꽤 비슷하다고 생각합니다. 다음으로는 다음을 생각하는 등 기초연구의 장점을 계속해서 강화해 나가겠습니다.변신 로봇아키텍처가 어떤 모습일지는 우리 모두가 스스로 파악하고 싶어합니다.
그러고보니 이전 Transformer는 Google Brain에서 만들었고 이를 Deep Reinforcement Learning과 결합했지만 더 많은 혁신이 필요하다고 생각합니다. 지난 10년처럼 Brain이든 DeepMind이든 계속해서 기여할 것이라고 믿습니다.
큐: 방금 Google DeepMind가 이제 Google의 '엔진룸'이라고 말씀하셨습니다. 이것은 큰 변화입니다. Google이 현재 귀하에게 큰 기대를 걸고 있는지 알고 싶습니다.
허사비스: 그렇게 생각해요. 저는 구글이 AI의 중요성에 대해 항상 명확하게 인식해 왔다고 생각합니다. 피차이는 처음 CEO가 되었을 때 이렇게 말했습니다.구글은 'AI 우선' 기업이다。
우리는 그가 처음 취임했을 때 이 주제에 대해 논의했습니다. 그는 모바일 인터넷 이후의 주요 패러다임 전환으로 AI의 잠재력을 보았고, 그 영향은 이것보다 훨씬 더 깊었습니다.
하지만 지난 1~2년 동안 우리는 연구 관점뿐만 아니라 제품 및 기타 모든 측면에서 이것이 무엇을 의미하는지 이해하기 시작했다고 생각합니다. 그래서 매우 신나는 시기지만, 모든 재능을 모아 총력을 기울이는 것이 우리의 올바른 선택이라고 생각합니다.
큐: 또 다른 관점에서 보면, 이제 구글의 '엔진룸'이 된 딥마인드에 있어서, 상업적 이익을 고려하는 것과 순수 과학 연구 사이에서 더 많은 균형을 찾아야 한다는 뜻인가요?
허사비스: 실제로 우리는 이제 비즈니스 이익을 더 많이 고려해야 하며 이는 우리의 책임의 일부가 되었습니다. 그러나 여전히 명확히 해야 할 몇 가지 사항이 있습니다. 우리는 과학 연구 작업을 계속 발전시킬 것이며 이 분야에 대한 투자는 계속 증가하고 있습니다.
제 생각에는,이는 Google DeepMind에서 하는 독특한 일입니다., 경쟁사조차도 이러한 결과를 AI의 광범위한 이점으로 간주합니다.
큐: 좋습니다. 다음 질문은 오픈 소스입니다. 당신이 말했듯이 기술이 대중의 손에 들어가면 꽤 놀라운 일이 일어날 수 있습니다. DeepMind가 과거에 많은 연구 프로젝트를 오픈 소스로 제공했다는 것을 알고 있지만 지금은 상황이 달라진 것 같습니다. 오픈 소스에 대한 귀하의 견해에 대해 말씀해 주시겠습니까?
허사비스:오픈소스는 필수입니다. 우리는 언제나 오픈소스와 오픈사이언스를 강력하게 지지해 왔습니다.아시다시피 우리는 Transformer와 같은 프로젝트를 포함하여 우리가 수행하는 거의 모든 연구 프로젝트를 출판합니다.알파고우리는 Nature 및 Science와 같은 최고의 잡지에 이와 같은 프로젝트를 게재했습니다.
AlphaFold도 오픈 소스입니다., 이것들은 모두 우리가 만든 것입니다현명하게 선택하세요. 맞습니다. 정보를 공유함으로써 기술과 과학이 가장 빠른 속도로 발전할 수 있기 때문에 이러한 접근 방식이 효과적입니다. 대부분의 경우,오픈 소스는 보편적으로 유익하며 이것이 바로 과학이 작동하는 방식입니다.。
하지만 예외도 있습니다. AGI 및 강력한 AI와 같은 이중 목적 기술의 경우입니다.
문제는 모든 좋은 사용 사례를 활성화할 수 있기를 원하고 실제 과학자와 기술자가 이러한 아이디어를 구축하고 비판하여 사회의 급속한 발전을 이끌 수 있기를 원한다는 것입니다. 그러나 동시에 이러한 시스템을 악용할 수 있는 악의적인 행위자를 어떻게 제한할 것인가, 그것이 문제입니다.
지금은 괜찮습니다. 왜냐하면 이러한 시스템이 충분히 강력하다고 생각하지 않기 때문입니다. 그러나 2~3년 후에, 특히 에이전트 동작이 있는 시스템을 얻기 시작하면 심각한 피해를 초래할 수 있습니다.
우리는 Gemma라는 자체 오픈 소스 Gemini 모델을 보유하고 있지만 이는 최신 모델이 아닌 소형 모델입니다.
해당 기능은 랩톱에서 실행할 수 있고 매개 변수 수가 적기 때문에 여전히 개발자에게 매우 유용합니다. 최신 최첨단 모델이 아니기 때문에 이 단계에서는 그 성능이 잘 이해됩니다.
아마도 우리가 하게 될 일은 오픈 소스 모델을 가지게 될 것이지만 최신 최첨단 모델보다 1년 정도 뒤쳐져 사용자를 대상으로 한 공개 테스트에서 해당 모델의 기능을 실제로 평가할 수 있을 것입니다.
오픈 소스의 한 가지 문제점은 문제가 발생하면 이를 기억할 수 없다는 것입니다. 독점 모델을 사용하면 악의적인 사람이 이를 나쁜 방식으로 사용하기 시작하면 해당 모델을 종료하거나 극단적인 경우 전체 시스템을 종료할 수도 있습니다. 하지만 일단 소스를 공개하면 다시 되돌릴 수는 없습니다.
큐: 요즘은 과학 연구자들이 다양한 AI 모델을 개발하고 있는데, AI가 모든 과학 연구를 지원하는 단계에 들어간다면 여전히 R&D 기관이 존재할 여지가 있는지 알고 싶습니다.
허사비스: 아직은 여지가 있다고 생각합니다. 일반 AGI가 등장하기 전의 단계이기 때문에 사회, 학계, 정부, 산업계의 긴밀한 협력이 필요하다고 생각합니다.
나는 이것이 우리가 궁극적으로 거기에 도달할 수 있는 유일한 방법이라고 진심으로 믿습니다. AGI 이후에 무슨 일이 일어나는지 묻는다면 아마도 그것이 정말로 알고 싶을 것입니다. AGI는 현실의 본질, 물리학, 의식 등에 관한 가장 근본적인 질문을 탐구하는 데 사용할 수 있기 때문에 항상 제가 구축하고 싶은 열망이었습니다.
큐: 컴퓨터 과학자 스튜어트 러셀(Stuart Russell)은 일단 AGI에 도달하면 우리 모두가 과거의 귀족처럼 아무런 목표도, 생각도 없이 평온하고 사치스러운 삶만 누리는 것은 아닌지 조금 걱정된다고 말했습니다.
허사비스: 내 생각엔 미래가 매우 흥미로울 것 같아. 그러나 앞서 언급한 "과소평가된" 문제, 즉 단기 과대광고와 장기 과대광고의 차이도 발생합니다. 과대 광고라고 부르고 싶다면 확실히 어느 정도 저평가되어 있습니다.
앞으로의 변화는 엄청날 것 같아요. 나는 결국 우리가 할 수 있다고 믿는다많은 질병, 심지어 모든 질병을 치료하고 에너지 문제와 기후 문제를 해결합니다.
큐: 그러고보니 AGI가 우주의 신비를 탐구할 수 있기를 바란다고 말씀하셨던 기억이 나네요. 웜홀 같은 현상처럼 우리가 아직 상상하지 못한 가능성이 있다고 생각하시나요?
허사비스:틀림없이,나는 이 가능성을 전적으로 믿는다.. 웜홀이 현실이 되기를 진심으로 바랍니다. 제가 보기엔 우리는 물리학과 현실의 본질에 대해 아직도 많은 오해를 갖고 있는 것 같습니다.
분명히 양자역학과 중력의 통일, 표준모형의 문제, 끈이론 등에는 풀리지 않는 수수께끼가 셀 수 없이 많이 숨겨져 있습니다. 저는 물리학계의 많은 친구들과 심도 있는 논의를 해왔는데, 그들은 모두 기존의 이론적 틀에 완벽하게 들어맞지 않는 부분이 많다고 믿고 있습니다.
저는 개인적으로 다중우주 설명을 그다지 좋아하지 않기 때문에, 새로운 이론을 생각해내고 우주의 대규모 장비를 이용해 실험할 수 있다면 정말 멋지다고 생각합니다.
내가 플랑크의 시간과 공간의 척도에 매료되는 이유는 그것이 마치 모든 것을 나눌 수 있는 가장 작은 단위처럼 현실의 궁극적인 해결을 대변하는 것 같기 때문이다.
그러므로 우리는 이 수준에서, 특히 우리가AGI와 풍부한 자원이 있다면 아마도 그러한 실험 장비를 설계하거나 제작할 수 있을 것입니다.
큐: DeepMind가 20년에 걸친 프로젝트라고 말씀하신 적이 있나요? 아직도 계획대로 진행되고 있나요?
허사비스: 네, 아직 일정대로 진행 중입니다. 일반적으로 20년 된 프로젝트를 완료하는 데 항상 20년이 더 걸릴 것처럼 느껴지기 때문에 믿기지 않을 수도 있습니다. 하지만 우리는 먼 길을 왔습니다.
우리의 목표는 2030년까지 달성하는 것이므로 향후 10년 안에 목표에 도달할 수 있다고 해도 놀라지 않을 것입니다.
영상 주소: https://www.youtube.com/watch?v=pZybROKrj2Q *