Zhu Jiaming의 새 서문: AI와 인간 지능이 2024 상하이 도서전 8대 트렌드에서 '지능 공유' 시작 |
2024-08-19
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
"대화의 시대: 새로운 생산성을 창출하여 강국으로 가는 길"(주가명, 도호, 심양 등), 2024년 8월 북경대학교 출판사에서 발행, 가격 78위안
[소개] 상하이 도서전이 한창 진행 중이며 전시장 안팎으로 인파가 붐비고 각층의 정보와 영혼이 흐르고 감염되고 있습니다.
북경대학교 출판부가 출판하고 원회강당 연사들이 편찬한 신간 '대화의 시대: 새로운 생산성을 창출하여 강국으로 가는 길'이 도서전에서 공개되었으며 장안제에서 개최되었습니다. 독서클럽 8월 14일 신간도서 목록을 알아보세요. 이 책은 인공지능의 '출현', 가상과 현실 세계의 통합적 발전, 디지털 지능 기술의 인프라 등 세 가지 주요 장으로 구성되어 있으며, 주로 인공지능, 대형 모델, 칩, 뇌-컴퓨터 인터페이스에 중점을 두고 있습니다. , Web3, 위성인터넷, 디지털생태학, 메타-우주, AI윤리 등의 주제를 다룬다.
Zhu Jiaming, Lin Baojun, Wang Jianyu, Shen Yang, Li Miao, Cai Hengjin, Lu Yong, Lin Longnian, Lin Yonghua, Tao Hu, Yang Guang, Wei Hui 및 He Liang Ji Weidong, Feng Xiang, Jiang Xiaoyuan, Yu Hai, He Jing, Fu Changzhen, Li Quanmin 등을 포함한 강연 손님은 차세대 정보 기술, 인공 지능 분야의 기술 혁신과 기술 혁신에 대한 심층 분석을 진행했습니다. 지능, 항공우주, 생물의학, 양자 기술 등 산업 발전은 글로벌 인공지능 개발의 개척지, 동향 및 과제뿐만 아니라 인공지능 윤리적 거버넌스 등의 문제를 탐구하여 독자가 새로운 생산력의 개념과 의미를 이해하는 데 도움이 될 것입니다. 중국 현대화 발전을 촉진하는 데 있어 그들의 중요한 역할. 이 책은 과학과 기술, 인문학의 대화, 기술 발전과 사회 변화의 연계를 담고 있으며, 첨단적이면서 새로운 지식을 얻을 수 있는 책이며, 새로운 품질 생산성의 개념과 의미, 그리고 그 중요한 역할을 이해하는 데 도움이 됩니다. 중국 현대화의 발전을 촉진합니다.
특히 이 책의 서문이 17,000단어로 저자 중 한 명인 경제학자 Zhu Jiaming이 직접 썼다는 점은 언급할 가치가 있습니다. 이 책은 2022년부터 2024년까지 인공지능 개발의 개척지, 추세, 과제에 초점을 맞추고 자세히 설명합니다. 본 서문에 포함된 인공지능이 거시경제에 미치는 영향에 대한 최신 정보는 2024년 7월 초 기준입니다. 이 섹션에서는 이 서문에서 AI 개발의 개척지, 추세 및 과제를 발췌합니다.
도서박람회 기간 동안 독자들은 E1-07, East Hall 1에 위치한 Peking University Press에서 구매(40% 할인)하거나 Dangdang, JD.com, Taobao 등 온라인 플랫폼에서 주문할 수 있습니다.
북경대학교출판부 상하이도서전 "대화의 시대" (부스 E1-07, 동쪽 1홀)
AI와 인간 지능은 '공동지능'이라는 8대 트렌드에 진입하기 시작했다.
인공지능은 새로운 생산성의 중요한 부분입니다. 인공지능은 사고, 기술, 경제, 사회를 아우르는 종합적인 기술이다. 인공지능 기술은 인류 역사 속의 농업기술, 산업기술, 정보기술과는 달리 고대 그리스부터 현대에 이르기까지 지식인 엘리트들의 신념과 개념, 정신에서 비롯됐다. 즉, 지능은 인간만을 위한 것이 아니다. 지능은 궁극적으로 계산될 수 있기 때문에 창조된 기계도 지능을 생산할 수 있습니다. 1936년 튜링 머신의 탄생은 의심할 여지 없이 인공지능 역사상 획기적인 사건이다. 지난 80여년 동안 인류 사회에 있어 인공지능은 일종의 과학기술을 의미했을 뿐만 아니라 사고, 경제, 사회에 파괴적인 변화를 의미하기도 했습니다. 지속적인 반복과 진화를 통해 인공지능은 장기주의와 가속주의 사이의 상호작용의 역사적 중요성을 계속해서 증명해왔고 앞으로도 계속할 것입니다. 이 기사에서는 2022년 이후 글로벌 인공 지능 개발의 개척지, 추세 및 과제에 대해 논의합니다.
1. 큰 언어 모델(또는 큰 모델)
6월의 큰 혁신: "강화 학습" 오류를 찾아 수정할 수 있습니다.
인공지능의 발전 역사는 여러 단계로 나눌 수 있다. 2022년 11월 OpenAI가 ChatGPT를 출시하며 생성적 인공지능(Generative Artificial Intelligence, GenAI)이 번창하기 시작했습니다. 생성 인공지능(Generative Artificial Intelligence)은 인간의 신경망을 모방해 텍스트, 이미지, 음악, 동영상 등을 통해 새로운 콘텐츠를 만드는 머신러닝 기술을 기반으로 한다.
GenAI의 중앙화된 대표자는 LLM(Large Language Model)입니다. 소위 대형 언어 모델은 대량의 텍스트 데이터를 기반으로 훈련된 딥러닝 모델로, 자연어 텍스트를 생성하거나 언어 텍스트의 의미를 이해할 수 있습니다. 또한 대규모 언어 모델은 딥 러닝을 기반으로 하며 다층 신경망을 사용하여 인간 두뇌가 정보를 처리하는 방식을 시뮬레이션함으로써 데이터의 복잡한 패턴을 식별한다고 말할 수 있습니다.
현 단계에서 인공지능의 핵심은 대규모 언어 모델이다. 세계 주요 국가와 대기업들이 대형 언어 모델 개발을 주도해 폭발적인 성장을 보이며 끊임없이 확장되는 대형 언어 모델 클러스터를 형성하고 있다. 대규모 언어 모델의 성능에 영향을 미치는 주요 변수는 학습 데이터, 모델 크기(즉, 매개변수 수), 생성 알고리즘 및 최적화 기술입니다. 대규모 언어 모델의 특징은 다음과 같습니다. (1) 대규모 매개변수. 대규모 언어 모델의 매개변수 수는 종종 수십억 또는 수천억에 달할 수 있습니다. (2) 영상인식 및 예측분석 능력을 갖출 것. (3) 데이터를 이해하고 일반화할 수 있는 능력을 가지고 있다. 다양하고 복잡한 작업을 학습하고 수행할 수 있으며 자연어 처리(NLP)에서 정확하고 효율적인 기계 번역, 감정 분석 및 지능적인 질문과 답변을 달성할 수 있습니다.
ChatGPT, Google의 Gopher, LaMDA 및 Meta의 Llama는 대규모 언어 모델의 글로벌 대표자입니다. 그 중 오픈AI가 2023년 출시한 GPT-4는 단일 모델이 아닌 일련의 모델을 총칭하는 명칭이다. 2024년 5월 OpenAI가 출시한 GPT-4o 모델은 텍스트, 음성, 이미지 이해 측면에서 수백 가지 언어를 처리하는 뛰어난 능력을 입증했으며 실시간 음성 대화를 수행하고 인간의 감정을 정확하게 포착하고 표현할 수 있었습니다. . 같은 해 6월, Anthropic은 코딩 기능, 시각적 기능 및 새로운 상호 작용 방식 측면에서 Claude 3 Opus 및 GPT-4o를 능가하는 Claude 3.5 Sonnet 모델을 공식 출시했습니다. 더욱 흥미로운 점은 Claude 3.5 Sonnet이 혁신적인 "Artifacts" 기능을 도입했다는 점입니다. 이 기능을 통해 사용자는 동적 작업 공간에서 AI 생성 콘텐츠를 실시간으로 편집하고 구축할 수 있으며, 대화형 AI를 사용자에게 원활하게 통합되는 협업 파트너로 전환할 수 있습니다. ' 프로젝트와 워크플로. 특히 클로드 3.5 소네트(Claude 3.5 Sonnet)는 이전 세대보다 속도는 2배, 비용은 1/5로 스마트 모델의 가성비를 재정의했다.
또한 6월에는 대규모 언어 모델 분야에서 획기적인 발전이 이루어졌습니다. OpenAI는 ChatGPT 코드 출력에서 오류를 캡처하는 데 사용되는 GPT-4 모델을 기반으로 CriticGPT를 출시했습니다. 즉, CriticGPT는 GPT-4를 사용하여 ChatGPT 응답 결과에 대한 사용자의 의견을 작성할 수 있을 뿐만 아니라 인간 트레이너가 인간의 의도를 더 잘 이해하고 만족시키며 이를 발견하고 수정하도록 돕는 모델입니다. 인간 피드백을 통한 강화 학습(RLHF)의 오류는 고급 AI 시스템의 출력을 평가하려는 목표를 향한 중요한 단계를 나타냅니다.
2.AI 플랫폼
세상에는 9개의 주요 플랫폼이 있으며 그 추세는 수직화, 전문화입니다.
AI가 인간의 생산과 삶의 모든 측면을 다루면서 AI 플랫폼 구축이 대세로 자리 잡았다. AI 플랫폼은 음성, 영상, NLP 등 세계 최고 수준의 멀티모달 인공지능 기술과 개방형 대화형 인공지능 시스템 및 생태계를 제공한다. 현재 전 세계에는 Google, TensorFlow, Microsoft Azure, OpenAI, NVIDIA, H2O.ai, Amazon Web Services(AWS), DataRobot, Fotor 등 9개의 주요 AI 플랫폼이 제공됩니다. 그중 엔비디아 옴니버스(NVIDIA Omniverse)는 가상 협업과 실시간 현실감 넘치는 시뮬레이션을 위해 설계된 개방형 플랫폼으로 GPU, CUDAX AI 소프트웨어 등 강력한 생태계를 바탕으로 머신러닝, 딥러닝 등 업계 최고의 솔루션을 제공한다. 및 데이터 분석.
AI 플랫폼의 발전 추세는 주로 수직화와 전문화이다. 예를 들어, AI 아트 플랫폼은 인공지능 기술을 통한 이미지 처리 및 창작을 위한 플랫폼으로, 예술가와 비전문가가 흥미롭고 미적으로 가치 있는 그림을 인공지능 그림의 형태로 신속하게 생성하고 이를 통해 창의적 창작이 가능하도록 돕는다. 영감과 예술적 경험, 예술을 제공합니다. 세상에 더 많은 혁신과 가능성을 가져옵니다. 미드저니(Midjourney)와 스테이블 디퓨전(Stable Diffusion)은 영향력이 계속 확대되고 있는 AI 아트 플랫폼이다. 또 다른 예로 Suno v3.5는 AI 음악 생성 도구로 생성된 음악의 길이가 원래 2분에서 4분으로 변경되었으며 음악 구조가 크게 최적화되었습니다. AI 음악생성 플랫폼은 말로 명확하게 설명하기 어려운 청각 예술 분야의 전문가로, 인간을 뛰어넘는 창의적 잠재력을 발휘하고 있다. Suno는 또한 사용자가 어떤 목소리로든 노래를 작곡할 수 있는 새로운 기능을 출시할 것이라고 발표했습니다. 이 새로운 기능은 일상생활의 다양한 소리를 음악으로 변화시켜 음악 창작에 새로운 가능성을 열어줍니다.
3.AI 스택
기본 요소에는 데이터, 계산 및 모델이 포함됩니다.
하드웨어 관점에서 볼 때 AI 스택의 기반은 GPU, CPU, TPU입니다. 생성 AI 스택에서 가장 중요한 것은 GPU입니다. 그러나 AI 스택에는 AI 소프트웨어 시스템도 포함되며, 궁극적으로 구축되는 AI 스택은 시스템이자 생태계이다.
심층 분석에 따르면 AI 스택은 AI 시스템을 개발하고 배포하는 데 필요한 다양한 계층과 구성 요소를 포함하는 구조화된 프레임워크인 것으로 나타났습니다. AI 스택의 주요 구성 요소에는 데이터 관리, 컴퓨팅 리소스, 기계 학습 프레임워크, 기계 학습 운영(MLOps) 플랫폼이 포함됩니다. 생성적 AI 스택은 상단, 중간, 하단의 세 가지 수준으로 구성됩니다. 최상위 계층에는 특정 분야의 지식과 전문 지식이 포함되고, 중간 계층은 AI 모델 구축에 사용할 수 있는 데이터와 인프라를 제공하며, 최하위 계층은 클라우드 컴퓨팅 리소스 및 서비스입니다. 각 수준에서 진전을 이루는 것은 AI 발전에 매우 중요합니다. AI 스택의 기본 기둥에는 데이터, 계산 및 모델이 포함됩니다. 그중 제너레이티브 AI는 고성능 데이터 센터에서 처리되고 저장되는 대량의 컴퓨팅 리소스와 대규모 데이터 세트가 필요합니다.
일반적으로 AI 스택을 기반으로 빠른 검색, 빠른 번역, 지능형 인식, 지능형 제어 등의 기능을 갖춘 인공지능 애플리케이션을 구축할 수 있다.
4. 실제 세계 시뮬레이터
세 번째는 AI 물리적 세계: 인간의 시공간 인식을 넘어서는 것이다.
현대인에게 세 가지 세계는 경험의 현실 세계, 가상 세계, 인간의 시공간 인식을 넘어선 물리적 세계이다. 인공지능은 인간과 위 세 세계의 관계에 직접적인 영향을 미친다. 경험의 현실 세계에서 인공 지능과 자연 지능의 병렬성과 상호 작용은 가상 세계에서 현실 세계가 존재하는 방식을 변화시켰습니다. 인공 지능과 현실 가상 기술은 인간을 비현실적인 몰입 경험 상태로 안내할 수 있습니다. 메타버스는 인간의 시간과 공간에 대한 인식을 초월하는 물리적 세계에서 인공지능을 통해 인간이 감각의 한계를 뛰어넘고 수백억 광년에 달하는 우주를 규모와 미시적인 장면으로 이해할 수 있도록 도와줍니다. 나노미터를 측정 단위로 사용합니다. 과학 실험 분야에서 인공지능 기술은 더 이상 단순한 도구가 아닌 필수 조건이 되었습니다.
2024년 초 소라 등장의 근본적인 의의는 자체 물리 세계 시뮬레이터 기능을 통해 인간이 인지할 수 없는 물리적 세계, 인간의 눈으로 볼 수 있는 것보다 더 현실적일 가능성이 높은 물리적 세계를 보여준다는 점이다. AI 물리엔진이 만들어낸 세계를 인간이 인지하고 통합하게 되면 인간은 더욱 다양한 물리적 규칙을 경험하게 된다.
Sora가 인식, 기억 및 제어 모듈의 지원을 기반으로 비디오 생성 작업을 수행할 때 생성된 비디오는 현실 세계의 물리적 법칙을 어느 정도 따를 수 있으므로 사람, 동물, 환경, 넓은 상상공간은 기본적으로 공간적 일관성, 시간적 일관성, 인과적 일관성을 구현한다. Sora는 읽을 수 있는 세계 모델입니다. 이 단계에서 얼마나 잘하고 있는지가 문제의 본질은 아닙니다. Open-Sora 1.1 출시 이후 영상 생성 품질과 지속 시간이 크게 향상되었습니다. 최적화된 Causal Video VAE 아키텍처는 Sora의 성능과 추론 효율성을 크게 향상시킵니다.
NVIDIA의 중요한 공헌 중 하나는 Earth-2 디지털 트윈 지구 모델의 완성입니다. Earth-2는 생성 AI 모델 CorrDiff를 결합하고 WRF 수치 시뮬레이션을 기반으로 훈련되어 12배 해상도(25km에서 2km로 증가)로 날씨 정보를 정확하게 예측할 수 있습니다. Earth-2의 다음 단계는 예측 정확도를 2km에서 수십 미터로 높이는 것입니다. 해상도는 더 높고, 실행 속도는 물리적 시뮬레이션보다 1000배 더 높으며, 에너지 효율은 3000배 더 높아 실시간으로 예측할 수 있습니다.
비전은 매우 명확합니다. 인간은 현실적이고 물리적으로 정확한 "세계의 모델"을 구성할 수 있는 능력을 갖춘 인식/기억/제어 복합체로 구성합니다. 마이크로소프트의 과학자 세바스티앙 부베크(Sébastien Bubeck)가 'AI 물리학'의 개념과 연구 방향을 제시한 것도 이런 의미에서다. NVIDIA CEO Jensen Huang도 AI의 다음 물결은 물리적 AI가 될 것이라고 제안했습니다. 따라서 엔비디아의 디지털 트윈은 지구뿐만 아니라 물리적 세계 전체를 대상으로 합니다.
5. 구체화된 지능과 지능형 로봇
궁극적인 응용: 인공지능을 "인간"으로 만들자
인공지능의 발전은 필연적으로 인공지능 생태계의 형성으로 이어진다. EAI(Embodied Artificial Intelligence), 즉 지능형 로봇이 인공지능 생태계의 주체가 되었습니다.
구체화된 지능(embodied Intelligence)은 물리적 세계에서 인공 지능을 더욱 확장한 것으로, 물리적 세계를 이해하고 추론하며 상호 작용할 수 있는 지능 시스템입니다. 행동. 또한 지능형 로봇은 인간의 사고 경로를 시뮬레이션하여 인간이 기대하는 행동 피드백을 제공하며, 다중 모드 AI를 통해 스스로 학습하고, 세상을 인식하고, 인간의 지시를 이해하고 실행하며, 개인화된 작업 및 협업 요구 사항을 완료할 수 있습니다. 지속적인 진화. 즉, 실제 물리적 환경에서 검사, 측정이 가능한 다양한 작업을 수행하는 것입니다. 즉, 체화된 지능의 특징은 주인공의 관점에서 물리적 세계를 자율적으로 인식하는 능력이다.
다양한 형태의 지능형 로봇은 신체화된 지능의 물리적 형태입니다. 전체적인 아키텍처는 인식 계층, 상호 작용 계층 및 이동 계층으로 구성됩니다. 테슬라의 휴머노이드 로봇 '옵티머스 프라임'이 1세대부터 2세대까지 발전했고, 미국의 휴머노이드 로봇 스타트업인 피겨 AI(Figure AI)가 올해 2월 막대한 투자를 받았고, 엔비디아는 2024 글로벌 테크놀로지 컨퍼런스(GTC)에 휴머노이드 로봇 25대를 전시했다. 모두 휴머노이드 로봇 분야의 급속한 발전을 보여줍니다.
2024년 3월, NVIDIA는 세계 최초의 휴머노이드 로봇 범용 기본 모델인 Project GR00T를 출시했습니다. 모델 기반 로봇은 인간의 행동을 관찰하여 자연어를 이해하고 행동을 모방할 수 있으며, 사용자는 현실 세계에 적응하고 상호 작용하기 위해 다양한 기술을 조정하는 방법을 빠르게 배울 수 있도록 가르칠 수 있습니다. 프로젝트 GR00T의 등장은 진정한 로봇 시대가 도래할 수 있음을 의미합니다. 이는 인공지능을 '인간'으로 만드는 궁극적인 AI 적용이기도 하다.
구체화된 지능의 등장은 전통적인 제어 기반 로봇 기술에서 학습 및 운영의 새로운 패러다임으로의 전환을 의미합니다. 대형 모델 기술의 폭발적인 증가와 하드웨어 비용의 절감으로 인해 물리적 세계와 상호 작용할 수 있는 지능형 로봇 개발을 목표로 하는 구현 지능 기업이 등장했습니다.
2024년 5월, 로봇공학 분야 가장 영향력 있는 국제학술대회 중 하나인 IEEE ICRA(International Conference on Robotics and Automation)가 일본 요코하마에서 개최됩니다. 올해 컨퍼런스 주제 "CONNECT+"는 로봇 공학 기술의 최신 발전뿐만 아니라 "체화된 지능"과 "학습"의 혁명도 선보입니다. 장기적으로 체화된 지능은 인공지능 산업 발전에 큰 의미를 가지며, 일반 인공지능(AGI)에 있어서도 무시할 수 없는 가치를 지닌다.
6. 공간지능
단순한 인간 눈의 기계 버전이 아닌, 상상하지 못했던 각도에서 세상을 드러냅니다.
공간 지능에는 두 가지 유형이 있습니다. 하나는 자연 진화에 의해 형성된 공간 지능입니다. 인간이 공간 지능을 진화시키는 데는 수백만 년이 걸렸습니다. 눈이 빛을 포착하여 2D 이미지를 망막에 투사하고, 뇌가 이 데이터를 3D 정보로 변환합니다. 다른 하나는 인공지능 기술을 기반으로 한 공간지능으로, 기계가 인간의 복잡한 시각적 추론과 행동을 시뮬레이션하고, 여러 센서의 도움을 받아 시각적 정보를 통해 3D 세계를 직접 이해하고 조작하는 것입니다.
자연진화에 의해 형성된 공간지능과 인공지능 기술에 기반한 공간지능을 비교하면 그 차이가 크다. 자연진화에 의해 형성된 공간지능은 공간차원에 국한되어 3차원 공간을 돌파하는 것이 어렵거나 심지어 불가능하다. . 하지만 인공지능 기술을 기반으로 한 공간지능은 공간차원을 돌파할 수 있다. 그러한 공간은 지리적 경계를 허물고 유동적이고 무한하며 자유롭고 개방적인 상태이다. 뿐만 아니라 이러한 공간은 더 이상 뉴턴의 시간 제약을 받지 않아 적시성과 시간 최적화를 달성합니다. 예를 들어, Google 연구원들은 사진 세트만 사용하여 데이터를 3D 모양이나 장면으로 변환할 수 있는 알고리즘을 개발했습니다.
이에 대해 스탠포드대학교 인간중심 AI 연구소장(국립공학원 원사) 리 페이페이(Li Feifei)는 다음과 같은 심오한 생각을 갖고 있다. “시력과 백과사전적 지식의 깊이를 결합하면 브랜드를 만들 수 있다. 새로운 능력이 무엇인지는 아직 알려지지 않았지만, 단순한 인간의 눈을 넘어선 새로운 종류의 존재, 더 깊고 세련된 관점이 될 것이라고 믿습니다. 우리가 상상하지 못했던 각도에서 볼 수 있는 세상을 드러낸다.” 즉, 인공지능 기술을 기반으로 한 공간지능은 자연진화에 의해 형성된 공간지능을 돌파하고, 인간이 두뇌에만 의지할 수 없는 공간상태를 드러낼 것이다. 상상하다. 예를 들어, 양자역학에서 기술하는 양자공간은 몇 가지 이산적이거나 연속적인 상태로 구성된 위상학적 특성을 지닌 공간을 말한다. 인간이 자연스럽게 진화한 공간지능으로는 양자공간을 인지하고 인식하는 것이 불가능하지만, 인공지능 기술이 뒷받침하는 공간지능으로는 가능하다.
요컨대 대규모 인공지능 모델을 기반으로 한 공간지능은 인간을 '새로운 존재'로 이끌고, 여기서 체화된 지능은 '원주민'이 될 가능성이 높다.
7. 인공지능의 심층 진화
무어의 법칙이 깨질 수 있으며, 메타인지로 인해 확장 법칙이 실패할 수 있습니다.
인공지능은 획기적인 진화의 역사적 순간에 있습니다. 무어의 법칙과 스케일링 법칙은 점점 더 중요한 역할을 하고 있습니다.
무어의 법칙은 인텔 공동 창업자인 고든 무어가 경험을 바탕으로 정리한 법칙으로, 집적회로에 수용할 수 있는 트랜지스터의 수가 18~24개월마다 약 2배로 늘어난다는 것이다. 즉, 프로세서 성능은 약 2년마다 두 배로 증가합니다. 문제는 칩이 28나노미터(nm)로 가면서 무어의 법칙 위기가 발생했다는 점이다. 칩이 1나노 공정 칩에 들어간다는 것은 무어의 법칙의 한계에 도달했다는 뜻이다. 이제 칩을 핵심으로 하는 인공 지능의 전체 하드웨어 기반은 무어의 법칙 위기 또는 무어의 법칙 한계에 직면해 있습니다. 2024년 6월, 2024 타이페이 국제 컴퓨터 쇼(Computex 2024)에서 Nvidia CEO Jen-Hsun Huang은 GPU 아키텍처의 업데이트 빈도가 2년마다에서 1년으로 가속화될 것이라고 발표했지만 컴퓨팅 성능의 성장은 그렇지 않았습니다. 칩의 컴퓨팅 파워는 지난 8년간 1,000배라는 놀라운 증가를 달성했는데, 이는 무어의 법칙 위기와 무어의 법칙의 한계를 돌파할 수 있는 기술적 가능성이 있음을 보여준다.
스케일링 법칙의 핵심 아이디어는 모델 매개변수의 크기, 데이터 세트의 크기, 훈련에 사용되는 부동 소수점 계산량이 증가할수록 모델의 성능이 향상된다는 것입니다. . 최적의 성능을 위해서는 위의 세 가지 요소가 동시에 증폭되어야 합니다. 다른 두 요인에 의해 제한되지 않는 경우 모델 성능은 각 개별 요인과 거듭제곱 관계를 갖습니다.
인공지능 분야에서 특정 문제에 대한 GPT-4의 성능 예측은 GPT-4보다 1,000배 작은 모델로 예측할 수 있습니다. 즉, GPT-4는 아직 훈련을 시작하지 않았으며, 이 문제에 대한 성능은 이미 알려져 있습니다. 따라서 스케일링 법칙은 대규모 모델을 학습하는 데 중요합니다. 스케일링 법칙은 인공지능의 심층적 진화를 위한 또 다른 잠재적 법칙이라고 할 수 있다.
얼마 전 Bill Gates는 The Next Big Idea 팟캐스트 에피소드에서 확장의 법칙에 대한 심오한 견해를 표현했습니다. 단순한 알고리즘에서 좀 더 인간과 유사한 메타인지 행동으로의 전환이 필요합니다. 이는 더 큰 영역입니다. "왜냐하면 의식은 메타인지와 관련될 수 있고 메타인지는 측정 가능한 현상이 아니기 때문입니다." 즉, 메타인지는 확장의 법칙을 실패하게 만듭니다.
8. 단기 및 중기 추세
일반 AI 단계가 가속화되고, 슈퍼 AI의 '여명'이 나타났습니다.
2024년 시점에서 우리는 일반적으로 인공지능의 단기 및 중기 추세를 볼 수 있습니다.
(1) ANI(Artificial Narrow Intelligence) 단계가 끝나갑니다. 현 단계에서 인공지능은 이미지 인식이나 음성 인식 등 특정 작업을 수행할 수 있는 AI 시스템이다. 이 단계의 정점은 생성 인공지능과 지능형 기계의 대중화를 지원하는 대형 모델의 등장이다.
(2) 일반 인공지능의 단계가 가속화되고 있다.
(3) 인공초지능(ASI)의 '여명'이 다가오고 있다. 슈퍼인공지능은 '인간의 마음'을 뛰어넘어 모든 인류의 집단지성을 따라잡거나 빠르게 능가하는 능력을 갖고 있으며, 인간의 지능보다 더 강력한 인공지능 시스템이다.
인공지능은 이미 사람들의 상상력이 날마다 새로워지는 역사적 시대에 들어서 있습니다. 이 기간 동안 세계의 주체와 참조 체계는 지금까지 변화하고, 지식 체계는 재구성되며, 인간 지능과 인공 지능은 '공지능' 상태에 진입하기 시작하고, 전통적인 경제 조직, 국가 시스템 및 법률 시스템이 시작된다. 앞으로는 변화도 일어날 것이고, 인류 문명도 재편될 것입니다.
주 지아밍
2024년 7월 6일
(원본 서문의 제목과 부제목은 편집자가 보완하고 세밀하게 조정한 것임)
저자: 주자밍(朱 Jiaming)
글: Zhu Jiaming 사진: Zhu Meiquan 편집자: Li Nian 편집자: Li Nian
이 글을 퍼가실 때에는 출처를 꼭 밝혀주세요.