장난감과 도구부터 '동료', 'AI 아인슈타인'까지, 우리는 일반 인공지능과 얼마나 멀리 떨어져 있을까?

2024-07-16

오늘날 AGI(Artificial General Intelligence)는 과학계와 업계가 주목하는 키워드 중 하나가 되었습니다. 불과 몇 년 전만 해도 AGI가 실현되려면 적어도 10~50년이 걸릴 것이라고 믿는 사람들도 있었습니다. 그것은 결코 가능하지 않을 것입니다. 오늘날 후자는 거의 없습니다. 그러나 이러한 기술 변화의 물결에 대한 대중의 흥분에 비해 AI(인공지능) 분야의 많은 일선 학자와 업계 리더들은 현재의 AI가 AGI로 발전하기까지는 아직 갈 길이 멀다고 느끼고 있습니다.

치위안(Qi Yuan)은 복단대학교 하오칭(Hao Qing) 석좌교수, 상하이 과학지능연구소(이하 '상하이 연구소') 원장이자 신뢰받는 대형 모델 기업 '인피니트 라이트이어(Infinite Lightyear)'의 창립자인 치위안(Qi Yuan)이 보기에 일반 인공지능의 최고 발현" 복잡한 세계의 미지의 법칙을 발견하는 것이다. 한마디로 'AI 아인슈타인'이 되어야 한다. 이를 위해서는 빠른 사고의 '블랙박스' 확률 예측과 느린 사고의 조합이 필요하다. '화이트박스'라는 논리적 추론을 통해 신뢰할 수 있는 '그레이박스' 대형 모델을 만들고, 기술과 산업의 긴밀한 통합을 통해 과학적이고 지능적인 혁신 생태계를 조성하기 위한 기초 연구, 인재 양성, 성과 구현을 촉진합니다."

얼마 전 폐막한 2024년 세계인공지능회의(WAIC)와 인공지능 글로벌 거버넌스에 관한 고위급 회의에서 상하이공과대학은 '인공지능: 과학 연구 패러다임 변화와 산업 발전' 주제 포럼을 성공적으로 개최했습니다. .이 새로운 R&D 기관이 WAIC에 등장한 것도 이번이 처음입니다. Shangzhi Institute는 혁신 중심의 "1+1+N" 과학 지능 생태 모델을 탐구하는 상하이의 모델이라고 할 수 있습니다. 즉, Shangzhi Institute의 "1"은 책임 있는 생태계의 중심이자 허브 역할을 합니다. 전반적인 전략 계획, 자원 통합 및 핵심 기술의 R&D 및 혁신을 위해 또 다른 "1" 푸단 대학교와 많은 대학, 과학 연구 기관, 기술 기업, 혁신 팀 및 투자 기관의 "N"이 공동으로 추진합니다. 과학 연구, 인재 양성, 과학 기술 성과 변화, 산업 혁신 및 업그레이드.

AGI의 표준은 'AI 아인슈타인'을 만드는 것이어야 한다

기술적 관점에서 볼 때 점점 더 많은 매개변수를 가진 대형 모델이 일반 인공지능으로 이어질까요? 오늘날 AI 기술 자체의 관점에서 보든 에너지 소비의 관점에서 보든 Transformer 자동 회귀 아키텍처를 기반으로 한 대형 모델에는 여전히 이점이 있지만 일반 인공 지능으로 이어지기에는 충분하지 않습니다. 인공 지능을 위해서는 새로운 "회색 상자"의 신뢰할 수 있는 대형 모델 개발이 필요합니다. 이것은 Qi Yuan이 학계와 산업계에서 다년간 쌓아온 실무 경험을 요약한 것입니다.

10년 전, Qi Yuan은 "인공 지능을 유용하게 만든다"는 아이디어로 팀을 이끌고 Alibaba의 핵심 기계 학습 시스템을 처음으로 200만 개의 매개 변수에서 수억 개의 매개 변수로 늘려 대규모 비즈니스 효과를 달성했습니다. 데이터, 알고리즘 및 엔지니어링 기능의 통합 변환을 보여줍니다. 이것이 바로 오늘날 인공지능계에서 회자되는 스케일링의 법칙을 구현한 것입니다.

Qi Yuan은 당시 팀이 스케일링 법칙의 이점을 맛봤다고 회상했습니다. 모델 매개변수가 100배 증가한 후 전반적인 효과가 비약적으로 향상되었습니다. "그런데 지금 생각해보면 그때는 왜 AI 모델을 더 많이 하지 않았을까? 한 발 더 나아갔을 때 왜 여기서 멈춰버렸을까?" , 수백억, 수천억, 심지어는 수조를 향해 나아가기에는 충분하지 않았습니다. 당시에는 학계와 기관 모두 컴퓨팅 파워가 부족했고, 산업계에서도 이러한 높은 컴퓨팅 파워를 달성하려면 매우 높은 비용이 필요했습니다. 학계는 말할 것도 없고."

Qi Yuan은 AGI의 표준이 "AI 아인슈타인"을 만드는 것이어야 하는 이유는 효과적이고 똑똑하기 때문이라고 설명했습니다. 우선 아인슈타인은 여러 핵심 데이터 포인트를 통해 '20세기 초 물리학의 어두운 구름'을 보았다. AGI도 복잡한 세계를 이해하는 미지의 법칙을 발견할 수 있어야 한다. 그러나 현재의 대형 모델 중 어느 것도 이를 수행할 수 없습니다. 대형 시각적 모델인 SORA는 전례 없는 수준으로 물리적 세계를 시뮬레이션하지만 SORA는 여전히 2차원 세계의 시뮬레이션을 기반으로 3차원 세계를 구축하기에는 아직 멀었습니다. 물리적 세계에 대한 철저한 이해로부터. 두 번째는 전력 소비입니다. 인간 두뇌의 전력은 약 15와트이고, GPU의 최대 전력은 수백 와트입니다. 범용 대형 모델의 훈련을 지원하려면 킬로카드나 1만 개의 카드 클러스터가 필요하다는 것은 말할 것도 없습니다. . 현재로서는 기존 아키텍처를 계속 사용한다면 막대한 양의 전력 소비가 필요하므로 효율적이고 스마트하다는 목표를 달성하기 어렵습니다.

'AI 아인슈타인'은 AI for Science(참고: Scientific Intelligence, 이하 AI4S)의 핵심 목표이기도 합니다. 과학 지능은 이미 알려진 물리 방정식의 해를 가속화하는 데 중요한 역할을 하고 있지만, 과학 지능은 알려진 규칙과 데이터를 결합하고, 데이터와 컴퓨팅 능력에 대한 과도한 의존도를 줄이고, 추론과 예측의 정확성을 향상하고, 데이터 지식을 기반으로 조정해야 합니다. 새로운 과학 이론을 규정하고 제안합니다. 이는 또한 "인공지능을 사용하여 복잡한 세계를 이해하고 알려지지 않은 법칙을 발견하는 것"이라는 푸단대학교와 상하이 지적재산권 연구소에서 근무하려는 Qi Yuan의 장기적인 목표와도 일치합니다.

수천 개의 산업에 힘을 실어주는 신뢰할 수 있는 수직 필드 대형 모델인 "회색 상자"

대형 모델이 AI 도구를 통해 새로운 생산성을 구현할 때 긴급하게 해결해야 할 문제는 무엇입니까? Qiyuan의 관점에서 볼 때 대형 모델 산업은 많은 공통 과제에 직면해 있으며 이로 인해 기술, 제품 및 시장 수요를 맞추기가 어렵습니다.

"현재 대규모 모델 구현에 있어서 가장 큰 문제는 언뜻 보기에 유용해 보이지만 일단 사용하면 쓸모가 없다는 것입니다." Qi Yuan은 오늘날 대규모 언어 모델의 핵심은 단순히 다음과 같다고 설명했습니다. 다음 단어를 예측합니다. 다음 단어를 예측하는 단어이지만 이는 다단계 엄격한 추론에는 적합하지 않습니다. “언어는 사고를 위한 도구가 아니라 의사소통을 위한 도구입니다.” 최근 MIT(매사추세츠 공과대학) 등 기관이 최고 학술지 '네이처'에 게재한 논문에서는 언어가 사고를 전달하는 강력한 도구임을 지적했다. 이는 인간 인지의 복잡성을 반영하기 위해 함께 진화한 사고 및 추론 능력과 관련이 있을 수 있습니다. 그러나 언어는 추론의 복잡성을 생성하지 않습니다.

신뢰성이 낮고 해석성이 낮으며 비용이 높다는 대형 모델의 기존 특성을 고려할 때 진정으로 효과적인 솔루션은 노벨 경제학상 수상자인 다니엘 카드(Daniel Card)와 마찬가지로 확률적 신경망 추론과 논리적 기호 계산을 결합하는 것입니다. 니만(Niemann)의 저서 '빠르고 느리게 생각하기'에서 설명한 인간의 본능 기반의 빠른 사고와 논리적 추론 기반의 느린 사고는 '대형 '회색 상자' 모델이라고 할 수 있다'고 치위안은 믿고 있다. 기호 컴퓨팅과 신경망을 결합하면 인공 지능의 "환상"을 줄이고 수직 분야의 전문적인 문제를 해결할 수 있습니다. 이를 통해 수천 개의 산업에 힘을 실어주고 대형 모델의 생산성을 높일 수 있습니다.

"회색 상자"로 신뢰할 수 있는 대형 모델이란 무엇입니까? "딥러닝은 원래 '블랙박스'로 여겨졌는데, 이제는 논리적 추론의 '화이트박스'와 딥러닝을 결합해 '회색박스'가 됐다"고 치위안은 설명했다. '는 데이터가 결과를 생성하는 과정에 대해 사람들이 전혀 알지 못하도록 하고, '회색 상자' 대형 모델은 논리적 추론의 도움으로 사람들이 '무슨 일이 일어나고 있는지, 왜 일어나는지 알 수 있도록' 할 수 있도록 딥러닝을 사용하여 그렇지 않은 규칙을 줄일 수 있습니다. 실제 관측 데이터와 일치합니다."

Qi Yuan은 금융, 보험, 풍력 에너지, 해상 운송, 의료 및 제약 시나리오 등 다양한 산업의 복잡한 시나리오를 AI가 중심 역할을 하는 새로운 전장으로 만들려면 체계적인 산업 지식을 통합해야 한다고 말했습니다. 추론 논리와 의사결정 메커니즘이 대규모 모델과 결합됩니다. "회색 상자" 대형 모델은 일반 인공 지능의 일반적인 방향일 뿐만 아니라 대형 모델이 수직 필드에 깊이 침투하여 실제 문제를 실제로 해결할 수 있는 강력한 도구입니다. "산업적인 관점에서 보면 이러한 이해는 매우 직관적입니다." Qi Yuan은 예를 들었습니다. 의사는 변호사가 될 필요가 없고, 변호사는 투자 전문가가 될 필요가 없습니다. 현장에서 자체 생산성 도구를 만듭니다. 기술적으로 말하면, 대규모 모델이 관련 없는 작업에 대해 과도하게 학습되면 "치명적인 망각"이 발생할 수 있습니다. 이백이 하루 종일 회계사로 일하면서 시를 쓰지 않는 것처럼, 그의 시적 영감은 점차 희미해질 수도 있습니다. "우리는 수직 필드에서 대형 모델을 훈련할 때 모델이 관련 없는 기능을 너무 많이 학습하도록 허용하면 원래 기능을 방해한다는 것을 관찰했습니다. 따라서 수직 필드에서 '회색 상자' 대형 모델을 만드는 것이 필요합니다. .산업적 구현에 큰 가치가 있다고 생각합니다."

"베이지안 방법론에서는 알려진 지식과 숨겨진 데이터를 결합하는 것이기 때문에 '그레이박스' 대형 모델은 AGI 및 수직 산업 구현으로 가는 길에서 점점 더 중요한 역할을 할 것이라고 생각합니다. 새로운 법칙을 발견하고 과학 및 산업 문제를 해결하기 위해 "Qi Yuan은 미래에는 "AI 아인슈타인"이 "AI 버핏"이 될 수도 있다고 솔직하게 말했습니다.

혁신 사슬을 개방하고 과학적이고 지능적인 혁신 생태계를 구축하십시오.

2024년 세계 인공지능 회의에서 Qi Yuan이 이끄는 팀은 수백억 개의 매개변수를 갖춘 대규모의 신뢰할 수 있는 가벼운 언어 금융 및 의료 모델을 출시했습니다. 이 두 가지 수직 분야의 대형 모델 테스트는 OPEN AI의 1조 매개변수 대형 모델 GPT4-Turbo를 넘어섰으며, 다시 한번 대형 모델 구현에 대한 업계의 관심을 불러일으켰습니다.

"오늘날의 인공지능 혁신은 기본 원칙의 혁신뿐만 아니라 사회적 요구에 맞춘 제품에 의해 주도됩니다. 사회에 필요한 것은 이론적인 논문의 출판이나 비즈니스 모델의 혁신뿐만 아니라 기술의 심층적인 통합입니다. 하나됨의 원칙에 기초한 혁신과 산업 혁신, 이 둘이 결합되면 우리는 물이 더 푸른 곳으로 헤엄칠 수 있다”고 치 위안은 말했다.

학계와 산업계는 서로 다른 임무를 가지고 있으며, 학계는 새로운 것을 탐구해야 하고, 산업계는 먼저 실질적인 문제를 해결해야 합니다. 현재 국내외 공통적인 문제가 있습니다. 연구 기관은 많은 기술 혁신 문제를 연구해야 하지만, 제품화와 사회적 요구를 무시하면 두 가지 단점이 있습니다. 경쟁; 효과적인 시장 정보 피드백은 기술 연구 및 개발의 방향을 결정합니다.

이를 위해 Qiyuan은 '대학-연구소-스타트업'의 혁신 체인을 개방하고 좋은 혁신 생태계를 조성하기를 기대하고 있습니다. 그는 기본 기술에 대해 생각할 뿐만 아니라 시장 수요도 파악합니다. 시장 수요와 시나리오를 활용해 제품 방향을 주도하고, 상향식 혁신을 통해 제품 핵심 경쟁력을 구축하세요.

2023년에 설립된 Shangzhiyuan은 지식과 데이터를 결합하는 AI for Science의 독창적인 혁신에 전념하고 있습니다. 최근 Shangzhi Institute는 신에너지, 보험, 도시 관리 등 산업 응용을 위한 대규모 기상 모델 2.0 Fuxi 시리즈를 출시했으며, 지능형 기상 혁신 생태 연합(Intelligent Meteorological Innovation Ecological Alliance) 발족에 앞장섰고, 여러 단위를 통합하여 점진적으로 산업화를 촉진했습니다. Fuxi 시리즈의 대규모 기상 모델 2.0 응용 프로그램입니다. 신뢰받는 대형 모델 '그레이박스'의 제품 출시도 진행 중이다.

과학 및 지능 혁신 생태계를 더욱 번영시키기 위해 두 번째 회의는 상하이 지능 아카데미와 푸단 대학교가 공동 후원하고 상하이 시 과학 기술위원회, 상하이 시 개발 개혁위원회, 상하이 시 경제 정보가 공동으로 주도했습니다. 위원회, 상하이시 교육위원회 및 기타 부서에서 세계 과학 및 정보 대회가 시작되었습니다. 이 대회는 과학 지능의 최전선 분야를 공동으로 탐구할 전 세계 플레이어를 모집하기 위해 백만 달러의 상금을 설정합니다. 동시에 Shangzhi Institute는 다중 모드 과학 데이터를 다루는 과학 데이터 플랫폼 개발을 주도했습니다. 이 플랫폼은 데이터 수집 및 처리에서 관리 및 모델링에 이르기까지 전체 링크 기능을 갖추고 있어 데이터의 효율적인 처리, 신뢰성 및 안전한 상호 운용성을 보장합니다. . 이 플랫폼을 기반으로 SPIC와 파트너는 생명 과학, 물리 과학, 대기 과학 분야에 대한 여러 고품질 과학 데이터 세트를 구축하여 과학 지능 연구에 귀중한 리소스를 제공했습니다. 또한 Shangzhi Institute는 Global Scientific Data Ecological Alliance를 시작하는 데 앞장섰습니다. 첫 번째 동맹 회원 단위에는 China Telecom Co., Ltd., COSCO Shipping Property Insurance Captive Co., Ltd., Shanghai를 포함한 10개 이상의 단위가 포함됩니다. 임강신구 크로스보더데이터기술유한회사. 이번 동맹은 정부, 기업, 대학, 연구기관 및 기타 당사자와의 협력을 통해 글로벌, 다분야 과학 연구 빅데이터 자원 개방 및 공유 플랫폼을 구축할 예정이다.

"과학 연구와 산업 모두 '새로움을 위한 새로운 것'이 되어서는 안 됩니다. 우리는 실제 문제를 해결하기 위한 미래의 일반 인공 지능과 응용 프로그램을 구축할 수 있기를 바랍니다."

작가:

사진: 사진 제공: Shanghai Intelligence Research Institute 편집자: Wu Jinjiao 편집장: Jiang Peng

이 글을 퍼가실 때에는 출처를 꼭 밝혀주세요.

소식

장난감과 도구부터 '동료', 'AI 아인슈타인'까지, 우리는 일반 인공지능과 얼마나 멀리 떨어져 있을까?

소개

내 연락처 정보