2024-09-27
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
이 글의 내용은"agix에 무엇을 투자할 것인가"~의 6 조항.전 세계 수천 개의 기술 상장 기업 중에서 선정된 40개의 "높은 ai 순도" 기업의 조합입니다. agix 지수는 agi 프로세스를 포지셔닝하기 위한 좌표이며, 투자자가 ai-알파를 포착할 수 있는 귀중한 도구를 제공합니다. 'agix에 투자할 대상' 섹션에서는 agix 지수의 포트폴리오 기업을 심층 분석하고 시장에 대한 종합적인 ai 투자 레퍼런스를 제공할 예정이다.
테슬라 agix index 포트폴리오의 상위 10개 지주 회사 중 하나입니다. 지난 10년 동안 회사가 자율 주행 및 로봇에 대규모 투자를 함으로써 물리적 세계에서 가장 강력한 agi 플레이어가 될 수 있는 기회를 얻었습니다.최근 테슬라는 2024년 주가 상승의 2차 파도를 맞이해 지난 2개월 만에 최고치를 기록했을 뿐만 아니라 올해 하락세를 모두 지우고 상승세로 전환하는 것이 이번 성장을 이끄는 가장 중요한 요인이다. .
ark의 분석에 따르면 tesla는 10월 10일에 robotaxi를 공식 출시할 예정입니다. 2029년에는 테슬라 기업가치와 수익의 거의 90%가 자율주행택시 사업에 귀속될 것으로 예상된다.이번 주 tesla는 신차 판매를 촉진하기 위해 fsd 옵션 가격도 인하했습니다. 동시에 fsd 옵션 요금의 인상은 tesla가 fsd 성능을 개선하기 위해 더 많은 데이터를 수집하는 데도 도움이 될 것입니다. 옵티머스 로봇이 아직 대규모 상용화와는 거리가 멀지만, 옵티머스를 테슬라 공장 근로자를 대체하고 인간의 효율성을 향상시키는 데 활용한다면 ark의 테슬라 모델링을 참고하면 옵티머스가 테슬라 공장에 구현된다면 수익은 크게 향상될 수 있다. 향후 5년 배포를 통해 최대 30억~40억 달러의 비용을 절감할 수 있습니다.
01.
자율주행은 agi와 매우 유사하다
사라 구오:오늘날 자율주행의 발전에 대해 어떻게 생각하시나요? 자율주행이 보편화되려면 얼마나 걸릴까요?
안드레이 카르파티: 저는 자율주행 분야에서 5년 동안 일해왔는데 이 분야가 매우 흥미롭다고 생각합니다. 현재 이 분야의 발전을 보면 자율주행과 agi는 매우 유사하다고 볼 수도 있지만, 자율주행 분야에서는 agi에 가깝다고 느껴집니다. 예를 들어, 이미 사용자가 유료로 사용할 수 있는 formed 제품이 있는데, waymo가 좋은 예입니다. waymo는 이제 샌프란시스코에서 매우 흔해졌고, 저도 waymo를 자주 경험했고 상용 제품이 되었습니다.
waymo를 처음 접한 것은 거의 10년 전이었습니다. 그 당시 친구가 waymo에서 일했고 기술적인 관점에서 볼 때 waymo를 타고 한 블록 전체를 돌아다녔습니다. 벌써부터 너무 좋아하지만 데모부터 도시에 대규모로 배포되는 제품이 되기까지의 과정은 10년이 걸렸습니다. 물론 waymo는 오늘날에도 여전히 확장되고 있습니다.
엘라드 길:데모부터 유료제품까지 10년이 걸렸는데, 어느 정도 규제 때문일까요? 자율주행 기술은 언제쯤 완성될 것이라고 생각하시나요?
안드레이 카르파티:실제로 자율주행은 10년 전에 상당히 성숙한 수준에 도달했다고 생각하지만, 30분의 데모로는 지난 10년 동안 직면했던 모든 과제를 완전히 보여줄 수 없습니다. 데모와 실제 제품 사이에는 큰 격차가 있습니다. 물론, 몇 가지 규제적인 이유가 있을 것입니다.
하지만 자율주행 분야에서는 어느 정도 agi에 도달했다고 생각합니다. 동시에 데모하는 것과 글로벌하게 홍보되는 것 사이에는 큰 격차가 있습니다.waymo는 이미 샌프란시스코에서 운영되고 있지만 글로벌 시장에서의 대중화 관점에서 볼 때 아직은 그다지 큰 영향과 성과를 거두지 못하고 있습니다. 여기서 agi와 자율주행은 비슷하다고 생각합니다.
자율주행 분야로 돌아가서,많은 사람들이 waymo가 tesla보다 기술적으로 앞서 있다고 생각하지만, 저는 개인적으로 tesla가 실제로는 waymo보다 더 앞서 있다고 생각합니다. 이러한 견해는 현재 주류의 목소리와 같지 않을 수도 있지만 저는 tesla의 자율주행에 확신을 갖고 있습니다.
tesla는 소프트웨어 수준의 문제에 직면해 있는 반면 waymo의 문제는 하드웨어에서 비롯됩니다. 이에 비해 소프트웨어 문제는 해결하기가 더 쉽습니다. tesla는 전 세계적으로 대규모로 차량을 배치했지만 waymo는 아직 그 규모에 도달하지 못했습니다. 따라서 tesla의 시스템이 대규모로 구현되고 효율적으로 실행될 수 있다면 그 결과는 놀라울 것이라고 믿습니다. 어제 fsd 최신버전을 시승해 보았는데 운전감이 매우 매끄러웠습니다. 테슬라 자율주행 시스템의 일련의 작동을 보면 테슬라가 오늘날 자율주행 분야에서 상당히 좋은 성과를 거뒀다는 느낌이 든다.
전반적으로 tesla의 자율주행의 가장 큰 과제는 소프트웨어 관점인 반면, waymo의 과제는 하드웨어에서 더 많이 나온다고 생각합니다. 지금의 관점에서 보면 waymo가 강력한 위치에 있는 것처럼 보이지만, 10년을 두고 본다면 규모나 수익 모델 측면에서 tesla가 더 앞서 있을 것이라고 믿습니다.
엘라드 길:소프트웨어 문제를 해결하는 데 시간이 얼마나 걸릴 것이라고 생각하십니까? 방금 waymo의 차량에는 고가의 lidar와 센서가 많이 탑재되어 있다고 말씀하셨습니다. 이러한 하드웨어는 tesla처럼 카메라 시스템에만 의존한다면 비용을 크게 줄일 수 있을 뿐만 아니라 복잡성도 줄일 수 있습니다. 시스템이며 더 많은 모델에 적용 가능합니다. 이 변화는 언제 실현될 것 같나요?
안드레이 카르파티: 개인적으로 앞으로 몇 년 안에 이 문제가 해결되기를 바랍니다. 실제로 테슬라도 훈련 단계에서 고가의 센서를 많이 사용했고, 무선 등 대규모로 홍보할 수 없는 기술도 많이 만들었다.라인센서 신뢰모델 연구 및 지도 매핑 등테스트 단계에서 tesla는 이 데이터를 비전 시스템에만 의존하는 테스트 패키지로 간소화하고 이를 생산 차량에 배포했습니다. 많은 사람들은 이것이 실제로 센서와 비용 사이의 매우 현명한 "차익거래"라는 것을 깨닫지 못할 수도 있습니다. 카메라는 충분한 정보를 포착할 수 있기 때문에 신경망도 이 정보를 처리할 수 있습니다. 훈련 단계에서는 이러한 센서가 매우 유용하지만 테스트 단계에서는 그 역할이 그다지 중요하지 않습니다. 그래서 카메라에 의지하는 것만으로도 충분하다고 생각해요.
엘라드 길: 최근 자율주행 분야의 트렌드는 edge case를 기반으로 설계된 휴리스틱 알고리즘에서 end-to-end 딥러닝으로 점진적으로 전환되고 있는 것입니다. 그 이유와 논리는 무엇입니까?
안드레이 카르파티: end-to-end는 사실 우리가 처음부터 하고 싶었던 일입니다. 제가 처음 tesla에 합류했을 때 우리는 신경망이 결국 전체 기술 스택을 대체할 것이라고 논의했습니다. 그 당시 시스템에는 많은 c++ 코드가 있었지만 현재 테스트 스위트에서 실행되는 c++ 코드는 거의 없습니다. 처음에는 신경망이 이미지 인식 처리에만 사용되었지만 나중에는 여러 프레임의 이미지를 처리하고 예측 결과를 생성하도록 확장되었으며 c++ 코드가 점차 대체되었습니다. 궁극적으로 시스템은 운전 지침만 제공하면 신경망이 결과를 출력할 수 있습니다.
그래서 tesla가 하고 있는 일은 end-to-end ai 주행이지만 waymo는 아마도 이 기술적 경로를 선택하지 않았을 것입니다. 노력했지만 결과는 만족스럽지 않습니다.
저는 개인적으로 종단 간 경로가 정확하고 향후 발전을 위한 불가피한 방향이라고 믿습니다.이런 관점에서 보면 10년 안에 테슬라 시스템은 비디오 스트림이 입력되고 운전 지침이 직접 출력되는 엔드투엔드 신경망으로 발전할 가능성이 높다. 물론, 이 과정에는 시스템의 각 모듈이 점진적으로 개선되어야 합니다. 나는 현재의 모든 중간 예측이 개발 과정에서 오해의 소지가 있다고 생각하지 않습니다. 오히려 시스템의 중요한 부분입니다. 완전히 엔드투엔드 신경망을 훈련할 때 인간 운전을 시뮬레이션하기 위한 감독 신호는 매우 제한적이며 이러한 대규모 네트워크의 훈련을 지원할 수 없기 때문입니다. 중간 예측은 특징과 탐지기를 개발하는 데 도움이 되어 엔드투엔드 문제를 더욱 실현 가능하게 만듭니다. 그래서 제 생각엔 앞으로 엔드 투 엔드 미세 조정이 가능하도록 사전 훈련을 많이 하고 있는 것 같아요.
전반적으로 신경망이 전체 기술 스택을 대체하는 과정이 필요하다고 생각하지만 그 과정은 점진적이어야 합니다. 현재 테슬라의 시도는 초기의 성과를 보여주며 미래에 대한 기대감을 가득 안고 있다.
💡
중간 예측:모델 학습 또는 추론 중에 생성된 최종이 아닌 결과 또는 출력입니다. 이러한 예측은 다단계 계산 프로세스의 중간 단계 역할을 하여 모델이 점차 최종 결과에 접근하도록 돕습니다. 이는 계층적 의사 결정, 기계 번역, 다중 작업 학습과 같은 복잡한 작업에 유용하며, 이러한 중간 결과를 평가하여 모델 성능을 최적화하거나 편향을 수정하거나 모델 교육을 개선할 수 있습니다. 또한 중간 예측은 모델의 내부 작동을 설명하는 데 도움이 되며 모델 조정에 대한 참조를 제공할 수 있습니다.
02.
테슬라는 로봇 회사이기도 하다.
사라 구오: 테슬라를 떠나기 전, 테슬라의 휴머노이드 로봇 프로젝트에도 참여하셨는데요. 자율주행부터 로봇까지 어떤 기술이 이전될 수 있을까?
안드레이 카르파티: 기본적으로 모든 기술을 마이그레이션할 수 있습니다. 하지만 사람들은 아직 이를 깨닫지 못할 수도 있다고 생각합니다.로봇과 자동차 사이에는 큰 차이가 없습니다. 단순히 테슬라를 자동차 회사로 이해하는 것은 사실은 오해라고 생각합니다.
tesla는 실제로 자동차를 생산할뿐만 아니라 자동화 기계도 제조하는 대규모 로봇 회사입니다. 대량생산은 아주 다른 분야인데, 테슬라는 대규모 로봇공학을 전문으로 하는 회사라고 생각합니다.
자동차 기술에서 휴머노이드 로봇 공학으로 마이그레이션하는 데 실제로는 추가 작업이 많이 필요하지 않습니다. 실제로 초기 옵티머스 로봇은 자동차와 똑같은 컴퓨터와 카메라를 사용했기 때문에 자동차인줄 착각하기도 했습니다. 흥미롭게도 우리는 로봇에서 자동차용으로 설계된 신경망을 실행하고 있었는데, 로봇이 사무실을 돌아다닐 때 식별한 '운전 공간'이 실제로는 '걸을 수 있는 공간'이 되었습니다. 약간의 미세 조정이 필요하지만 이는 기술의 다양성을 보여줍니다.
사라 구오: 어떤 관점에서 볼 때 tesla는 실제로 로봇 회사로 간주될 수 있으며 많은 핵심 기술이 플랫폼 간에 마이그레이션될 수 있습니다. 생산 로봇에 부족한 핵심 부분은 실제로 실행 메커니즘과 관련 동작 데이터입니다.
안드레이 카르파티: 예, 일부 장소는 아직 완벽하지 않지만 많은 기술을 직접 마이그레이션할 수 있다는 점을 강조하고 싶습니다. 예를 들어 optimus 프로젝트는 매우 빠르게 시작되었습니다. elon musk가 프로젝트를 발표한 후 관련 팀과 도구가 빠르게 배치되었습니다. cad 모델, 공급망 등과 같은 리소스가 신속하게 준비되었습니다. 당시 저는 tesla가 실제로 내부적으로 이미 상당한 양의 로봇 제조 자원을 보유하고 있다고 느꼈습니다. 이는 모두 tesla 자동차에서 가져온 것입니다. 이 느낌은 '트랜스포머'에서 보여지는 것과 다소 유사하다. 자동차가 로봇으로 변신한 후 모든 것이 동일하지만 일부는 약간 조정되고 재구성되어야 한다. 하드웨어 외에도 전체 사고 방식, 주석 팀, 다양한 구성 요소 섹션 간의 조정 등이 변경됩니다. 그러나 일반적으로 일부 경험과 자원은 이전될 수 있습니다.
엘라드 길:휴머노이드 로봇의 첫 번째 적용 시나리오는 무엇이라고 생각하시나요?
안드레이 카르파티: 많은 사람들은 로봇이 빨래와 같은 일상적인 작업을 도와줄 수 있다고 생각할 것입니다. 하지만 이러한 기술이 실제로 구현되기까지는 오랜 시간이 걸릴 수 있다고 생각합니다. 소비자 직판 방식은 휴머노이드 로봇의 좋은 출발점이 아니라고 생각한다. 노인 등 사람과 상호작용할 때 로봇을 넘어뜨리는 등의 사고를 피하는 등 로봇의 안전성을 아직 완전히 확보할 수 없기 때문이다. 아줌마", 이런 상황은 법적 리스크가 엄청나기 때문에 이 방향은 적합하지 않다고 생각합니다. 많은 간단한 상호작용 시나리오에서도 로봇은 사람들을 직접 넘어뜨릴 가능성이 높습니다.
그러나 오늘날의 기술은 충분히 성숙되지 않았으며 추가 개선이 필요합니다. 따라서 로봇 개발자에게 1단계 최고의 고객은 로봇 그 자체라고 생각합니다. 로봇 개발자가 이를 실현할 수 있다면 먼저 이러한 기술을 내부적으로 활용하여 인큐베이팅하고 공장에 적용할 수 있습니다. 자재취급(material handling) 및 기타 분야 등 제3자와 계약을 체결할 필요가 없어 변호사 및 계약 등의 번거로운 절차를 생략할 수 있습니다.
내부 인큐베이션과 성공 후에는 b 시장에 진출하고 대규모 창고 사업을 하는 일부 회사와 협력하여 자재 취급 등의 업무를 수행할 수 있습니다. 이러한 협력을 통해 로봇 회사는 시장 보안 시스템을 구축할 수 있으며, 여러 회사가 성공적으로 구현한 후 점진적으로 소비자 지향 애플리케이션으로 전환할 수 있습니다. 앞으로는 소비자를 위한 로봇이 많이 개발될 것이라고 믿습니다. 예를 들어, unitree가 개발한 제품은 저도 unitree g1을 구매하고 싶습니다.
로봇이 다양한 시나리오에서 대중화되면 완전한 생태계가 형성될 것입니다. 즉, 모두가 로봇 플랫폼을 기반으로 다양한 유형의 로봇을 개발하게 될 것입니다. 하지만 규모의 관점에서는 점진적인 발전의 길이 가장 합리적이라고 생각합니다.
일부 자재 취급(자재 취급) 관련 작업을 처리하는 것으로 시작하여 점차 틈새 시장과 수요가 높은 영역으로 확장될 수 있습니다. 개인적으로 특히 관심이 가는 아이템 중 하나가 바로 '나뭇잎 송풍기'입니다. 예를 들어, 어느 날 우리는 optimus 로봇이 거리를 걷고 모든 낙엽을 부드럽게 줍는 것을 볼 수 있으므로 더 이상 나뭇잎 송풍기를 사용할 필요가 없습니다. 저는 이것이 훌륭한 프로젝트라고 생각하며 이것이 초기 적용 시나리오가 되기를 바랍니다.
사라 구오: 로봇 형태 측면에서 일부 사람들은 휴머노이드 로봇이 더 나은 선택이 될 것이라고 생각합니다. 오늘날 실제 세계의 많은 디자인은 인간의 행동 습관을 기반으로 하기 때문에 휴머노이드 로봇을 기반으로 한 통합 하드웨어 형태 개발 모델은 점점 더 많은 작업을 완료할 수 있기 때문입니다. 또 다른 견해는 휴머노이드 로봇이 반드시 유니버설 로봇에 대한 유일한 해답은 아니라는 것입니다. 이 문제에 대해 어떻게 생각하시나요?
안드레이 카르파티: 많은 사람들이 실제로 다양한 로봇 플랫폼의 고정 비용의 복잡성을 과소평가한다고 생각합니다. 각 로봇 플랫폼에는 높은 고정 비용이 필요하므로 통합된 플랫폼을 기반으로 다양한 작업을 수행하는 것이 더 합리적입니다. 시도.
그래서 휴머노이드 로봇은 실제로 큰 잠재력을 가지고 있고, 인간은 이를 원격으로 쉽게 제어하여 데이터 수집을 도울 수 있다고 생각합니다. 동시에, 방금 말씀하신 관점 중 하나처럼, 전 세계가 인간의 행동과 습관을 중심으로 돌아가고 있다는 점도 휴머노이드 로봇이 중요한 또 다른 이유입니다.
물론 앞으로 휴머노이드 로봇에는 다양한 변화가 있을 수 있지만, 새로운 로봇 플랫폼이라면 고정비용도 고려해야 할 중요한 문제이다.
또한 서로 다른 업무를 수행하면서 정보를 공유하고 서로 학습함으로써 더 많은 것을 얻을 수 있다는 점을 강조하고 싶습니다.
ai 분야에서는 여러 작업을 처리하고, 여러 작업을 통해 서로 학습할 수 있는 신경망을 구축해 전반적인 지능 수준을 향상시키고자 합니다. 언어 모델의 흥미로운 점은 언어 모델이 텍스트 처리를 위한 다중 작업 모델 역할을 하며 다양한 유형의 문제를 처리하는 동시에 이러한 작업 간에 정보를 공유할 수 있다는 것입니다. 하지만 이 모든 작업은 실제로 단일 신경망을 통해 수행됩니다.
마찬가지로 나뭇잎 따기 작업 중에 수집된 데이터가 다른 작업을 완료하는 데 도움이 되기를 바라지만, 특정 작업을 위해 특별히 시스템을 개발할 경우 수익 마진이 좁아질 수 있습니다.
사라 구오: 유니트리 g1 같은 로봇의 가격은 현재 30만 달러 안팎이다. 현재 휴머노이드 로봇 분야는 저비용을 달성한 것으로 보인다., 고기능 플랫균형을 잡는 것은 어렵지만, 바퀴 달린 구조를 채택하고 로봇 팔을 추가하여 특정 작업을 완료한다면 보다 비용 효율적인 범용 로봇을 실현할 가능성이 더 높아지지 않을까요?
유니트리 g1 로봇
안드레이 카르파티:하드웨어 관점에서는 더 저렴한 범용 플랫폼을 찾는 것이 합리적입니다. 어떤 상황에서는 발 대신 바퀴나 기타 구조물을 사용하여 작업을 완료하는 것이 더 효율적인 선택일 수도 있지만, 이는 로컬 최적 솔루션을 추구하는 것일 수도 있다고 생각합니다. 장기적으로는 하나의 형태를 선택하여 완벽하게 다듬는 것이 아마도 더 현명할 것이라고 생각합니다. 그리고 인간의 심리적 관점에서 볼 때, 휴머노이드 로봇의 장점은 더욱 분명해질 것이며, 친숙함을 느끼고 상호 작용하고 싶게 만들 것입니다.
물론, 불쾌한 계곡 효과를 고려하면 아마도 추상적인 형태가 사용자들에게 더 인기가 있을 것입니다. 실제로 사람들이 다양한 형태의 로봇에 어떻게 반응할지 확신할 수 없기 때문에 작업을 완료하기 위해 바퀴가 8개 달린 괴물로 끝난다면 사람들이 그것을 좋아하거나 더 무서워할지 확신할 수 없습니다.
엘라드 길: 기계견도 형태 루트이고, 개 역시 인간에게 더 친숙한 형태이다.
안드레이 카르파티:네, 하지만 '블랙 미러'를 본 많은 사람들은 기계개와 특정 공포 장면을 결합할 수 있기 때문에 모든 사람의 심리적 수용이 다를 것입니다. 이에 비해 인간형 형태는 사람들이 수용하기 더 쉬울 수도 있고 이해하기도 더 쉬울 수도 있습니다. 그 기능과 행동.
엘라드 길:인간형 형태를 달성하려면 기술적 관점에서 어떤 주요 발전이 이루어져야 합니까?
안드레이 카르파티: 아직 이 질문에 대한 명확한 답은 없다고 생각합니다. 여기서 더 흥미로운 논의 중 하나는 휴머노이드 로봇 설계에서 하체가 모방 학습에 적합하지 않다는 것입니다. 이 부분은 상체(상체)의 경우 원격 제어에 더 많이 의존합니다. , 데이터 수집 및 엔드 투 엔드 학습. 어떤 의미에서 로봇 시스템은 여러 기술을 결합해야 하지만 아직 이러한 시스템이 서로 어떻게 작동하는지 잘 모르겠습니다.
💡
거꾸로 된 진자:진자를 불안정한 직립 위치로 유지하는 것은 로봇 공학, 항공 우주 및 기타 분야의 광범위한 응용 분야에서 발생하는 고전적인 제어 문제입니다. 전통적인 역진자 제어 방법에는 pid 제어, lqr(선형 2차 조정기), 슬라이딩 모드 제어 등이 포함됩니다.
ai의 발달과 함께 역진자 제어에 강화학습 방법이 점차 도입되고 있으며, rl 경로에서는 정확한 모델 없이도 최적의 전략을 학습할 수 있다는 점에서 많은 주목을 받고 있다. 강화학습을 기반으로 한 역진자 균형 제어 알고리즘은 매우 실용적인 기술로 로봇공학, 자동화 등 다양한 분야에서 널리 사용되고 있습니다.
엘라드 길: 로봇 공학 분야의 몇몇 사람들과 대화를 나누면서 나는 그들이 동력 구동, 제어, 디지털 조작과 같은 문제에 대해 매우 우려하고 있다는 것을 발견했습니다.
안드레이 카르파티: 예, 초기 단계에는 시스템이 95%의 시간을 자율적으로 실행할 수 있을 때까지 로봇이 인간이 땅에서 물건을 집는 것을 모방하도록 하는 등 실제로 많은 원격 제어 시나리오가 있을 것이라고 생각합니다. 그런 다음 점차적으로 로봇 작업의 비율을 늘려 인간이 작업자에서 감독자로 바뀔 수 있도록 합니다.
사실, 기본적인 작업이 많이 이루어져야 한다는 것 이상으로 특별한 기술적인 장애물은 없다고 생각합니다.우리는 이미 transformer 아키텍처와 같은 적절한 도구와 리소스를 보유하고 있습니다. 이러한 기술은 올바른 데이터를 준비하고 훈련하고 실험한 후 최종적으로 배포하기만 하면 됩니다. 과정은 복잡하지만 실제로는 필수적인 기술적 병목 현상이 많지 않습니다.
03.
합성 데이터, 소규모 모델, llm 회사
사라 구오: large blob 연구 측면에서 우리가 어디에 있다고 생각하시나요?
💡
대형 얼룩 연구 :일반적으로 딥러닝과 컴퓨터 비전 분야의 연구 방향이나 기술을 말합니다. blob은 "바이너리 대형"입니다. 물체"binary large object"를 의미하는 은 중요한 시각적 정보를 포함하거나 특정 개체 또는 장면 부분을 나타낼 수 있는 이미지 또는 특징 맵의 큰 연속 영역입니다. 이러한 큰 영역을 연구하면 모델을 이해하고 개선하는 능력을 향상시킬 수 있습니다. 대규모 시각적 특징을 처리합니다.
안드레이 카르파티: 지금은 급속한 발전 단계에 있다고 생각합니다. transformer는 단순한 신경망이 아니라 강력하고 다재다능한 신경망입니다.
예를 들어, 모든 사람이 스케일링 법칙에 대해 논의할 때 종종 transformer 아키텍처의 특성을 언급합니다. transformer 이전에는 주로 stacked lstm을 사용하여 작업을 수행했지만 명확한 확장 법칙은 발견되지 않았습니다. transformer는 이를 명확하게 하고 효과적으로 확장할 수 있는 최초의 모델입니다.
💡
stacked lstm은 여러 개의 lstm(long short-term memory) 레이어를 쌓아서 형성된 심층 신경망 구조를 말합니다.
transformer는 일반 컴퓨터, 더 구체적으로는 dnc(미분 신경 컴퓨터)와 같습니다. 우리는 매우 큰 규모의 입력 및 출력을 수행하고 역전파 방법을 통해 이 컴퓨터를 훈련시킬 수 있습니다.결국에는 스스로 진화하는 임무 완수 시스템이 될 것입니다.
💡
미분 가능한 신경 컴퓨터(dnc):컴퓨터의 메모리 시스템과 유사하게 정보를 저장하고 검색할 수 있는 특수한 유형의 신경망입니다. 이는 "미분 가능"합니다. 즉, 역전파를 통해 매개변수를 최적화하여 복잡한 작업을 더 잘 해결할 수 있다는 의미입니다.
transformer는 우리가 알고리즘 분야에서 우연히 발견한 기적이지만, 그 뒤에는 실제로 잔여 연결, 레이어 정규화, attention 블록 등 많은 핵심 혁신이 있습니다. 기존 방법과 달리 transformer는 경사도가 사라지는 비선형 활성화 기능을 사용하지 않고 기술 문서에서 언급한 혁신적인 기술을 통합하여 훈련 효율성과 성능을 크게 향상시킵니다.
사라 구오:이 기간 동안 데이터 월에 대한 논의가 있었고, 차세대 모델을 확장하는 데 드는 비용은 매우 높을 것입니다. 데이터 문제에 대해 어떻게 생각하시나요?
안드레이 카르파티: 이것이 우리가 처음부터 논의한 내용입니다. 오늘날에는 신경망 아키텍처 자체가 더 이상 병목 현상이 되지 않는다고 생각합니다. transformer가 탄생하기 전에는 아키텍처 문제가 실제로 장애물이었지만 이제는 새로운 병목 현상이 주로 손실 기능과 데이터 세트에 집중되어 있습니다.따라서 많은 기업과 연구자들은 더 이상 transformer 아키텍처의 변화에 초점을 맞추지 않습니다. 예를 들어 llama에는 특별히 뚜렷한 아키텍처 혁신이 없습니다. 유일한 큰 변화는 "회전 위치 인코딩"(rope 위치 인코딩)일 수 있습니다.transformer 자체는 지난 5년 동안 크게 변하지 않았습니다. 다들 기존 기반을 기반으로 학습, 데이터 세트 및 손실 기능의 혁신에 집중하고 있습니다.
💡
"로터리 위치 인코딩"(rope, 로터리 위치 인코딩):변환기 모델을 위한 위치 인코딩 기술. rope는 벡터를 회전시켜 입력 시퀀스의 위치 정보를 표현합니다. 기존 위치 인코딩과 비교하여 rope는 긴 시퀀스를 처리할 때 모델에 더 많은 이점을 제공할 수 있습니다. 주요 특징은 상대적인 거리 정보를 유지하면서 벡터의 각도를 회전시켜 시퀀스의 각 요소의 위치를 인코딩하는 것입니다. 이 접근 방식을 사용하면 모델이 다양한 위치에서 더 나은 유연성과 확장성을 가질 수 있으며 특히 장거리 종속성을 처리하는 작업에 적합합니다.
사라 구오:인터넷에 데이터가 충분하지 않으면 합성 데이터를 사용하거나 더 비싼 데이터 수집 방법을 사용할 것입니까?
안드레이 카르파티: 현재 많은 연구가 언어 모델에 초점을 맞추고 있습니다. 인터넷 데이터는 transformer에 가장 이상적인 데이터 소스는 아니지만 모델 기능을 지속적으로 개선하는 도구로 사용할 수 있습니다. 인터넷 데이터는 단지 웹페이지의 집합일 뿐이지만, 정말 귀중한 것은 우리 두뇌 속에 있는 것입니다.내면의 독백”——그 복잡하고 깊은 생각의 궤적.
"생각의 트랙"과 유사한 수십억 개의 데이터를 가질 수 있다면 어느 정도 agi에 가까워질 수 있습니다. 그러나 현재 이러한 데이터가 존재하지 않기 때문에 현재 연구는 주로 기존 데이터 세트를 '내면 독백(inner monologue)'과 유사한 형식으로 재구성하는 데 중점을 두고 있습니다. 이것이 바로 합성 데이터의 중요성입니다. 오늘날의 모델은 차세대 모델을 생성하는 데 도움이 될 수 있습니다. 이는 마치 사다리를 오르는 것처럼 한 단계씩 목표에 가까워지는 지속적인 반복 진행 과정입니다.
엘라드 길:합성 데이터는 얼마나 유용합니까? 말씀하신 대로 각 모델은 다음 모델을 훈련하는 데 도움이 되거나 적어도 합성 데이터의 일부일 수 있는 데이터 주석과 같은 작업을 위한 도구를 제공할 수 있습니다.
안드레이 카르파티: 모델 역량을 향상시키기 위해서는 합성 데이터가 필수적이라고 생각합니다.하지만 합성 데이터를 사용할 때는 주의하세요., 언제인지 알지 못한 채 모델이 "붕괴"되기 때문입니다. 예를 들어, chatgpt에 농담을 말해달라고 요청할 때 몇 번 더 시도하면 많이 아는 것처럼 보이지만 사실은 그 몇 가지만 알고 있다는 것을 알게 될 것입니다. "collapse" 즉, 단일 출력으로는 문제가 없지만, 이 특정 방향으로의 출력이 나오면 모델의 다양성과 유연성이 크게 떨어지게 되어 데이터를 생성할 때, 특히 합성 데이터를 생성할 때 문제가 되며, "붕괴"되기 쉽습니다. 너무 단일한 데이터 세트로 인해 발생하는 문제를 피하기 위해서는 실제로 데이터의 다양성과 풍부함, 즉 "엔트로피"가 필요하기 때문입니다.
💡
모드 축소:이는 생성 모델이 다양한 샘플 대신 매우 유사하거나 반복적인 샘플을 생성하기 시작하는 gan(generative adversarial networks)에서 나타나는 현상입니다. 이는 모델이 데이터의 풍부한 다양성을 학습할 수 없음을 나타 내기 때문에 종종 문제로 간주됩니다.
예를 들어, 누군가 "나는 교사다", "나는 예술가다, 나는 여기에 살고, 나는 이 일을 한다" 등과 같은 10억 개의 가상의 인물 배경이 포함된 캐릭터 관련 데이터 세트를 공개했습니다.합성 데이터를 생성할 때 실제로 특정 사람과 상호 작용하는 과정을 상상하게 하면 모델에 더 많은 탐색 공간이 제공되므로 더 많은 정보가 출력되고 데이터 세트의 다양성이 높아집니다.따라서 데이터 분포의 안정성을 유지하면서 조심스럽게 엔트로피를 주입해야 하는데, 이것이 합성 데이터 생성에 있어서 가장 큰 과제이다.
사라 구오:이번 연구를 통해 인간의 인지에 대해 무엇을 배울 수 있다고 생각하시나요? 예를 들어, 어떤 사람들은 사고 궤적의 형성 과정을 이해하면 뇌가 어떻게 작동하는지 이해하는 데 도움이 될 것이라고 믿습니다.
안드레이 카르파티:연구 모델과 인간의 인지는 완전히 다른 두 가지이지만 어떤 경우에는 비교할 수 있습니다. 예를 들어, transformer는 어떤 면에서는 인간의 두뇌보다 강하다고 생각하며 모델은 인간의 두뇌보다 더 효율적인 시스템이지만 데이터 제한으로 인해 현재 성능은 인간의 두뇌만큼 좋지 않습니다. 그러나 이는 대략적인 설명일 뿐이다.
예를 들어, 메모리 기능 측면에서 transformer는 긴 시퀀스를 처리할 때 인간의 두뇌보다 더 나은 성능을 발휘합니다. 시퀀스를 지정하고 앞뒤 계산을 수행하도록 요청하면 시퀀스의 앞부분과 뒷부분을 기억하고 인간의 기억으로는 어려운 작업을 완료할 수 있습니다. 따라서 어떤 측면에서는 그래디언트 최적화에 기반한 훈련 방법이 실제로 인간의 두뇌보다 더 효율적이라고 생각하며, 미래에도 모델이 일부 인지 수준에서 실제로 인간을 능가할 수 있다고 생각합니다.
엘라드 길:메모리 용량은 컴퓨터의 장점 중 하나입니다.
안드레이 카르파티: 네, 사실 인간의 뇌에는 많은 한계가 있다고 생각합니다. 예를 들어 작업 기억의 용량은 매우 제한되어 있는 반면, 트랜스포머의 작업 기억은 그에 비해 훨씬 크며 그 격차는 여전히 벌어지고 있습니다. 또한 transformers는 더욱 효율적으로 학습합니다. 인간 두뇌의 작동은 배경, 책임, 환경 등과 같은 많은 숨겨진 요인에 의해 제한되며, 이는 인간 두뇌 시스템을 더욱 무작위적이고 제한적으로 만듭니다. 따라서 나는 어떤 측면에서 이러한 모델이 이미 인간의 두뇌보다 강력하다고 생각하지만 아직 잠재력을 최대한 발휘하지는 못했습니다.
엘라드 길:인간과 ai의 관계에 관해 한 가지 주장은 이를 외부 도구로 사용한다는 주장이고, 다른 주장은 인간과 ai 모델의 더 깊은 통합이 있을 것이라고 말합니다. 이 문제에 대해 어떻게 생각하시나요?
안드레이 카르파티: 우리는 인간과 ai의 통합을 어느 정도 달성했다고 생각합니다. 사람들이 흔히 말하는 것처럼 기술 도구는 항상 인간 능력의 파생물이었습니다. 단지 오늘날 모델의 문제는 정보 입력과 출력 과정의 병목 현상에 있기 때문에 인간과 ai의 통합은 여전히 지속적인 시도가 필요하다는 것입니다. 그러나 모델이 완벽해지면 이러한 모델을 사용하는 것이 매우 간단하며 몇 가지 간단한 동작만으로도 달성할 수 있습니다. 따라서 몇 가지 장애물이 있지만 현재 기술로 인해 이러한 통합이 상대적으로 쉽고 실현 가능해졌습니다.
엘라드 길:ai 분야의 일부 사람들은 이렇게 믿고 있다.미래에 우리와 ai 사이에 갈등이 생긴다면, 괜찮습니다.
인간과 ai의 어떤 형태의 융합으로 해결되었습니다.
안드레이 카르파티: 네, 이것은 neuralink의 철학과 매우 유사합니다. 이 융합이 정확히 어떤 모습일지는 모르겠지만, 분명한 것은 우리가 인간과 도구 사이의 입력 및 출력 대기 시간을 줄이고 싶다는 것입니다. 이를 대뇌 피질에 새로운 피질을 추가하는 것으로 생각할 수 있습니다. 이 새로운 피질은 클라우드 기반일 수 있으며 본질적으로 뇌의 다음 층입니다.
엘라드 길: 존재하다 가속도 이 책에는 웨어러블 스마트 안경을 통해 모든 것이 뇌에 전달된다는 비슷한 전제가 있습니다. 이 안경을 잃어버리면 성격이나 기억의 일부를 잃는 것과 같습니다.
안드레이 카르파티: 제 생각에는 이런 일이 일어날 가능성이 높습니다. 오늘날의 휴대폰은 뇌의 외부 장치처럼 우리 삶의 일부가 되었습니다. 휴대폰을 내려놓을 때마다 우리는 원래의 상태로 되돌아가는 듯한 느낌을 받습니다.
또 다른 예를 들면, 우리가 '만능 번역기'를 가지고 있고 그것에 오랫동안 의존하다 보면, 갑자기 그것이 없으면 다른 언어를 사용하는 사람들과 직접 소통하는 능력을 상실하게 될 수도 있습니다. 영상에서 볼 수 있듯이, 한 아이가 잡지를 들고 손가락으로 밀어내려고 하고 있는데, 무엇이 자연스러운 것인지, 무엇이 기술의 결과인지 알 수 없습니다. 기술이 점점 더 보편화됨에 따라 사람들은 이러한 도구에 점점 더 의존하게 되지만, 기술이 사라질 때까지 무엇이 기술이고 무엇이 아닌지 알 수 없다는 것을 깨닫게 됩니다. 특히 작업 수행을 항상 도와주는 번역기와 같은 장치는 기술과 자연의 경계에 대한 사람들의 민감성을 크게 줄여줄 것입니다.
사라 구오: "외피질"은 매우 중요한 것처럼 들리며 모든 사람에게 중요합니다. 오늘날 llm 연구는 몇몇 ai 연구소에 의해 주도되고 있으며 이들 연구소만이 차세대 모델 교육 개발을 촉진할 수 있는 리소스를 보유하고 있습니다. 오늘날 llm 연구의 이러한 구조에 대해 어떻게 생각하시나요? 향후 ai 기술의 대중화에 어떤 영향을 미칠까요?
안드레이 카르파티: 오늘날 llm의 생태계는 실제로 여러 폐쇄형 플랫폼에 의해 독점되고 있는 반면, 최하위인 meta llama는 상대적으로 개방적인 현상이기도 합니다. llm을 "외부 계층"으로 생각할 때 정보 및 데이터 개인 정보 보호 문제가 관련됩니다. 암호화 분야에는 "키가 아니라 토큰이 아니다"라는 말이 있습니다. 아마도 미래에 llm 분야에서는 "가중치도 아니고 두뇌도 아니다"를 강조하게 될 것입니다. ai가 미래의 모든 사람을 위한 새로운 대뇌피질이고, 이 피질이 특정 회사에 의해 통제된다면 사람들은 뇌를 실제로 소유하는 것이 아니라 '대여'하고 있다는 느낌을 갖게 될 것입니다.
사라 구오: 더 강력한 두뇌를 임대하기 위해 자신의 두뇌에 대한 소유권과 통제권을 기꺼이 포기하시겠습니까?
안드레이 카르파티: 저는 이것이 중요한 절충점이라고 생각합니다. 미래의 추세는 대부분의 사람들이 강력한 폐쇄형 소스 모델을 기본 옵션으로 사용하게 될 것이지만, 일부 특정 경우에는 오픈 소스 시스템이 대안이 될 것입니다. 지금과 마찬가지로 일부 폐쇄 소스 모델 제공업체가 api에 문제를 겪을 때 사람들은 오픈 소스 생태계로 눈을 돌려 통제력이 더 높다고 느낍니다.
이는 미래 두뇌 기술 개발의 방향이기도 합니다. 문제가 발생하면 오픈 소스 시스템으로 전환할 수 있지만 대부분의 경우 여전히 폐쇄형 시스템에 의존하고 있습니다. 오픈 소스 시스템을 계속 발전시키는 것이 중요하지만 오늘날 모든 사람이 이 문제를 인식하는 것은 아닙니다.
엘라드 길:미니어처에 대해 어떻게 생각하시나요? 오늘날의 소형 모델은 어느 수준의 성능을 달성할 수 있습니까?
안드레이 카르파티: 모델을 더 작게 축소할 수도 있을 것 같아요. 데이터 세트의 문제로 인해 현재 모델은 관련 없는 정보를 저장하는 데 많은 용량을 낭비한다고 생각합니다. 작은 모델의 핵심은 핵심 인식에 집중하는 것이며 이 핵심은 실제로 매우 작을 수 있습니다. 정보를 찾아야 할 때 모델에 불필요한 세부 사항을 많이 저장하는 대신 다양한 도구를 유연하게 사용하여 정보를 얻을 수 있는 사고 방식에 가깝습니다.
매개변수 측면에서 목표를 달성하려면 매개변수가 1억 개만 필요할 수도 있다고 생각합니다. 효율적인 압축 기술은 모델을 매우 작게 만들 수 있습니다. 압축의 원리는 간단합니다. 즉, 매우 큰 모델을 사용하거나 더 작은 모델을 감독하기 위해 많은 컴퓨팅 리소스를 사용하는 것입니다. 이 프로세스는 작은 모델에 많은 기능을 담을 수 있습니다.
이 문제의 본질은 오늘날의 빅 모델이 인터넷 데이터 세트를 다루고 있으며, 콘텐츠의 약 0.001%만이 인지와 관련이 있고 나머지 99.99%는 실제로 복사 오른쪽 텍스트와 같은 일부 관련 없는 정보라는 것입니다. 대부분의 정보는 사고 패턴을 개선하는 데 실질적인 역할을 하지 않습니다.
엘라드 길:이 과정을 수학이나 일종의 정보학 이론으로 설명할 수 있습니까? 모델 크기와 인지력 간의 관계를 정량화할 수 있나요? 예를 들어, 미래에는 좋은 이해를 얻으려면 10억 개의 매개변수 모델만 필요할 수도 있습니다.
안드레이 카르파티: 심지어 10억 달러 미만의 비용이 들 수도 있고, 모델 비용, 최종 장비 등을 고려하면 모델이 이런 인지 능력을 가질 수 있습니다. 그리고 우리가 논의하려는 것은 단일한 인지 모델이 아닐 수도 있습니다. 모델은 단순히 순차 처리에만 의존하는 것이 아니라 병렬 처리할 수 있는 능력을 가져야 한다고 생각합니다. 회사와 마찬가지로 많은 작업을 동시에 수행할 수 있지만 정보를 더 잘 처리하려면 계층 구조도 필요합니다. 따라서 미래에는 "llm을 위한 회사"라는 모델이 있을 수 있다고 생각합니다. 하나는 프로그래머 모델이고 다른 하나는 프로젝트 관리자 모델이며 모두가 많은 작업을 처리하는 등 서로 다른 모델이 각자의 분야에 중점을 둡니다. 동시에 그들은 llm으로 구성된 "그룹 두뇌"를 형성하기 위해 협력할 수도 있습니다.
엘라드 길:이 llm 클러스터는 각 부분이 고유한 전문 지식과 위치를 갖고 있는 생태계와 같습니다.
안드레이 카르파티: 미래는 확실히 이 방향으로 발전할 것이라고 생각합니다. 클라우드 모델은 가장 지능적이며 이 그룹의 직원인 오픈 소스 모델이 많이 있습니다. 그러나 시스템이 매우 복잡한 문제에 직면하게 되면, 작업은 자동으로 에스컬레이션되어 그룹의 다른 부분에 할당됩니다.
04.
ai 시대의 교육
사라 구오:openai를 떠난 후 교육 프로젝트를 시작하셨는데요. 교육을 선택한 이유는 무엇인가요?
안드레이 카르파티: 저는 항상 교육 산업을 좋아했고, 배우고 가르치는 것을 좋아하며 이 분야에 매우 열정적입니다.
💡
karpathy 설립 유레카 연구소는 인공지능 기술을 통해 학습 방법의 혁명을 목표로 하는 ai를 핵심으로 하는 교육 플랫폼입니다. 유레카랩스의 첫 번째 코스 llm101n 학생들은 ai 교육을 더욱 대화적이고 대중적으로 만들기 위한 목표로 자신만의 대규모 언어 모델을 구축하도록 지도됩니다. 이 플랫폼은 수년간 ai와 교육을 통합하려는 그의 비전을 반영하여 ai 조교와 휴먼 코스 설계를 통합하여 학습 경험을 향상시킬 계획입니다.
제가 이 분야에 들어오게 된 중요한 이유는 많은 ai가 인간을 대체하려고 하여 많은 사람들이 일자리를 잃게 만든다는 느낌이 들지만, 인간의 능력을 향상시킬 수 있는 기술에 더 관심이 있기 때문입니다. 전반적으로 나는 인류의 편에 서서 ai가 인류를 소외되기보다는 더욱 강력하게 만들 수 있기를 바랍니다.
또한, 모든 과목의 튜터링 과제를 완수할 수 있는 '완벽한 튜터'가 있다는 것은 꽤 좋은 생각이라고 생각합니다. 모든 사람이 모든 과목을 학습할 수 있도록 지도해 주는 ai 튜터가 있다면, 모두가 더 큰 성과를 거둘 수 있다고 믿습니다.
엘라드 길: 1980년대 이후 문헌에서는 일대일 튜터링이 개인의 성과를 2 표준편차만큼 향상시킬 수 있다고 명시하고 있습니다. 또한 개인화 튜터와 튜터가 어떻게 결합될 수 있다고 생각하시나요?
안드레이 카르파티: 저는 이러한 사례에서 많은 영감을 얻습니다. 지금은 사람들이 ai를 배우는 첫 번째 선택으로 만드는 것을 목표로 완전한 코스를 구축하고 있습니다. 이전에 스탠포드의 첫 번째 딥 러닝 코스를 가르쳤는데 학생 수는 20~30명에 불과했지만 결과는 좋았습니다. 이제 과제는 언어와 능력의 차이를 고려할 때 이러한 종류의 과정을 전 세계 80억 명을 대상으로 확장하는 방법이며, 이는 한 명의 교사로는 달성하기 어렵습니다.
따라서 ai를 어떻게 활용해 좋은 교사의 역할을 확대하느냐가 관건이다. 교사의 핵심 임무는 코스 설계와 자료 작성이어야 하며, ai는 프런트 엔드에서 학생들과 상호 작용하고 콘텐츠를 가르칠 수 있습니다. 현재 ai는 완전한 강좌를 독립적으로 만들 수는 없지만 지식을 설명하고 전달하는 데는 충분합니다. 이렇게 하면 교사는 백엔드 디자인에 집중할 수 있고, ai는 프런트엔드에서 여러 언어를 사용하여 학생들과 상호 작용하고 학습을 완료하도록 돕습니다.
사라 구오:ai를 조교에 비유할 수 있나요?
안드레이 카르파티: 조교는 제가 고려하고 있는 방향 중 하나인데, 학생들과 직접적으로 상호 작용하여 과정을 이수할 수 있도록 이끌어주는 프론트엔드라고 봅니다. 현재 기술로는 가능한 솔루션이고 비슷한 제품은 없다고 생각합니다. 시장에 나와 있기 때문에 이 분야에는 많은 잠재력이 있고, 기술이 발전함에 따라 다양한 조정이 가능하다고 생각합니다. 나는 오늘날 많은 기업들이 모델 기능에 대해 직관적으로 충분히 이해하지 못하고 있으며, 그 결과 그들이 개발하는 제품이 너무 진보적이거나 충분히 정확하지 않다고 생각합니다. 그래서 이 분야는 잠재력이 크다고 생각해요.
사라 구오: 좋은 도구를 사용하면 인간 능력의 한계를 어디까지 도달할 수 있을까요? 예를 들어 올림픽과 비교하면 지난 10년 동안 훈련 과학과 기술의 발전으로 인해 상위 주자들의 성적은 10년 전보다 더 좋아졌습니다.
안드레이 카르파티: 오늘은 아직 우리의 잠재력이 최대한 발휘되지 못한 것 같습니다. 이 문제는 두 가지 관점에서 생각해 볼 수 있습니다. 첫째는 모든 사람이 높은 수준의 교육을 받을 수 있기를 바라는 것이고, 둘째는 개인의 능력의 한계입니다. 두 가지 관점 모두 가치가 있습니다.
엘라드 길: 일반적으로 1:1 학습지도를 논할 때 개인화와 적응, 즉 각 사람의 수준에 따라 상응하는 학습 과제를 제공하는 것을 언급합니다. 오늘날 ai가 이것을 할 수 있다고 생각하십니까?
안드레이 카르파티: 오늘날 ai 교육 분야의 "낮은 열매"는 번역 응용 프로그램이라고 생각합니다. 현재 모델은 이러한 작업에 매우 능숙하며 수행할 수 있는 작업은 여전히 기본 작업입니다.
각 개인의 수준에 맞는 개인화를 달성하는 것은 어렵지만 불가능한 것은 아니라고 생각합니다. 이것이 ai 개발의 초점이 되어야 하며 분명히 그렇게 할 수 있는 잠재력이 있습니다. 그러나 여기에는 새로운 분야가 포함될 수도 있습니다. 프롬프트 프로젝트를 통해 더 간단한 모델을 구현할 수도 있지만, 정말 유용한 방법은 모델 자체에 그러한 기능을 부여하여 교사처럼 작동할 수 있도록 하는 것이라고 생각합니다.
나는 이것이 현재 저개발된 일부 영역을 다루고 있다고 생각합니다. 모델에 힌트를 제공하여 도움을 받는 등 간단한 버전도 멀지 않을 수 있지만 데모에서 보기에 좋을 뿐만 아니라 실제로 작동하는 솔루션에 대해 이야기하고 있습니다. 제가 말하는 것은 실제 교사처럼 효과적으로 일할 수 있는 능력, 각 사람의 상황을 이해하고 개인화된 지도를 제공할 수 있는 능력이며, 이에 대한 추가 개발이 필요합니다.
엘라드 길: 다른 모델을 도입하여 이러한 적응을 달성할 수 있습니까?
안드레이 카르파티: 이것도 ai의 특징인 것 같아요. 실제로 단 하나의 프롬프트로 많은 기능을 구현할 수 있다고 생각합니다. 그래서 데모를 많이 보는 편인데, 드디어 실제 제품을 내놓을 수 있을까요? 그래서 일부 데모를 만드는 것은 어렵지 않을 수 있지만, 대규모로 사용할 수 있는 제품으로 개발되기까지는 아직 갈 길이 멀다.
사라 구오:몇 주 전에 학습과 오락은 다르다고 말씀하셨는데, 학습은 도전적이어야 하며 사회적 지위, 아이돌 효과 등과 같은 특정 인센티브 시스템이 필요합니다. 인센티브 시스템이 사람들의 학습 동기를 어느 정도까지 변화시킬 수 있다고 생각하시나요? 사람들이 자신의 능력 내에서 최대한 멀리 갈 수 있도록 리소스를 제공하는 데 더 관심이 있습니까? 아니면 기꺼이 배우고 더 많은 사람들이 학습을 시작하도록 안내하는 사람들의 수를 바꾸고 싶습니까?
안드레이 카르파티:어떤 사람들은 자연스럽게 학습에 관심이 없을 수도 있기 때문에 학습을 조금 더 쉽게 만들고 싶습니다. 많은 사람들이 취업과 같은 실질적인 필요를 위해 공부하는데, 이는 매우 합리적입니다. 교육은 지식을 제공할 뿐만 아니라 개인의 경제적 지위를 향상시키기 때문에 우리 사회에서 중요한 역할을 하며, 이것이 바로 사람들이 교육을 통해 동기를 부여받기를 원하는 이유입니다.
사라 구오:agi 이후 사회에서 우리의 미래는 어떤 모습일까요?
안드레이 카르파티:포스트 agi 시대에는 교육이 더욱 엔터테인먼트에 가까워질 것이라고 생각합니다. 성공적인 교육은 지식의 전달뿐만 아니라 이러한 지식의 심층적인 이해와 적용에도 달려 있습니다.
사라 구오:유레카의 첫 번째 청중은 누구였습니까?
안드레이 카르파티:이 첫 번째 과정의 주요 대상자는 학부생, 특히 기술 분야에서 학위를 취득하려는 학생입니다. 기술 관련 학부 과정을 공부하고 있다면 이 과정의 이상적인 대상 그룹은 바로 당신입니다.
안드레이 카르파티:나는 우리의 현재 교육 개념이 다소 구식이라고 생각합니다. 학교에 가고, 졸업하고, 계속 일하던 기존 방식은 오늘날의 변화로 인해 무너질 것입니다. 기술은 빠르게 변화하고 있으며 사람들은 계속해서 학습해야 합니다. 그래서 학부생을 대상으로 한 강좌이기는 하지만, 실제로는 청중의 폭이 넓습니다. 예를 들어, 모든 연령층이 참여할 수 있다고 생각합니다. 특히 관련 지식을 더 깊이 이해하고 싶은 기술적 배경을 가진 사람들에게는 얻을 수 있는 것이 있을 것입니다.
올해 말, 내년 초가 적절한 시기가 될 수 있지만 그 전에 강좌의 질이 기대 수준에 도달할 수 있도록 열심히 노력하겠습니다.
엘라드 길:자녀가 있다면 자녀가 어떤 지식과 기술을 배우기를 원하십니까?
안드레이 카르파티:제가 답변드리고 싶은 과목은 수학, 물리학, 컴퓨터공학 등입니다. 이러한 과목들은 실제로 사고력 함양을 위한 매우 핵심적인 훈련을 제공합니다. 물론 이러한 관점은 제 배경에 따라 영향을 받지만 문제 해결 능력 측면에서는 이러한 영역이 매우 도움이 된다고 생각합니다. 미래가 agi 시대에 가까워지더라도 이러한 기술은 여전히 중요할 것입니다. 사람들이 많은 시간과 관심을 쏟는 이 중요한 시기에는 많은 기억력이 필요한 작업보다는 상대적으로 수행하기 간단한 작업에 주로 집중해야 한다고 생각합니다. 나는 또한 다른 과목을 배우는 것의 중요성을 인식하고 있지만, 이러한 핵심 영역이 더 실용적이고 장기적인 가치를 갖기 때문에 시간의 80%는 이러한 핵심 영역에 집중되어야 한다고 믿습니다.
조판: fia