Apple 공식 발표: Apple Intelligence를 지원하는 모델은 Google의 맞춤형 칩에서 훈련됩니다.

2024-07-30

이 기사의 저자: Li Dan

출처: 하드 AI

공개 문서에 따르면 Apple의 자체 인공 지능(AI) 시스템인 Apple Intelligence 개발은 Google의 맞춤형 칩 지원과 불가분의 관계에 있습니다.

동부 표준시인 7월 29일 월요일, Apple의 공식 웹사이트는 장치에서 효율적으로 실행하는 데 사용되는 약 30억 개의 언어 모델인 Parametric 모델을 포함하여 Apple의 개인 지능 시스템인 Apple Intelligence를 지원하기 위해 개발된 몇 가지 기본 언어 모델을 자세히 설명하는 기술 문서를 게시했습니다. 클라이언트 측 "Apple Basic Model"(AFM) 및 대규모 서버 언어 모델 - Apple의 클라우드 AI 아키텍처 "Private Cloud Compute"용으로 설계된 서버 AFM.

논문에서 Apple은 클라이언트측 AFM과 서버 AFM이 Apple에서 개발한 생성 모델 제품군의 구성원임을 소개했습니다. 이러한 모델은 사용자와 개발자를 지원하는 데 사용됩니다. 논문에서 Apple은 훈련 모델이 Google이 개발한 4세대 AI ASIC 칩 TPUv4와 최신 세대 칩 TPUv5를 사용한다고 밝혔습니다. 기사 내용은 다음과 같습니다.

"우리는 6조 3천억 개의 토큰 교육을 수행하기 위해 4096개의 시퀀스 길이와 4096개의 시퀀스 배치 크기를 사용하여 8192 TPUv4 칩에서 서버 AFM을 처음부터 교육했습니다."
"터미널 측 AFM은 2048 TPUv5p 칩으로 훈련되었습니다."

47페이지 분량의 논문에서 Apple은 Google이나 Nvidia를 이름으로 언급하지 않았지만 자사의 AFM 및 AFM 서비스가 '클라우드 TPU 클러스터'에서 교육을 받았다고 밝혔습니다. 이는 Apple이 계산을 수행하기 위해 클라우드 서비스 제공업체로부터 서버를 임대한다는 의미입니다.

실제로 올해 6월 열린 세계개발자회의(WWDC)에서 언론은 애플이 공개한 기술문서의 세부 내용을 통해 구글이 AI 분야에서 애플의 노력의 또 다른 승자가 됐다는 사실을 발견했다. Apple 엔지니어들은 회사에서 자체 개발한 프레임워크 소프트웨어와 다양한 하드웨어를 사용하여 Google Cloud에서만 사용할 수 있는 TPU(텐서 처리 장치)를 포함한 기본 모델을 구축했습니다. 하지만 애플은 엔비디아 등 다른 AI 하드웨어 공급업체에 비해 애플이 구글의 칩과 소프트웨어에 얼마나 의존하고 있는지 공개하지 않았다.

따라서 월요일 소셜 미디어 X의 댓글에는 Apple이 6월에 Google 칩을 사용한다는 소식이 있었고 이제 훈련 스택에 대한 자세한 내용이 있습니다.

일부 댓글에서는 Apple이 Nvidia를 싫어하지는 않지만 TPU가 더 빠르다는 의견도 있었습니다. TPU가 빠르기 때문에 Apple이 사용하는 것이 합리적이라는 의견도 있습니다. 물론 Nvidia의 칩보다 저렴할 수도 있습니다.

월요일 언론 논평에 따르면 Google의 TPU는 원래 내부 작업 부하를 위해 만들어졌으며 현재는 더 광범위하게 사용되고 있습니다. 모델 훈련에 Google 칩을 사용하기로 한 Apple의 결정은 일부 기술 대기업이 AI 훈련과 관련하여 Nvidia의 AI 칩에 대한 대안을 찾고 있을 수 있음을 시사합니다.

월스트리트 저널은 지난주 Meta CEO Zuckerberg와 Alphabet 및 Google CEO Pichai가 연설에서 자신의 회사와 다른 기술 회사가 AI 인프라에 더 많이 투자했을 수 있음을 암시했다고 언급했습니다. 그러나 그들은 그렇게 하지 않을 경우 비즈니스 위험이 너무 높다는 점을 모두 인정합니다.

주커버그는 이렇게 말했다.

"뒤처짐의 결과는 향후 10~15년 동안 가장 중요한 기술에서 불리한 위치에 놓이게 된다는 것입니다."

피차이는 이렇게 말했다.

AI는 비용이 많이 들지만 투자 부족의 위험은 훨씬 더 큽니다. Google은 주로 Nvidia GPU 구매를 포함하여 AI 인프라에 너무 많은 투자를 했을 수 있습니다. AI 붐이 둔화되더라도 기업이 구매하는 데이터센터와 컴퓨터 칩은 다른 용도로 사용될 수 있다. 우리에게는 과소투자의 위험이 과잉투자의 위험보다 훨씬 더 큽니다.

소식

Apple 공식 발표: Apple Intelligence를 지원하는 모델은 Google의 맞춤형 칩에서 훈련됩니다.

소개

내 연락처 정보