ニュース

シャオ・ザとラオ・ファンは、着替えをしながら暖炉のそばで親密な会話をしています。Xiao Zhaは実際に防爆の厚さを破り、Lao HuangはBlackwellの最初のバッチがリリースされたことを明らかにしました

2024-07-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


新しい知恵のレポート

編集者:編集部

【新しい知恵の紹介】ちょうど今、Lao Huang 氏が SIGGRAPH カンファレンスで明らかにしました: Blackwell のエンジニアリング サンプルが今週正式に世界に送られたのです!その後、ラオ・ファンとシャオ・ザーは暖炉のそばで会話を交わし、親密に服を交換した。盛り上がったとき、シャオ・ザーは激怒して爆発した。

速報はこちらです!

ちょうど今、Lao Huang 氏が SIGGRAPH コンピューター グラフィックス カンファレンスで明らかにしました。ちょうど今週、NVIDIA が Blackwell エンジニアリング サンプルを世界に送り始めました。

その直後、司会者のローレン・グッドが冗談を言った。

この今日最も強力な AI チップの背後には、AI も切り離せないものであることは言及する価値があります—

AI がなければ、Hopper も不可能です。AI がなければ、Blackwell も不可能です。


彼とシャオ・ザーとの暖炉のそばでの会話の中で、シャオ・ザーは感情的になったときに悪態をつかずにはいられなかった。

というのは、2 人のボスの以前の服装変更の効果は、本当に説明するのが難しいからです。

今回、Xiao Zhaは特別にLao Huangにカスタマイズされた「ブラックレザースタイル」のコットンコートを贈りました。


上半身を取った後の効果は確かに抜群です!


もちろん、Xiao ZhaはLao Huangが2時間しか着なかった「中古」の革ジャンも着ました。 (新品よりも価値が高いです)


NVIDIA のデジタル「レプリカ」の世界

カンファレンスで Lao Huang 氏は、NVIDIA が OpenUSD (言語、幾何学、材料、物理学、空間) を理解できる世界初の生成 AI モデルを構築したと発表しました。

オープンUSDとは何ですか?これは、Universal Scene description を指し、普遍的なシーンの説明として理解できます。

フアン氏は、AI がテキストでできることよりも興味深いのは、画像でも同じことができることだと述べました。

たとえば、NVIDIA が作成した Edify AI モデルは、テキストから 2D までの基本モデルです。


ブランドの場合、コカ・コーラ、自動車、高級品などを生み出すことができますが、キューを制御するのは難しいことです。

これは、言葉の自由度が非常に低く、内容が非常に圧縮されていると同時に、非常に不正確であるためです。

NVIDIA はこれを行う方法を作成しました。別のモデルを作成し、それを制御し、より多くの条件に合わせて調整します。


Omniverse を使用すると、3D、AI、アニメーション、マテリアルなど、マルチモーダルなデータとコンテンツをすべて組み合わせることができます。

私たちはその姿勢、位置、要するに何でも好きなように変えることができます。

Omniverse での条件付きプロンプトの使用は、検索拡張生成と同様に、一種の 3D 拡張生成として理解できます。

このようにして、好みの方法で画像を生成できます。

次に、WPP は Shutterstock を使用して世界的に有名なブランドとの作品を完成させ、視聴者に直接衝撃を与えました。

混雑したレストランの空いている部屋にテーブルを作って、その周りに椅子を並べてください。


朝の光の中でタコスとサルサボウルを備えたテーブルを作ってください。


モダンな家の近くの、木々に囲まれた空き道で車を作ってください。


空き地に木を建ててください。


この木を四方八方に何百本も建ててください。


森に茂みや蔓を吊るしましょう。


エキゾチックな花と太陽光線で満たされた巨大な熱帯雨林を私に造ってください。


Omniverse はテキストから USD への変換を理解できるようになりました。テキストを理解し、セマンティック データベースを備えているため、すべての 3D オブジェクトを検索できます。

そのため、少女は 3D ツリーをどのように埋めたいかをイメージすることができ、それが完了すると、3D シーンが生成 AI モデルに入力され、フォトリアリスティックなモデルに変換されます。

それ以来、人々がこれらのシミュレーション、つまりデジタル ツインを作成するのを支援する生成 AI が Omniverse にますます登場するでしょう。

例えば、次のようなデジタルAIにより、あらゆる企業が顧客サービスを提供できるようになります。

現時点では顧客対応は人間が行っていますが、将来的にはAIが関与することになります。

カスタマー サービスは、IO であるデジタル ヒューマン フロントエンドに接続されます。このIOは私たちと会話したり、目を合わせたりすることができます。


このデジタル ヒューマンにはあらゆる種類の AI を接続でき、デジタル ヒューマンさえも NVIDIA の検索機能を強化した顧客サービス AI に接続できます。

NIMサービス

このカンファレンスで、NVIDIA は新しい NIM マイクロサービス セットを発表しました。

NIM は、OpenUSD、3D モデリング、物理学、材料、ロボット工学、産業用デジタル ツイン、物理 AI などのさまざまなワークフローに合わせて調整されています。

AI とグラフィックスの分野で、NVIDIA は物理 AI アプリケーションを生成するために設計された新しい OpenUSD NIM マイクロサービスを開始しました。

このワークフローには、ロボット シミュレーション用の新しい NIM マイクロサービスなどが含まれており、ヒューマノイド ロボットの開発を加速します。

「三体」がロボットを生み出す

Huang 氏は、AI の次の波は物理的な AI になると予測しました。

ロボット技術が進歩するには、高度な AI と現実的な仮想世界が必要であり、次世代の人型ロボットを導入する前に、AI をトレーニングする必要があります。

ロボット工学には 3 台のコンピューターが必要です。1 台は AI のトレーニング用、もう 1 台は物理的に正確なシミュレーションで AI をテストするため、もう 1 台はロボットの最適化方法を学習できるロボット自体の内部にあります。


つまり、実際にAIを動かすコンピューターが第3のAIです。

これを行うために、Nvidia は 3 台のコンピューターを作成しました。

AI がなければ、H100/H200 および B100 は存在しません。

1990 年代に始まる NVIDIA の歴史において、真の DNA はコンピューター グラフィックスにあります。

コンピューター グラフィックスも Nvidia を今日の地位に導きました。


この写真は、IMB 360 システム、ユタ ティーポット、レイ トレーシング、プログラマブル シェーディングなど、コンピューター業界のいくつかの重要なマイルストーンを示しています。

1993 年に NVIDIA が設立されました。 8 年後、彼らは最初のプログラマブル シェーディング GPU を発明し、これが Nvidia の開発の歴史を大きく動かしました。

NVIDIA のすべての取り組みの核心はアクセラレーション コンピューティングであると言えます。彼らは、汎用コンピューティングを強化する計算モデルを作成すれば、通常のコンピューターでは解決できない問題を解決できると強く信じていました。

得意分野はコンピュータグラフィックスです。彼らは正しい賭けをしました。

当時主流ではなかった分野、つまり 3D グラフィックス ビデオ ゲームへのコンピュータ グラフィックスの応用は、Nvidia のフライホイールを直接推進しました。

その後、CUDA をユビキタスにするまでに長い時間がかかりました。そして 2012 年に、スタートレックのように、NVIDIA は初めて AlexNet にアプローチしました。

2012 年は爆発的な瞬間であり、AlexNet はコンピューター ビジョンにおいて驚くべき進歩を遂げました。その核となる深層学習は非常に奥深いため、エンジニアは入力を行った後に出力がどのようになるかを想像する必要がなくなりました。


2016 年、Nvidia は深層学習用に構築された最初のコンピューターである DGX-1 を発売しました。これはマスク氏によって支持され、その後この製品は当時ほとんど知られていなかった OpenAI に提供されました。

その後、RTX と DLSS が発明されました。

そしてChatGPTが誕生しました。

将来的には誰もが AI アシスタントを持つようになる

今日、私たちは AI を使用して、言葉だけでなく、画像、ビデオ、3D、化学物質、タンパク質、物理学、熱力学、流体力学、素粒子物理学など、あらゆるものを学習することを学びました。


私たちはこれらすべてのさまざまな様式の意味を理解しています。

Lao Huang 氏の見解では、ビジュアル コンピューティングに基づく生成 AI 革命は人間の創造性を高めています。

私たちはまさにソフトウェア 3.0 の時代に向かう革命の瞬間にいます。どの業界も AI の影響から逃れることはできません。


Huang 氏は、「誰もが AI アシスタントを持ち、すべての企業と社内のすべての仕事が AI によって支援されるようになるでしょう」と予測しました。


コンピューティングを高速化してエネルギー問題を解決する

生成型 AI は人間の生産性を向上させると期待されていますが、AI インフラストラクチャのエネルギー消費は地球全体を悩ませる大きな問題です。

ChatGPT の 1 回の検索は、Google 検索 10 回分の検索力に相当します。

データセンターは世界の総エネルギーの 1% ~ 2% を消費し、10 年以内に 6% に達する可能性もあります。


何をするか?ラオ・ファンは解決策を持っています。

同氏は、加速コンピューティング技術によりコンピューティングのエネルギー効率がさらに高まると期待されていると述べた。

「高速化されたコンピューティングは、大幅なエネルギーの節約に役立ちます。20 回または 50 回の節約で、同じ処理を実行できます」と Huang 氏は述べています。

「社会として私たちが最初に行う必要があるのは、できる限りあらゆるアプリケーションを加速することです。これにより、世界中で使用されるエネルギーの量が削減されます。」

同じエネルギーを使用しながらアプリケーションを大幅に加速する Blackwell が非常に期待されているのはこのためです。

そして安くなってきています。


Lao Huang 氏は次のように強調しました。生成 AI の目標はトレーニングではなく、推論であることを忘れないでください。理想的には、推論により、天気の予測、新素材の予測、サプライチェーンの最適化などのための新しいモデルを作成できるようになります。

エネルギーを消費するのはデータセンターだけではないことを忘れないでください。世界のデータセンターはコンピューティング全体のわずか 40% を占めており、エネルギー消費の 60% は電子、ビット、バイトを移動するオンラインによるものです。

したがって、生成 AI は情報を検索する必要がなく、現場で直接生成できるため、オンラインでのエネルギー消費を削減します。


そしてつい最近、Nvidia は Pandas を実行するために GCP に GPU をデプロイしました。

世界をリードするデータ サイエンス プラットフォームは、直接的に速度を 50 倍から 100 倍に向上させ、一般的なコンピューティングを超えました。

過去 10 ~ 12 年で、ディープラーニングの速度が 100 万倍向上し、コストとエネルギー消費が 100 万倍削減されました。これが LLM が誕生した理由です。

ただし、NVIDIA は、新しいプロセッサ、新しいシステム、Tensor コア GPU、および NVLink スイッチ構造を設計することで、AI に新しいイノベーションももたらします。

ラオ・ファンとシャオ・ザーの囲炉裏での会話


今年の SIGGRAPH での 2 人の CEO の囲炉裏での会話は、多くの人々が待ち望んでいたものでした。 Xiao Zha 自身の言葉を借りれば、「業界で最も年長の 2 人の創設者」、どのような火花が衝突するのでしょうか?

次の波

当然のことながら、「Green Plum Cooking Wine」の 2 人の主人公はそれぞれの予測を共有し、GenAI からエージェント、そしてシャオ ザーが常に考えている「メタバース」に至るまで、将来の技術開発トレンドについて語りました。

フアン氏は、GenAI の技術力にも衝撃を受けたと述べ、「これほど急速に消費者、企業、産業界、学術界に影響を与えたテクノロジーは記憶にありません。気候技術からバイオテクノロジー、そしてあらゆる分野に及びました。物理科学のさまざまな分野です。」

Xiao Zha氏はまた、GenAIがMetaのさまざまなソーシャルメディアソフトウェアを再構築する可能性が高いとも述べた。

これまで、これらの製品の中核であるレコメンデーション システムは、ユーザーに興味のあるコンテンツをプッシュするだけでした。

しかし、GenAI は既存のコンテンツに限定されなくなり、クリエイターを支援するだけでなく、ユーザー向けのリアルタイム コンテンツを作成したり、既存のコンテンツを合成して生成したりすることもできます。


Agentの開発に関しては、両者とも同様の考えを持っているようだ。

黄氏は前回の講演で、「将来的には誰もが自分専用のAIアシスタントを持つようになる」と明言した。

この会話の中で、Xiao Zha氏も同様のビジョンを表明しました。彼は、誰もがさまざまな目的に合わせて独自のエージェントを作成できるようにする、メタ用の AI アシスタントと AI Studio 製品を計画しています。

現在、すべての企業が独自のソーシャル メディアや電子メール アカウントを持っているように、将来的にはすべての企業が独自の AI を所有するようになるでしょう。

彼らが呼ぶ「AI アシスタント」には、どの程度の「インテリジェント」が必要なのでしょうか?

これまで見てきた Llama 3 は、人間の質問にのみ応答できる「チャットボット」のような言語モデルにすぎません。しかし、Xiao Zha氏はAIに「意図」を与えることができると期待している。


ラオ・ファン氏は、それを人間と同じように心の中に「決定木」を形成し、行動を導くことができる「計画能力」と表現しました。

同氏は、この種の AI アシスタントのコストは 1 時間あたりわずか 10 ドルだが、エンジニアの作業パフォーマンスを大幅に向上させる可能性があるとさらに大胆に予測しました。 「まだ AI を採用していない場合は、今すぐ採用してください。」

Meta の中核で最もユニークな AR/VR テクノロジーに関しても、Xiao Zha の設計図は非常に正確で、彼の強迫的な性格を完全に反映しています。

(老黄のニュースによると、トマトはミリメートルの精度でカットでき、トマトの各スライスが互いに接触することはありません。)

昨年9月、MetaとRay-Banは、オーディオ機器とカメラを備えた新しいスマートグラスを発売した。これにより、ユーザーは両目の視点から直接写真を撮ったり、メガネに映る視野をFacebookやFacebookに直接ライブブロードキャストしたりできるようになる。 Instagram と会話アシスタント Meta AI を統合しました。


Xiao Zha氏は、レイバンメガネの現状を踏まえると、300ドルの非ディスプレイAIメガネは非常に人気のある製品になるだろうと述べた。

彼の予測によると、将来スマートグラスは携帯電話のようなデバイスとなり、眼鏡をかけている人は全員(世界で10億人以上)スマートグラスを着用するようになるという。

今後数年以内に、Meta はホログラフィック AR 機能を備えたメガネも発売する予定ですが、コストはまだ高いものの、実現可能な製品となるでしょう。


スマート グラスとは異なり、複合現実ヘッドセットはワークステーションやゲーム コンソールに似ています。持ち運びには不便ですが、より強力なコンピューティング能力を備えており、ユーザーにより没入型のエクスペリエンスを提供できます。

さらに、ホログラフィックAR技術の発展により、「バーチャル会議」もやがて現実のものとなります。

Zoom プラットフォーム上のアバターやビデオとは異なり、誰もが独自のホログラフィック イメージを持ち、たとえ異なる物理空間にいたとしても、ホログラムによって作成された「仮想人」は同じ空間でコラボレーションし、対話することができます。

オープンソースが前進への道

Meta に関して言えば、一貫した「オープンソース」戦略も議論されるべき重要なポイントです。

Lao Huang 氏は、この戦略を非常に高く評価しており、Llama 2 は、PyTorch と新しくリリースされた Llama 3.1 と相まって、昨年の AI 分野で最も重要なイベントになる可能性があり、Meta は全体のエコシステムを構築したと述べました。

しかし、Xiao Zha氏は、オープンソースへの道は一種の「適応」でもあると語った。

多くのトラック、特に分散コンピューティング システムやデータ センターにおいて、Meta のスタートラインは実際に他の企業よりも遅れているため、チームはオープン ソース、特にオープン コンピューティングを考えました。

意外なことに、この方便は「コーナーでの追い越し」の重要な戦略となった。

Meta がリリースする製品を業界標準にし、それを中心にサプライ チェーン全体が構築されるのはオープンソースです。 Meta はプロジェクトをオープンソースにすることで数十億ドルを節約しました。

たとえば、Meta は実際に GPU 分野に参入したのはほとんどの企業よりも遅かったものの、現在運営している GPU スーパーコンピューティング クラスターの規模は、ほぼすべての競合他社を上回っています。

もちろん、その背景にはLao Huang氏の強力なサポートが不可欠です。何と言っても、Metaの60万基のGPUもNvidia製です。


オープンソースはこのコミュニティと業界の進歩を促進することができますが、Xiao Zha 氏はまた、オープンソースは慈善活動ではなく、私たちが無私の心のためにこの戦略を選択したわけではないと正直に言いました。

より重要な目的は、構築中の製品を最高の状態に到達させ、可能な限り最高のものにすることです。

PyTorch は最も典型的な例であり、NVIDIA の 200 ~ 300 人のエンジニアを含む世界中の開発者がこのオープンソース フレームワークのバグ発見と最適化を支援しており、Huang 氏が「PyTorch エンジニアリング マウンテン」と呼ぶものを形成しています。

Xiao Zha 氏自身、オープンソースが利己的であることを認めていますが、それでも「クローズド」プラットフォームについて話すと感情的にならざるを得ません。部屋中の唯一の悪口はこの話題から出たものでした。

Meta にはキングレベルのソーシャル ソフトウェアが多数ありますが、これらのアプリケーションは競合他社のプラットフォーム、特に Apple App Store や Google の Android システムを通じて配布する必要があります。

Xiaozha 氏が非常にイライラしているのは、彼がかつて多くの製品アイデアを持っていたにもかかわらず、これらのモバイル プラットフォームのさまざまな制限により、最終的には世に出すことができなかったことです。

モバイル インターネット時代のプラットフォームへの極端な依存は、PC 時代のオープンさとはまったく異なります。そのため、Xiao Zha さんはウェブ上の Facebook が恋しくなります。


したがって、私たちは次世代のコンピューティング プラットフォーム、つまり複合現実技術を形成しており、そこではオープンソース ソフトウェアがより大きな価値を取り戻すだろうと彼は自信を持って述べました。

次世代のプラットフォームとエコシステムは、完全に閉鎖的な Apple ではなく、以前の Windows や Android のエコシステムと同様に、よりオープンで包括的なものになります。

「オープンソースを再び偉大なものにしたい」というこの野心は、Llama 3.1 がリリースされたときの彼の比喩を人々に思い出させます - Llama 3.1 はこの時代の Linux です。

CEOになるのは簡単ではない

会話を通じて、二人はお互いに非常に共感し合い、CEOとしてのキャリアの難しさについてよく話し合った。

革のジャケットを着た61歳のジェンセンは、真剣な顔で自分を繊細な花にたとえさえした、「私たちはCEOであり、繊細な花と同じように、多くのサポートが必要です。」

Xiao Zha氏はさらに、「私たちは今、かなりやつれています」とフォローした。

この感情は、2 人の上級創設者が会社で経験した浮き沈みから来ているのかもしれません。

Xiao Zha 氏の見方では、Lao Huang 氏は好意を持たれないというプレッシャーに耐え、コンピューターを「超巨大企業」にし、Nvidia を業界の伝説にすると主張したという。

Lao Huang 氏の見方では、Xiao Zha 氏は Meta を PC からモバイルへ、ソーシャル メディアから VR/AR および AI 研究まで、多くの変革を遂げてきました。

会話の最後に、黄氏は両者の類似点を率直に述べた、「それ(変革)をするのがどれほど難しいかは知っています。私たちは二人とも深刻な打撃を受けてきましたが、これが先駆者となり革新するために必要なことです」 。」

参考文献:

https://www.youtube.com/watch?v=H0WxJ7caZQU

https://www.youtube.com/watch?v=w-cmMcMZoZ4