ニュース

Youdi Robot が資本を 3 億 5,000 万に増資、ResNet 作者の Zhang Xiangyu が OpenAI の研究開発に参加すると噂される。

2024-08-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

今日の資金調達ニュース

人工知能チップの新興企業 Groq が Nvidia に対抗するために 6 億 4,000 万米ドルの資金を調達

従来のプロセッサよりも高速に生成AIモデルを実行するチップを開発する新興企業Groqは月曜日、Blackrock主導の新たな資金調達ラウンドで6億4000万ドルを調達したと発表した。 Neuberger Berman、Type One Ventures、Cisco、KDDI、Samsung Catalyst Fundも参加した。

この資金調達により、Groqの資金総額は10億ドル以上となり、同社の評価額は28億ドルとなり、当初は25億ドルという若干低い評価額の調達を望んでいたと伝えられているGroqにとっては大きな勝利となった。

Metaの主任人工知能科学者であるYann LeCun氏はGroq社の技術顧問を務め、Intelのファウンドリ事業の元責任者で元HPのCIOであるStuart Pann氏が最高執行責任者としてスタートアップに加わることになる。

Youdi Robotを株式会社に改組し、資本金を3億5,000万に増資

Youdi Robot (Wuxi) Co., Ltd.は産業および商業上の変更を経て、市場主体の形態が有限会社(香港、マカオ、台湾が出資する非個人事業主)から株式会社に変更されました。 (香港、マカオ、台湾出資、非上場)を設立し、社名をYoudi Robot (Wuxi) Co., Ltd.に変更し、登録資本金を約1,707万9,000人民元から3億5,000万人民元に増額しました。公式ウェブサイトによると、Youdi Technology は配送ロボットのコア技術の応用研究開発と商品化に焦点を当てています。

ロボット工学のスタートアップ DELIVERS.AI は、新たな資金調達ラウンドにより 3,600 万米ドルと評価される

DELIVERS.AI の自律モビリティ プラットフォームは、ラスト マイルの物流を手頃な価格で持続可能なものにするために設計された、高度な AI 駆動の低排出路路上配送ロボットと車両を使用しています。

DELIVERS.AI は 3,600 万米ドルと評価され、金額は非公開ですが新たな資金調達ラウンドを実施しました。英国ワーウィックに拠点を置く同社は、日本郵便キャピタル、トルコ開発基金、ブルガリアの推進資本、イスタンブール工科大学から資金提供を受けました。これまでの投資家には、Driventure、Arz Portföy、StartupFON、Plug and Play Ventures、Inveo Ventures、StartersHUB、Kalyon Ventures が含まれます。

AI主導の宝飾品会社Stepinがエンジェルラウンドファイナンスで数千万元を獲得

Stepin は、AI ジュエリーの国境を越えた e コマースに焦点を当てたジュエリー ブランドで、AI テクノロジーと中国のサプライ チェーンの利点を活用して、「少量の注文で迅速な返品」という迅速な新製品の発売と高売上高モデルを実現しています。 Stepinは、Xinyue CapitalとJijiu Capitalが主導し、他の産業機関とエンジェル投資家が投資に参加し、Inspur Capitalが専属財務アドバイザーとして機能する形で、1000万元のエンジェルラウンドを完了した。現在、Stepin 内での AI の適用は主に創造的な一般化と、デザイナーが微調整するための比較的初歩的な 3D モデルの生成です。 (36クリプトン)

(WeChat の追加へようこそAIyanxishe2さんさんAIGC と資金調達状況について詳しく学び、同じ考えを持つ友人と新しい AI 製品についてチャットしましょう)

今日の大工場の噂

ResNet著者のZhang Xiangyu氏がStep Starに加わるとの噂

Qubit ニュース、90 年代以降の AI 専門家である Zhang Xiangyu が Step Star に加わりました。彼は ResNet の 4 人の著者の 1 人であり、Sun Jian の最初の深層学習博士課程の学生であり、Future Science Award の受賞者でもあります。 Zhang Xiangyu は西安交通大学でソフトウェア エンジニアリングの学士号を取得し、Microsoft Research Asia の Sun Jian、He Kaiming、Ren Shaoqing と共同で ResNet を完成させ、この論文は 2016 年の CVPR Best Paper Award と Future Research を受賞しました。 2023 年に受賞。数学およびコンピューター サイエンスに対する科学賞。

ステップスターは、Zhang Xiangyu 氏に加えて、Tencent Yu Gang 氏と MSRA Duan Nan 氏という 2 人の万音専門家も採用しました。 Yu Gang は山東大学の学部生であり、上海交通大学で修士号を取得し、南洋理工大学で博士号を取得したこともあり、Megvii で働きながら多くの研究成果を上げました。 Duan Nan は MSRA の上級主任研究員であり、主に MSRA で 17 年 9 か月間勤務しており、その研究結果は多くの Microsoft AI 製品に応用されています。

OpenAIはChatGPTテキスト透かしを開発中であることを認めたが、課題に直面している

OpenAIはChatGPTで生成されたテキストを高精度に認識できるツールを開発しましたが、まだリリースされていません。 OpenAIはこれに対し、テキスト透かし技術を研究していることは認めたが、この技術にはまだ多くの課題があると述べた。

OpenAI は、ChatGPT で生成されたテキスト内の単語の選択を微妙に調整することで、目に見えない「デジタル指紋」 (テキストの透かし) を行間に織り込むことを想定しています。この設計の微妙な点は、将来的には特定のツールを使用してテキストの元のソースを簡単に識別および検証できるようになり、著作権保護とコンテンツのトレーサビリティのための新しい道が開かれることです。テキストの透かしは、OpenAI の多様なソリューション マトリックスの一部にすぎません。また、情報源を明確に追跡できるようにするための、包括的なマルチレベルのテキスト ID 認証システムを構築することを目指して、分類器テクノロジとメタデータ戦略を並行して研究しています。

図は、より人間味と強力なハードウェアを備えた第 2 世代の新しい人型ロボットをプレビューします

FigureはFigure 02のトレーラーを公開し、北京時間8月7日に製品を正式にリリースすると述べた。 Open AI GPT4を搭載した図01のビデオデモと比較すると、このデモはハードウェアに焦点が当てられており、ハードウェアの機能が大幅に向上することが期待されます。創設者兼 CEO のブレット・アドコック氏は、「Figure 02 は地球上で最高の人型ロボットです。」と自信を持って語りました。

Google Gemini API の大幅値下げにより GPT-4o mini の半額に

Gemini 1.5 フラッシュ モデルの入力コストは直接半分になり、約 85% 削減され、続いて出力コストも約 80% 削減されました。これは、Gemini API の使用コストが主要な競合製品である GPT-4o mini よりも 50% 近く低くなったことを意味します。 Gemini Flash の新しい価格設定では、入力コストは 100 万トークンあたりわずか 0.075 ドル、出力コストはわずか 0.3 ドルです。 Gemini 1.5 Flash と Gemini 1.5 Pro は現在 100 以上の言語をサポートしており、Google はコンテキスト キャッシュやバッチ API などの革新的なテクノロジーを導入しています。

百川智能と中国人民大学が「大型模型共同研究室」を設立

中国人民大学とBaichuan Intelligenceは、大型モデル技術の革新と開発を促進するために共同で「大型モデル共同研究室」を設立した。共同研究所の設立は、両当事者が大規模モデルの事前トレーニング、位置合わせ、検索強化、エージェント、マルチモダリティなどの最先端技術分野で緊密な協力を実施することを示している。中国人民大学は、大規模モデル研究における才能と技術的優位性を活用し、エンジニアリングおよび製品研究開発におけるバイチュアン・インテリジェントの強みと組み合わせて、関連技術の研究と応用を共同で推進する。

アリババ、ビデオ生成を物理法則とより一致させるために「Sora の軌道制御可能なバージョン」Tora を発売

Tora は、テキスト、視覚、および軌跡の条件を同時に統合してビデオを生成する、初の軌跡指向の DiT アーキテクチャです。 Tora の設計は DiT のスケーラビリティとシームレスに適合し、異なる長さ、アスペクト比、解像度のビデオ コンテンツを正確に制御できます。広範な実験により、Tora は、物理世界の動きを詳細にシミュレートしながら、高いモーション忠実度を達成することに優れていることが証明されました。

メタ社はAI音声プロジェクトについてハリウッドスターと交渉中で、ライセンス取得に数百万ドルを提供する予定だと言われている

関係者の話として報じたメディアの報道によると、メタと一部の俳優の代表者との交渉は、俳優の声の使用条件について両当事者が合意できず、何度も中断と再開を繰り返したという。 Meta は AI ツールを開発するのに十分な時間を確保するために交渉を加速しており、9 月の Connect カンファレンスでリリースしたいと考えています。メタがこれらの音声をどのように使用するかは不明であり、デジタルアシスタントとして機能する可能性が最も高いです。たとえば、ユーザーはオークワフィナの声を持つチャットボットとチャットできます。

今日製品ニュース

プロダクトハントホットリスト、アバターアーキテクト

Avatar Architect は、人工知能と Notion を組み合わせたシステムで、起業家、マーケティング担当者、製品開発者がターゲット顧客グループを深く理解することでマーケティング戦略と販売実績を向上できるように設計されています。また、構築するための一連のツールとガイドも提供します。顧客のポートレートを管理します。

Avatar Architect の強みは、AI による効率性、ターゲット市場に対する深い洞察、製品開発の指針となる詳細な顧客情報にあります。このシステムは、独立した起業家、マーケティング担当者、製品開発者、特に顧客を深く理解し、マーケティング戦略を改善したいと考えている人に適しています。ユーザーはビジネス ニーズに応じてシステムの機能をカスタマイズできますが、最良の結果を得るには顧客データを定期的に更新する必要があります。

https://gcproductivity.gumroad.com/l/avatararchitect/ProductHunt?ref=producthunt

開発者の推奨事項

1. 小さなプログラムコードを簡単に作成するための簡単なヒント LlamaCoder

LlamaCoder は、Llama3.1405B モデルに基づいたプラットフォームであり、その強力な自動化機能により、開発者は簡単な指示を与えるだけで完全な React アプリケーションとコンポーネントを迅速に生成できます。このプラットフォームは、Next.js や Tailwind などの人気のテクノロジーを含む最新のテクノロジー スタックを使用して、美しく使いやすいインターフェイスを提供します。 LlamaCoder の機能設計では、開発効率と製品の最適化を向上させるためのコード サンドボックス、Helicone 統合、Plausible ツールの使用など、あらゆる側面が考慮されています。参入障壁は低く、ユーザーはコード ベースを複製し、npm コマンドを使用してプロジェクトを開始するための API キーを設定するだけで済みます。現在はオープンソースになっています。

https://llamacoder.together.ai/

2.スーパーメモリーパーソナルナレッジベースプロジェクト

このプロジェクトにより、ユーザーは Web ページ、ツイート、メモなどのオンライン情報を保存し、内蔵の人工知能機能を使用して効率的な検索や質問を行うことができます。情報を 2 次元のキャンバスの形式で整理して、ユーザーがナレッジ ポイントをより深く理解し、関連付けることができるようにします。保存データをもとにAIによる書き込み機能を提供します。 Telegram、Twitter、その他のプラットフォームとの統合をサポートします。

github https://github.com/supermemoryai/supermemory

ウェブサイト https://supermemory.ai/onboarding

特別な注意

Jim Fan: ロボット データの増幅はロボット技術の開発を解決する上で重要な課題です

NVIDIA のシニア研究科学者であり、エンボディディッド インテリジェンス部門の責任者であり、エンボディディッド AI (GEAR Labs) の責任者でもあるジム ファン氏は、プロジェクト GR00T の最新の進捗状況を発表し、実際のロボット上で人間を通じてロボット データ セットを増幅する体系的な方法を提案しました。シミュレーション技術と組み合わせることで、データ量を1000倍以上に拡張し、ロボット工学におけるデータボトルネックの問題を解決します。

Apple Vision Pro テクノロジーを利用して、人間のオペレーターによる人型ロボットの一人称制御を実現します。 Vision Pro は、人間の手のジェスチャーをリアルタイムで解析してロボットの手にマッピングすることができるため、オペレーターは別の身体に没頭しているように感じられ、遠隔操作は遅いものの、少量の高品質のデータを収集できます。 。

オープンソースの生成シミュレーション フレームワークである RoboCasa を使用して、環境の外観やレイアウトを変更することで、単一の実世界のデモ データをさまざまな環境に拡張し、それによって大量の多様なデモ データを生成します。これにより、物理的なキッチンのデータを無制限の数のシミュレートされたキッチン シーンに拡張できます。

MimicGen テクノロジーは、人間の生のデモンストレーション データに基づいて多数の新しいアクション軌跡を生成し、失敗した試みを除外するために適用され、その結果、より大規模で豊富なデータ セットが得られます。

この方法により、人間の軌跡から開始して、RoboCasa は N 個の異なる視覚効果のデータを生成でき、MimicGen はそれをさらに NxM の異なるアクションのデータに拡張します。このアプローチは、GPU 高速化シミュレーションを通じてコン​​ピューティング能力を犠牲にして高価な人間のデータ収集の問題を解決し、原子の世界に限定されていた従来のデータ収集の障壁を打ち破ります。

https://x.com/DrJimFan/status/1818302152982343983

明日の最新ニュースをお楽しみに

AI諜報局は、独占的な貴重な手がかりを収集するための諜報パートナーを募集しています!最新の AI の成果、業界のインサイダー情報、ユニークな製品に関する情報を提供していただける場合は、運用 WeChat アカウントを追加してください。AIyanxishe2さんさん業界の立場に注目してください。

Google、CharacterAIを25億ドル以上で買収、Nvidia AIチップに重大な設計上の欠陥が発覚、数百億ドルの受注に影響丨AI諜報局

Eston Robot が 4 億 5,000 万元の増資を受け、AI 専門家の周志華氏が南京大学の副学長に任命されました。スタンフォードのオンライン論文プラットフォームは人気丨AI Intelligence Agency

スターダスト・インテリジェンスは、AI ロボットの商業化に注力するために数千万ドルの資金提供を受けました。OpenAI は GPT-4o 音声を部分的に開放し、今秋にはすべての有料ユーザーに拡張されます丨AI Intelligence Bureau