ニュース

国内初の「目」付き大型モデルをサービス見本市でお披露目

2024-09-13

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

国内の大型モデルは「目」のロックを解除することに成功し、zhipu ai (北京芝埔華庄科技有限公司) は 2024 年中国国際サービス貿易交易会 (以下、サービス貿易交易会) で最新のクリアバージョンをデモンストレーションしました)が9月12日にオープンしたヤンアプリの「ビデオ通話」機能。一般ユーザーに公開された大規模なビデオ通話機能は世界初だという。
レポートによると、qingyan のビデオ通話機能はテキスト、オーディオ、ビデオの 3 つの主要なモードにまたがっており、リアルタイム推論機能を備えています。ユーザーはカメラをオンにし、ビデオ通話ウィンドウを通じて qingyan と通信できます。qingyan はユーザーの画面を「見る」だけでなく、指示を理解して正確に実行することができ、頻繁に中断された場合でも迅速に応答できます。 qingyan は、画面上の重要なポイントを強調表示することで、ユーザーが何に注目してほしいかを理解することもできます。
宿題のお手伝いをします。
zhipu aiは、gpt-4oは以前に音声機能を公開していたが、qingyanを使用することで最先端のai/大型モデル技術を体験できると述べた。これまでaiとのやり取りはテキスト形式が主流でしたが、ビデオ機能を利用することで、ユーザーは長文のプロンプトに別れを告げ、aiとスムーズにコミュニケーションできるようになります。 qingyan は、ユーザーの周囲を理解し、視覚を備えた人間のアシスタントのようなものです。カメラが写真を撮る限り、ai はユーザーの環境と ai に何をしてもらいたいかを認識します。ユーザーは口頭で伝えるだけで済みます。説明書。
国産大型モデルが「目」のロックを解除することに成功。
qingyan のビデオ通話機能は、ポータブル英語翻訳機としても使用でき、中国語と英語の間で即時翻訳を実現し、ユーザーの環境情報に基づいて英会話を行い、ユーザーの発音や文法上の誤りを修正するのに役立ちます。この機能の使用シナリオには、旅行中にいつでも景勝地のストーリーを伝える、視覚障害者のための環境を特定するなどが含まれます。また、科目の宿題指導や面接指導、会議の議事録や要約の作成、複雑なデータの分析も提供できます。チャートを作成し、コンピューターの画面コードをリアルタイムで解釈します。
このサービス見本市では、zhipu ai はさまざまな最新製品を展示します。 qingyan appのビデオ通話機能に加えて、aiが生成したビデオ機能も含まれています。 zhipu は今年初めにビデオ生成モデル cogvideox をリリースし、zhipu qingyan アプリでビデオ生成の「qingying」機能を開始しました。 qingying はすべてのユーザーに公開されており、テキストを入力するか写真をアップロードするだけで、6 秒のビデオが 30 秒以内に生成されます。今年 7 月、qingying は qingyan アプリをリリースし、ユーザーは 6 日間で 100 万本以上のビデオを生成しました。
ザ・ペーパー記者の張晶
(この記事はthe paperからのものです。よりオリジナルの情報については、「the paper」アプリをダウンロードしてください)
レポート/フィードバック