nachricht

auf der servicemesse wurde das erste heimische großmodell mit „augen“ vorgestellt

2024-09-13

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

das inländische großmodell öffnete erfolgreich die „augen“, und zhipu ai (beijing zhipu huazhang technology co., ltd.) demonstrierte die neueste klare version auf der china international fair for trade in services 2024 (im folgenden „messe“ genannt), die am eröffnet wurde 12. september. funktion „videoanruf“ der yan-app. es wird berichtet, dass dies die weltweit erste groß angelegte videoanruffunktion ist, die öffentlichen benutzern zugänglich ist.
berichten zufolge umfasst die videoanruffunktion von qingyan drei hauptmodi: text, audio und video und verfügt über echtzeit-argumentationsfähigkeiten. benutzer können die kamera einschalten und über das videoanruffenster mit qingyan kommunizieren. qingyan kann nicht nur den bildschirm des benutzers „sehen“, sondern auch anweisungen verstehen und genau ausführen und auch bei häufigen unterbrechungen schnell reagieren. durch die hervorhebung der wichtigsten punkte auf dem bildschirm kann qingyan auch verstehen, worauf sich der benutzer konzentrieren möchte.
bieten sie hausaufgabenhilfe an.
zhipu ai gab an, dass gpt-4o zuvor die sprachfunktion eingeführt, die videofunktion jedoch nicht für die öffentlichkeit zugänglich gemacht habe. mit qingyan können sie die modernste ki-/großmodelltechnologie erleben. in der vergangenheit erfolgte die interaktion mit ki hauptsächlich in form von texten. mit der videofunktion können sich benutzer von langen textaufforderungen verabschieden und reibungslos mit ki kommunizieren. qingyan ist wie ein menschlicher assistent mit vision und verständnis für den benutzer. solange die kamera ein bild aufnimmt, kennt die ki die umgebung des benutzers und weiß, was die ki tun soll anweisungen.
inländisches großmodell öffnet erfolgreich „augen“.
die qingyan-videoanruffunktion kann auch in einen tragbaren englischübersetzer umgewandelt werden, der eine sofortige übersetzung zwischen chinesisch und englisch realisieren, englischgespräche basierend auf den umgebungsinformationen des benutzers führen und dabei helfen kann, aussprache- und grammatikfehler des benutzers zu korrigieren. zu den verwendungsszenarien dieser funktion gehören das erklären der geschichten über malerische orte zu jeder zeit auf reisen, das erkennen der umgebung für sehbehinderte usw. sie kann auch nachhilfe bei hausaufgaben und interviewführung bieten, protokolle und zusammenfassungen in besprechungen vervollständigen und komplexe daten analysieren diagramme und interpretieren computer in echtzeit bildschirmcode.
auf dieser dienstleistungsmesse wird zhipu ai eine vielzahl seiner neuesten produkte vorstellen. zusätzlich zur videoanruffunktion der qingyan-app ist auch eine ki-generierte videofunktion enthalten. zhipu hat anfang des jahres das videogenerierungsmodell cogvideox eingeführt und die „qingying“-funktion zur videogenerierung in der zhipu qingyan-app eingeführt. qingying steht allen benutzern offen. geben sie einfach text ein oder laden sie ein bild hoch, und schon kann innerhalb von 30 sekunden ein 6-sekunden-video erstellt werden. im juli dieses jahres startete qingying die qingyan-app, und die nutzer generierten in sechs tagen mehr als 1 million videos.
der zeitungsreporter zhang jing
(dieser artikel stammt von the paper. für weitere originalinformationen laden sie bitte die „the paper“-app herunter.)
bericht/feedback