Nachricht

Wurde bei der Entwicklung der Plüschtiere eine KI-Anwendung eingesetzt?

2024-07-22

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Autor|Huang Nan

Herausgeber|Yuan Silai

Haben Sie sich als Kind jemals vorgestellt, in der Welt von „Toy Story“ zu leben?

An seiner Seite stehen der treue und mutige Woody, Buzz Lightyear, der die Erde retten will, die enthusiastische und fröhliche Tris und das lustige und süße Paar Eggman ... Als engste Spielkameraden aus Kindertagen haben sie miterlebt, wie er ein treuer Zuhörer war viele wichtige Momente. Das einzige Bedauern ist, dass es nicht sprechen kann, sodass die Interaktion nur in einem einzigen Thread bleiben kann.

Heutzutage beheben große Modelle dieses Manko.

Hard Krypton ist kürzlich mit „Haivivi“ (englischer Name: Haivivi) in Kontakt gekommen. Das Unternehmen hat sein erstes KI-Hardwareprodukt BubblePal herausgebracht, das auf KI-nativen und selbst entwickelten Emotionsmodellen basiert, um Plüschtieren die Möglichkeit zur Interaktion zu geben mit Kindern.

BubblePal hat die Form einer halbkreisförmigen Blase und besteht aus essbarem Silikon. Mit nur einem Fingertipp leuchtet das in der Blase eingebettete Gerät auf, empfängt Dialogeingaben vom Benutzer und generiert auf der Grundlage des Dialogs relevante Antworten.


Das erste KI-Hardwareprodukt von „Yueran Innovation“ – BubblePal

Im vergangenen Jahr lässt sich die Erforschung nativer KI-Anwendungen und großer Modellprodukte in der Branche im Allgemeinen in zwei Kategorien einteilen: Die eine ist für B-Kunden, die Verbesserung der Arbeitseffizienz und die Reduzierung der Kosten durch die Teilnahme an Produktionsverbindungen und die Vereinfachung von Arbeitsabläufen Für C-Szenarien wie das Schreiben von Artikeln, Zeichnungen, das Verfassen von Spieltexten, die Erstellung von Drehbüchern für Film und Fernsehen usw.

Unter ihnen haben B-Side-Kunden eine geringe Toleranz gegenüber KI-generierten Inhalten, haben aber extrem hohe Genauigkeits- und Effizienzanforderungen. In tatsächlichen Anwendungen haben KI-native Anwendungen noch keinen signifikanten Sprung gebracht. Größere Chancen bietet dagegen der C-End-Markt, der durch die Unterhaltungsindustrie und Pan-Entertainment-Szenen repräsentiert wird.

Als KI-Begleitprodukt, das Software und Hardware integriert, konzentriert sich „Yueran Innovation“ BubblePal auf die Unterhaltungsbranche für Kinder und ist einzigartig unter vielen heimischen KI-nativen Anwendungen für B-Ends.

Derzeit hat „Yueran Innovation“ drei Finanzierungsrunden in Höhe von mehreren zehn Millionen Yuan abgeschlossen. Zu den Investoren gehören Lanchi Capital, Gao Bingqiang und Li Zexiangs Fonds. Dies ist auch das bisher größte Einzelinvestitionsprojekt von Professor Gao Bingqiang.

Emotionen spielen mehrere Rollen

BubblePal schlägt vor, AIGC zu nutzen, um auf jede Laune von Kindern zu reagieren. In Bezug auf die Produktform integriert BubblePal die Hardware-Optik „erfrischend innovativ“ und nutzt kindliche „Zauberblasen“, die ihm die Fähigkeit verleihen, zu denken und zu sprechen wechselseitige Interaktion.


BubblePal-Produktbild

Verschiedene Kinder mögen unterschiedliche Spielzeugcharaktere. Im APP-Backend können Benutzer verschiedene Charaktere erstellen, z. B. Elsa und Olaf aus „Frozen“, Woody und Buzz Lightyear aus „Toy Story“ und „Bargain Marines“. usw. in "; entsprechend den Unterschieden in den von Benutzern erstellten Zeichen weisen die von BubblePal generierten Antworten auch die Attribute unterschiedlicher Zeichen auf.

Während des Interaktionsprozesses können Eltern zunächst eine Rolle auswählen und personalisierte Präferenzen hinzufügen, z. B. den Wunsch, ihre Kinder beim Lernen anzuleiten, weitere Fragen zu stellen, Englisch zu üben usw. Bei nachfolgenden Chats wird BubblePal bewusst relevante Inhalte im Gespräch ausgeben.


Haivivi Pal APP-Konversationsseite

Gao Feng, Mitbegründer und COO von „Yueran Innovation“, zeigte Hard Krypton während des Interviews einen Fall: Teddy wurde gebeten, den Mut von Kindern zu fördern, und gab Anweisungen zum Geschichtenerzählen, und Teddy ergriff die Initiative, eine Geschichte über Abenteuer zu entwickeln im Wald. Und geben Sie eine ermutigendere Sprache aus, um das Selbstvertrauen der Kinder zu fördern.

Natürlich kann KI-Hardware mit ausschließlich generativen Fähigkeiten die hohen emotionalen Bedürfnisse von Kindern nicht erfüllen. Um das Produkt intelligenter und für Kinderbegleitungsszenarien geeigneter zu machen, übernimmt „Yueran Innovation“ eine zweischichtige Modellidee des großen Modells + kleines Modell auf der technischen Route.

„Yueran Innovation“ ist mit den gängigen Großmodellprodukten auf dem Markt verbunden und das Großmodell bietet Generierungs- und logische Argumentationsfunktionen. Da jedes Modell in verschiedenen Dingen gut ist, kann BubblePal die großen Modelle der oberen Ebene flexibel verteilen und aufrufen, z. B. Weisheit zum Erzählen von Geschichten verwenden, Sitzsäcke zum Spielen verwenden usw. Sie können nicht nur gemeinsam mit Ihren Kindern Geschichten erfinden, sondern auch basierend auf der Langtext-Dialogfähigkeit des großen Modells die „gemeinsamen Erinnerungen“ zwischen Spielzeug und Kindern bewahren, um eine kontinuierliche Kameradschaft und gemeinsames Wachstum zu erreichen.

Was kleine Modelle bieten, ist emotionaler Wert. Das „Yueran Innovation“-Team versorgte das Modell in der frühen Phase mit einer großen Menge an Kinderbüchern, Märchen, Cartoons und anderen Materialien und konnte so die Wahrnehmung und den Ausdruck von Kindern verstehen. Gleichzeitig kann dieses emotionale Modell nach dem Training die emotionalen Schwankungen von Kindern im interaktiven Zustand besser erkennen, ob sie glücklich, deprimiert, wütend usw. sind. Indem das emotionale Modell in den Vordergrund gestellt wird, wenn das große Modell Inhalte generiert, das kleine Modell Es wird verarbeitet und eine Antwort ausgegeben, die zur aktuellen Situation passt.

Noch wichtiger ist, dass KI-Hardwareprodukte mit dem Problem der Reaktionsverzögerung konfrontiert sind. Bei der Interaktion kann das große Modell direkt Text generieren. Damit BubblePal jedoch antworten kann, muss der Text in Sprache umgewandelt werden.

Daher führt das Emotionsmodell während der Sprachkonvertierung eine segmentierte Verarbeitung basierend auf den Antworten des großen Modells durch, um Probleme mit intermittierenden Antworten zu vermeiden und die Benutzererfahrung zu beeinträchtigen.

Hard Krypton erfuhr, dass „Yueran Innovation“ im Vorfeld umfangreiche Marktforschungen durchgeführt hat, um das interessante Feedback in verschiedenen Szenarien zu erhöhen und sich dabei auf gängige Rollenspiele für Kinder wie Lehrer-Schüler, Arzt-Patient, Koch- Kunde, Waldabenteuer usw. Das Modell wurde weiter trainiert und optimiert.

BubblePal wird Ende dieses Monats auf inländischen E-Commerce-Plattformen zum Preis von 499 Yuan verkauft, während „Yueran Innovation“ im Ausland über unabhängige Websites, Amazon und andere Plattformen verkauft wird.

AI Friends-Begleiterkommunikation

Mit dem Segen großer Modelle dringen Kinderspielzeugbahnen in völlig neuer Form in das Leben der Menschen ein.

Die beiden Gründer von „Yueran Innovation“, Li Yong und Gao Feng, haben zuvor für Smartisan Technology gearbeitet, und iQiyi war Partner von Tmall Elf. Die beiden verfügen über umfangreiche Produkterfahrung in den Bereichen Internet und intelligente Hardware.

Im Jahr 2020 entdeckte Li Yong, dass Kinder viel länger mit Tmall Genie interagieren als Erwachsene. Zu diesem Zeitpunkt betrug das Verkaufsvolumen von Tmall Genie etwa 30 Millionen Einheiten. Wenn ein Produkt speziell für die KI-Interaktion von Kindern bereitgestellt werden kann, ist sein Marktanteil nicht zu unterschätzen.

Nach vier Jahren der Keimung wurde diese Idee schließlich bei „Yueran Innovation“ verwirklicht.

Der menschliche Dialog kann in drei Kategorien unterteilt werden: Dialog mit Aufwärtsperspektive, Dialog mit Parallelperspektive und Dialog mit Abwärtsperspektive. Das heißt, gegenüber dem Objekt der Bewunderung ist unser Ton oft aus einer nach oben gerichteten Perspektive; wenn wir unser Herz offenbaren, ist dies aus einer parallelen Perspektive gegenüber denen, die Dienste und Werkzeuge bereitstellen; unser Dialog ist mehr aus einer Abwärtsperspektive.

Beispielsweise blieb die Interaktion zwischen Menschen und Maschinen in der Vergangenheit bei intelligenten Lautsprechern und Point-Reading-Maschinenprodukten, die von Tmall Elf und Xiaodu vertreten werden, in der Aufgabenphase Aufgaben innerhalb eines begrenzten Bereichs, z. B. das Abspielen einer Songliste, das Einschalten eines fegenden Roboters usw. Bei dieser Art von Dialog handelt es sich um einen nach unten gerichteten Dialog.

„Es ist nicht in der Lage, einen kontinuierlichen Dialog, eine kontinuierliche Interaktion und emotionale Begleitung mit Kindern zu führen. Es versteht nicht, was Emotionen sind, und es hat keine Möglichkeit, die Lieblingsverhaltensweisen von Kindern bei der Objektgenerierung nachzuahmen. Daher nennt man das, was es ausführt, ‚Befehle‘. . Vorwärts gehen bedeutet vorwärts gehen. „Geh, mach das Licht an, mach das Licht an.“

Im Gegensatz dazu können KI-native Kinderspielzeuge die Werkzeugattribute eliminieren und sich auf die emotionale Kameradschaft selbst konzentrieren. Das große Modell kombiniert den technischen Weg des kleinen Modells, sodass es als KI in der Lage ist, Emotionen zu erfassen, zu verstehen und zu melden Freundescharakter, es kann menschlicher sein, auf standardisierte und parallele Weise mit Menschen zu kommunizieren.

Beim Erzählen von Geschichten werfen Kinder beispielsweise oft lächerliche Fragen auf, wie zum Beispiel „Warum wachsen Äpfel auf Bäumen, aber nicht im Wasser?“ „Gibt es einen Oktopus?“ bald. Intelligente Lautsprecher können solche Fragen nicht beantworten, aber basierend auf großen Modellen kann BubblePal tief in die Entstehung von Geschichten eingreifen und mit Kindern eine fantasievolle Welt aufbauen.


KI-generierter Story-Dialog

Gao Feng sagte gegenüber Hard Krypton, dass der Wechsel vom Kinderspielzeugbereich zum KI-Hardwarebereich derzeit mehrere Vorteile mit sich bringt. Einerseits sind die von der KI generierten Inhalte offen und kreativ, sie werden jedoch von der Illusion großer Modelle beeinflusst, was zu Problemen wie geringer Kontrollierbarkeit und mangelnder Interpretierbarkeit führt. Sie eignen sich sehr gut für interaktive Bildungsszenarien für Kinder, die Spaß machen und die Fantasie anregen, die Anwendung hat inhärente Vorteile.

Andererseits verfügt China über starke Lieferkettenvorteile im Bereich der Hardware-Herstellung, vertreten durch „Yueran Innovation“. Derzeit hat das Unternehmen mit mehreren führenden Herstellern zusammengearbeitet, und der Produktionszyklus kann in etwa 30 Tagen abgeschlossen werden.

Darüber hinaus zielen Kinderspielzeuge im Vergleich zu großen vertikalen Bereichen wie Finanzen, Recht und Bildung auf verfeinerte Bereiche ab. Dies ist oft kein Bereich, auf den sich führende Unternehmen konzentrieren und in dem sie nicht gut sind mehr Startmöglichkeiten. Besetzen Sie bei Wind schnell eine Anhöhe.

Gao Feng gab bekannt, dass nach kurzfristigen Tests von BubblePal die maximale Benutzernutzungszeit 6 Stunden/Tag erreichen kann und die durchschnittliche tägliche Nutzungszeit etwa 2 Stunden beträgt.

In Zukunft wird „Yueran Innovation“ die Open-Source-Funktionalität seiner KI-Modellalgorithmen in Betracht ziehen, um grundlegende Plattformfunktionen für andere Kinderspielzeughersteller bereitzustellen und gemeinsam ein intelligentes Spielzeugökosystem in der AGI-Ära aufzubauen.