2024-08-14
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Jin Lei stammt aus dem Aofei-Tempel
Qubits |. Öffentliches Konto QbitAI
Überschlag, großer Überschlag.
Erst heute früh wurde die Google-Version von Her—Zwillinge LiveOffiziell veröffentlicht.
Schließlich handelt es sich offensichtlich um einen Benchmark für OpenAIs GPT-4o, der die Aufmerksamkeit der Technologiekreise auf sich gezogen hat.
In der auf der offiziellen Website veröffentlichten DemoFragen und Antworten zu FotosDie Wirkung der Funktion ist folgende:
Die allgemeine Funktion besteht darin, mit Ihrem Mobiltelefon Fotos von Konzertplakaten zu machen und Gemini den Kalender des Benutzers überprüfen zu lassen, um zu sehen, ob der Zeitplan für die Teilnahme geeignet ist.
Darüber hinaus können Sie auf dieser Grundlage auch eine Reihe weiterer Vorgänge durchführen, darunter die Überprüfung der Fahrpreise zu einem festgelegten Zeitpunkt usw.
Als es jedoch zur Vorführung der Pressekonferenz vor Ort kam, änderte sich der Stil des Gemäldes völlig.
Bitte schauen Sie sich den Videorecorder an:
Videoadresse: https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA
Hmm... Der Gesichtsausdruck des kleinen Bruders ist mit bloßem Auge etwas panisch.
Sogar das bekannte Technologiemedium TechCrunch hat solche Emojis aufgenommen:
Einige Internetnutzer haben sogar den heißen Kommentarmodus aktiviert:
Ich kann meinen Kalender in 10 Sekunden durchsuchen.
Natürlich ist dies heute nur eine kleine Folge von Made by Google.
Weitere Informationen zu Gemini Live finden Sie weiter unten.
Wie bereits erwähnt, sind die Funktionen von Gemini Live und GPT-4o sehr ähnlich.
Neben „Foto-Fragen und Antworten“ kann es auch Gespräche in Echtzeit führen und Gemini sogar während des Antwortvorgangs unterbrechen.
Es versteht sich, dass die Funktionen von Gemini Live derzeit für Advanced-Abonnenten auf dem Android-System verfügbar sind (nur Englisch).
In den kommenden Wochen wird diese Funktion auf weitere Sprachen ausgeweitet und für iOS verfügbar gemacht.
existierenDialoggeräuscheAndererseits wurde Gemini Live gestartet10 ArtenEs stehen neue Sounds zur Auswahl, die folgende Wirkung haben:
Videoadresse: https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA
existierenarbeitenDa Gemini hingegen vollständig in das System integriert ist, kann es durch einfaches Drücken und Halten des Netzschalters oder durch das Sagen von „Hey Google“ aufgerufen werden.
Lassen Sie sich beispielsweise beim Schreiben einer E-Mail von Gemini dabei helfen, ein passendes Bild zu erstellen. Der Effekt ist wie folgt:
Allerdings gibt es in ausländischen Medien gemischte Kritiken zu dieser Funktion.
Zum Beispiel schrieb ein Autor von The VergePersönlicher TestDer später angegebene Titel lautet:
Gemini Live ist schneller als Google, aber umständlicher.
Der konkrete Grund war, dass das Autoradio des Autors während eines dreitägigen Roadtrips plötzlich ausfiel.
Das Finden einer Lösung mit dem ursprünglichen Google Assistant dauerte mindestens fünf Minuten, Gemini Live hingegen nur 15 Sekunden.
Das kontinuierliche Sprechen von Gemini Live während des Gesprächs und die Interaktionsmethode, bei der Benutzer aktiv unterbrechen müssen, sorgten jedoch dafür, dass sich der Autor verlegen fühlte.
Er glaubt:
Die Stimme und die Sprechweise sind so menschlich, dass es mir unangenehm ist, sie zu unterbrechen.
In die Interaktion mit Gemini Live stecken mehr Emotionen, als wenn man es als Werkzeug zur Problemlösung nutzt.
Zufälligerweise für Gemini Live inLaufen Sie in der CloudAuch das Wall Street Journal gab zu diesem Punkt eine scharfe Bewertung ab –
Fortschritte im Dialog, Rückschritte in der Funktionalität.
Auf technischer Ebene handelt es sich bei GPT-4o um ein End-to-End-System, bei Gemini Live ist dies jedoch nach den von Google veröffentlichten Inhalten nicht der Fall.
Stattdessen sind STT-, VAD-, LLM- und TTS-Systeme integriert:
Darüber hinaus erscheint Gemini Live auch in der neuen Pixel-Handyserie von Google.
Einschließlich Pixel 9 Pro Fold, Pixel 9, Pixel 9 Pro und Pixel 9 Pro XL.
In Bezug auf KI-Funktionen haben die Pixel-Telefone von Google eine Funktion namens hinzugefügt"Füge mich hinzu"Funktion.
Mithilfe von Augmented Reality (AR) und KI-Technologie können Charaktere in zwei verschiedenen Fotos „zusammengestopft“ werden.
Obwohl Googles Veröffentlichung von Gemini Live dieses Mal eine Reaktion auf OpenAI GPT-4o ist, können wir seit Beginn der Ära der großen Modelle einen sehr offensichtlichen Trend erkennen –
Google kann mit OpenAI nicht mithalten.
Erstens wurde OpenAI am kritischsten Punkt der Veröffentlichung von ChatGPT zum Pionier, doch Google veröffentlichte anschließend Bard, das diesmal Gemini Live sehr ähnlich war, und stürzte anschließend ab.
In den letzten anderthalb Jahren scheint OpenAI bei der Veröffentlichung aller wichtigen Modelle und Anwendungen führend zu sein.
Andererseits zeigt die Technologie bei Google nicht nur ein langsames Tempo, auch in Bezug auf die öffentliche Meinung hat OpenAI die größte jährliche Veranstaltung von Google (I/O-Konferenz) mit der Nachricht eines Personalwechsels (Ilyas Rücktritt) überschattet.
Warum scheitert Google im Zeitalter der großen Modelle?
In diesem ZusammenhangEhemaliger Google-CEOEric Schmidt (der von 2001 bis 2011 im Amt war) äußerte seine Ansichten in seiner letzten Rede in Stanford:
Google legt großen Wert auf die Work-Life-Balance, indem es den Mitarbeitern beispielsweise ermöglicht, von zu Hause aus zu arbeiten.
Aber in Startups wird wirklich hart gearbeitet.
Videoadresse: https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA
Einige Internetnutzer verbreiteten sogar die Nachricht:
Mein Bruder ist ein Top-KI-Programmierer bei Google. Er hat drei Vollzeitjobs und verbringt nur zwei Stunden am Tag bei Google.
Was denken Sie darüber? Bitte hinterlassen Sie eine Nachricht im Kommentarbereich, um darüber zu diskutieren.
Referenzlinks:
[1]https://x.com/techcrunch/status/1823410187404743131?s=46&t=6eepxw1G6XRQ7VO0ANjJWg
[2]https://x.com/GoogleDeepMind/status/1823409674739437915
[3]https://blog.google/products/gemini/made-by-google-gemini-ai-updates/
[4]https://x.com/alexkehr/status/1823480786349383879?s=46&t=6eepxw1G6XRQ7VO0ANjJWg
[5]https://www.theverge.com/2024/8/13/24219736/gemini-live-hands-on-pixel-event
[6]https://blog.google/products/pixel/google-pixel-9-new-ai-features/#pixel9phones