Nachricht

Über Nacht wurden Googles Version von GPT-4o und AI-Telefone auf den Markt gebracht

2024-08-14

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Maschinenherzbericht

Herausgeber: Zenan, Chen Chen

Gemini Live-Benchmarks GPT-4o und Google AI-Mobiltelefonfamilien-Bucket ist online.

Bevor GPT-4o auf das iPhone kam, übernahm Google Gemini die Führung und stellte die mobile Version fertig.

Am frühen Morgen des Mittwochs, als sich die Leute auf das OpenAI „Strawberry Big Model“ freuten, veröffentlichte Google auf der Made by Google-Veranstaltung offiziell Gemini Live und eine Reihe von Pixel-Hardwareprodukten.



Bei der heutigen Veranstaltung führte Google eine 100 %ige Live-Demonstration mit Zuversicht durch, obwohl es einige kleinere Probleme gab.



Ich habe zweimal versucht, mein Telefon zum Lesen von Bildern zu verwenden (aber ich habe ein Samsung verwendet), beide Male ist es fehlgeschlagen.

Aber wie Google sagt, sind wir in die „Zwillings-Ära“ eingetreten.

Nach der Pixel-9-Serie wird eine Reihe der heute veröffentlichten Gemini-KI-Funktionen auch auf verschiedenen Android-Handys mit Android 15 erscheinen.

Gemini Live: Benchmarken Sie GPT-4o und gehen Sie sofort online

Gemini Live ist ein von Google für den erweiterten Sprachmodus von OpenAI eingeführtes Produkt. Diese Funktion ist fast identisch mit ChatGPT und befand sich bereits in der Alpha-Testphase.



Gemini Live bietet ein mobiles Gesprächserlebnis, das es Benutzern ermöglicht, ungehinderte Gespräche mit Gemini zu führen und sogar das Thema wie bei einem normalen Telefonanruf zu unterbrechen oder zu wechseln, ohne etwas eintippen zu müssen.

Google beschreibt es in einem Blog: Sie können mit Gemini Live sprechen (über die Gemini-App) und einen von 10 neuen natürlichen Klängen auswählen, auf die Sie reagieren möchten (OpenAI bietet nur 3 Klänge). Sie können sogar in Ihrem eigenen Tempo sprechen oder mitten in der Antwort unterbrechen und zusätzliche Fragen stellen, genau wie in einem normalen Gespräch.



视频链接:https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650930230&idx=2&sn=822b96951da8ef70408c0c546c6c5ae5&chksm=84e43848b393b15e3 20f663d6c311ccab54157b0885da6dee24ce8e5260beed4153dfb2a432a&token=2010422951&lang=zh_CN#rd

Gemini Live kann direkt aktiviert werden. Sie können weiterhin mit Gemini sprechen, wenn die Anwendung im Hintergrund läuft oder das Telefon gesperrt ist, und das Gespräch kann jederzeit angehalten und fortgesetzt werden.

Gemini Live wird außerdem in verschiedene Android-Anwendungsfunktionen (z. B. Keep) integriert, wodurch die Benutzerfreundlichkeit von Gemini verbessert wird.



Ab heute führt Google diese Funktion für Gemini Advanced-Benutzer von Android-Telefonen nur auf Englisch ein und wird sie in den kommenden Wochen auf iOS und weitere Sprachen ausweiten.



Während der Live-Demonstration scheiterte Gemini Live jedoch zweimal, als das Personal vor Ort nach Informationen zum Konzertplakat fragte und der Moderator sein Telefon wechseln musste, damit es ordnungsgemäß funktionierte. Obwohl es während der Demo zu einigen Problemen kam, war sie letztendlich erfolgreich und Gemini Live extrahierte schließlich relevante Informationen aus den Bildern und stellte eine Verbindung zum Kalender her, um den Benutzern genaue Ergebnisse zu liefern.



视频链接:https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650930230&idx=2&sn=822b96951da8ef70408c0c546c6c5ae5&chksm=84e43848b393b15e3 20f663d6c311ccab54157b0885da6dee24ce8e5260beed4153dfb2a432a&token=2010422951&lang=zh_CN#rd

Es ist erwähnenswert, dass Google laut Produktmanager Leland Rechis Gemini Live nicht erlaubt, andere Sounds als diese 10 Sounds zu imitieren. Google hat dies möglicherweise getan, um nicht gegen Urheberrechtsgesetze zu verstoßen. Zuvor wurde OpenAI von letzterem wegen Verwendung der Witwenstimme verklagt.

Insgesamt scheint die Funktion eine großartige Möglichkeit zu sein, tiefer in ein Thema einzutauchen, natürlicher als mit einer einfachen Google-Suche. Google stellt fest, dass Gemini Live ein Fortschritt für Project Astra ist, das multimodale KI-Modell, das das Unternehmen während der Google I/O vorgestellt hat. Derzeit unterstützt Gemini Live nur Sprachgespräche und Google hofft, in Zukunft Funktionen zum Verstehen von Videos in Echtzeit hinzufügen zu können.

Chip-Segen, Google-Hardware kommt

Gleichzeitig mit der Einführung von Gemini Live brachte Google früher als Apple und Huawei eine neue Generation intelligenter Hardwaregeräte auf den Markt.

Die heute Morgen neu veröffentlichte Hardware umfasst Pixel 9, Pixel 9 Pro und Pixel 9 Pro XL sowie ein Faltbildschirm-Telefon Pixel 9 Pro Fold. Sie werden alle vom neuen Google Tensor G4-Chip angetrieben, der verschiedene generative KI-Fähigkeiten mit sich bringen kann .

Pixel 9-Telefone verfügen über ein neues Erscheinungsbild, das die Kamera in den Vordergrund und in die Mitte rückt, wodurch das ikonische Kameramodul verbessert und das Gefühl in der Hand verbessert wird. Google behauptet, diese Telefone seien doppelt so langlebig wie das Pixel 8.



Diesmal sind Pixel Pro-Modelle erstmals in zwei verschiedenen Größen erhältlich: Pixel 9 Pro (6,3 Zoll) und Pixel 9 Pro XL (6,8 Zoll), beide ausgestattet mit Super Actua-Displays und 42-MP-Frontkameras. Abgesehen von Displaygröße, Ladegeschwindigkeit und Akku haben Pixel 9 Pro und Pixel 9 Pro XL identische Spezifikationen und Funktionen.



Es ist erwähnenswert, dass das Pixel 9-Mobiltelefon den neuen benutzerdefinierten Tensor G4-Chip von Google verwendet. Dabei handelt es sich um eine neue Generation von Hochleistungs-Mobiltelefonchips, die alltägliche Anwendungsfälle verbessern sollen, etwa das schnellere Öffnen von Apps, das Surfen im Internet und vieles mehr.



Tensor G4 wurde von Google DeepMind entwickelt, von Samsung hergestellt und nutzt die Arm-Architektur. G4 ist für die Ausführung der fortschrittlichsten Modelle der künstlichen Intelligenz optimiert. Es wird der erste Prozessor sein, der das multimodale Gemini-Nano-Modell ausführt und es großen Modellen ermöglicht, Aufgaben wie Text, Bilder und Audio nur auf der Mobiltelefonseite zu verstehen.



Den aktuellen Nachrichten zufolge ist Tensor G4 derselbe wie sein Vorgänger und verwendet denselben Kern wie die Technologie der aktuellen Generation – was bedeutet, dass er im September bald zu einem rückständigen Chipsatz wird. Der statische GPU-Kern namens Mali bedeutet auch, dass Raytracing nicht der Fall ist unterstützt (die unterstützte Version heißt Immortalis). Trotzdem ist die Leistungssteigerung gegenüber dem Produkt der vorherigen Generation im Vergleich zu mir immer noch beträchtlich.

Natürlich verfügt Tensor G4 als von DeepMind entwickelter Chip über eine gute KI-Rechenleistung. Google gab an, dass er eine „branchenführende“ Ausgabegeschwindigkeit von 45 Token pro Sekunde hat.

Damit das KI-Erlebnis auf dem Gerät reibungslos funktioniert, hat Google auch den Speicher der Pixel-9-Serie aufgerüstet, der mit 12 GB RAM ausgestattet ist, und das Pixel 9 Pro und Pixel 9 Pro XL verfügen über 16 GB RAM.

Die Pixel-Serie war schon immer der Maßstab für Googles Technologieanwendungen. Die neuen Telefone sind mit Gemini Live ausgestattet und werden im August in den Handel kommen. Google sagte, dass Benutzer von Pixel 9 Pro, Pixel 9 Pro XL und Pixel 9 Pro Fold nach dem Kauf des Telefons ein einjähriges Gemini Advanced-Abonnement genießen können. Es scheint, dass Google im Vergleich zu den mit OpenAI ausgestatteten Großmodellen der iPhone 16-Serie diesmal einen Schritt voraus ist.

Google hat eine Reihe generativer KI-Funktionen für Pixel eingeführt.

Unter anderem kann Pixel Studio Ihnen dabei helfen, Ideen auf Ihrem Telefon in Bilder umzuwandeln. Es besteht aus einem geräteseitigen Diffusionsmodell, das auf Tensor G4 läuft, und einem Imagen 3-Text-zu-Bild-Modell in der Cloud.



Googles neues Bildmodell Imagen 3 wurde erstmals auf der I/O-Konferenz im Mai vorgestellt. Das Modell wurde hinsichtlich der Generierung von Details, Beleuchtung, Interferenzen usw. optimiert und verbessert und seine Fähigkeit, Eingabeaufforderungen zu verstehen, wurde erheblich verbessert. Mit der heutigen Pressekonferenz hat Google DeepMind ein Imagen 3-Papier auf arXiv eingereicht:



  • Link zum Papier: https://arxiv.org/abs/2408.07009

Mit Pixel Screenshots können Sie wichtige Informationen, die Sie sich für später merken möchten, speichern, organisieren und abrufen.

Nehmen wir an, Sie haben eine Freundin, die Eichhörnchen liebt und bald Geburtstag hat. Sie können auf Google Chrome nach Geschenken suchen und Screenshots von Eichhörnchen-Shirts, Eichhörnchen-Untersetzern und allem, was mit Eichhörnchen zu tun hat, machen. Pixel Screenshots analysiert den Inhalt all dieser Bilder und hilft Ihnen bei der Suche nach diesen Informationen in Ihrer App. Dann öffnen Sie einfach die App und suchen nach „Eichhörnchen“ und die Ergebnisse werden angezeigt. Es enthält außerdem Links zu allem, was Sie finden, sowie eine Zusammenfassung und zugehörige Informationen zu den Inhalten, die Sie gerade ansehen.



Eines der häufigsten Dinge, die Menschen auf ihren Handys tun, ist, das Wetter zu überprüfen. Pixel Weather kann genauere Wetterinformationen liefern, und Gemini Nano generiert außerdem benutzerdefinierte KI-Wetterberichte, damit die Menschen die Wetterbedingungen des Tages verstehen.

Was das Aufnehmen von Bildern betrifft, die alle Mobiltelefone erfordern, fügt Pixel 9 KI-Aufnahmefunktionen hinzu, um die Effizienz der Filmproduktion zu verbessern.

Auf Gruppenfotos fehlt oft ein ausgewiesener Fotograf. Mit „Add Me“ können Sie mit jedem im Raum Fotos machen, ohne ein Stativ tragen oder Fremde um Hilfe bitten zu müssen.



Mit dem neu gestalteten Panorama können Sie jetzt auch bei schlechten Lichtverhältnissen detaillierte Fotos aufnehmen. Dies ist das qualitativ hochwertigste Low-Light-Panorama, das auf jedem Smartphone verfügbar ist.



Darüber hinaus verfügt der Magic Editor in Google Fotos über neue Bearbeitungsfunktionen, mit denen Sie das gewünschte Foto aufnehmen können. Die automatische Rahmenfunktion kann das Foto neu zusammenstellen und Sie müssen nur das eingeben, was Sie sehen möchten (z. B. Wildblumen in ein leeres Feld einfügen). Feld) Das heißt, Sie können Fotos neu zusammenstellen und Ideen in die Realität umsetzen.

Die intelligente Anrufaufzeichnung großer Modelle ist jetzt auch in das Android-System integriert. Die Clear Calling-Funktion verbessert die Audioqualität weiter und die neue Anrufnotizen-Funktion sendet eine private Zusammenfassung und ein vollständiges Anrufprotokoll, sobald der Benutzer auflegt. Wenn Sie also einen Rückruf erhalten, müssen Sie nicht mehr nach Papier und Stift suchen, um sich Notizen zu machen. Zum Schutz der Privatsphäre erfolgt die Anrufaufzeichnung vollständig auf dem Gerät.



Die neuesten Pixel 9-Geräte sind die ersten Android-Telefone, die über die neue Satelliten-SOS-Funktion verfügen, sodass Benutzer Notfallhelfer kontaktieren und ihren Standort über Satellit teilen können, auch wenn kein Mobilfunknetz verfügbar ist. Satellite SOS wird unabhängig von Ihrem Mobilfunkanbieter zunächst auf Pixel 9-Geräten in den USA verfügbar sein. Diese Funktion wird in den ersten zwei Jahren auf Pixel kostenlos sein.



Schließlich gibt es noch die Preise: Pixel 9, Pixel 9 Pro und Pixel 9 Pro XL sind alle vorbestellbar und beginnen bei 799 $, 999 $ bzw. 1.099 $. Pixel 9 und Pixel 9 Pro XL werden am 22. August im Google Store und bei Google-Einzelhandelspartnern erhältlich sein. Das Pixel 9 Pro wird in den USA am 4. September erhältlich sein, während das Pixel 9 Pro Fold in den kommenden Wochen in anderen Märkten erhältlich sein wird.

Referenzinhalt:

https://blog.google/products/pixel/google-pixel-9-pro-xl/

https://www.androidauthority.com/google-tensor-g4-explained-3466184/