Nachricht

Gemini ist auf dem Handy! Googles Pixel 9 profitiert von den Futures von Apple und OpenAI

2024-08-14

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Autorin|Jessica
E-Mail |. [email protected]

Heute früh hielt Google in seinem Hauptsitz in Mountain View im Silicon Valley die Konferenz „Made by Google 2024“ ab. Diese jährliche Veranstaltung, die wie üblich im Oktober stattfinden sollte, wurde Berichten zufolge auf den Sommer verschoben, um die Öffentlichkeit im Voraus zu treffen und so zu vermeiden, dass Apple das neue iPhone im September auf den Markt bringt.

Gerüchten zufolge wurden auf der Konferenz Googles neue Generation der Android-Flaggschiffe Pixel 9, Pixel 9 Pro, Pixel 9 Pro XL und die faltbare Bildschirmversion Pixel 9 Pro Fold vorgestellt, zusammen mit den kabellosen Kopfhörern Pixel Buds Pro 2 und den Uhren Pixel Watch 3.

Aber neben neuen Hardware-Produkten ist Googles Obsession und der größte Protagonist im Spiel immer noch die allgegenwärtige KI.


Im offiziellen Werbevideo wird Gemini gebeten, mit dem alten Mobiltelefon einen „Trennungsbrief“ zu schreiben, und es wird das auffällige „Oh Hi, AI“ angezeigt.

Vor zwei Monaten kündigte Apple Apple Intelligence offiziell an und die iPhone 16-Serie kommt als Schlüsselgerät, das vollständig an Apple AI angepasst ist und darauf läuft. OpenAI ist jeden Tag eine Rauchbombe, vom „Q-Projekt“ bis zum „Strawberry“-Ausdruck, der die Menschen in Panik versetzt. Google weiß, dass es nicht länger warten kann: Es hat den neu aktualisierten Gemini-Assistenten und mehr als ein Dutzend neue KI-Funktionen auf Android eingeführt, und sie sind sofort und nicht als Zukunft verfügbar.

Rick Osterloh, der das Plattform- und Geräteteam von Google leitet, schien zu Beginn seiner Rede einem Gegner in den Rücken zu fallen:

„Es gibt so viele Versprechungen über KI und so viele ‚Coming Soon‘-Slogans. Heute zeigen wir echte Fortschritte und Sie werden eine Menge Live-Demos neuer Pixel-Produkte, Android-Funktionen und KI-Erlebnisse sowie Gemini sehen Im Grunde genommen befinden wir uns voll und ganz im Zeitalter der Zwillinge.

1

Das neue Upgrade von Gemini: Mit Gemini Live können Sie mit mehr Anwendungen interagieren und endlich „Sie“ erleben.

Googles geräteseitige KI wird durch sein leichtes multimodales Modell Gemini Nano angetrieben, und das flexiblere Gemini 1.5 Flash wurde eingeführt. Unterstützt derzeit 45 Sprachen, deckt mehr als 200 Länder und Regionen ab und kann auf Hunderten von Mobiltelefonmodellen ausgeführt werden. Benutzer können es durch Bilder, Videos oder Sprachbefehle auslösen, um Aufgaben auszuführen.

Jetzt kann der intelligente Assistent Gemini mit Kalender, Aufgaben, Google Keep, YouTube Music und weiteren Anwendungen verknüpft werden.

Wenn Sie beispielsweise zufällig ein Konzertplakat von Sabrina Carpenter sehen, können Sie Gemini öffnen, ein Foto machen und fragen: „Habe ich Zeit, wenn sie dieses Jahr nach San Francisco kommt?“ Zwillinge extrahieren relevante Informationen aus dem Bild, stellen eine Verbindung zum Kalender her und geben eine Antwort.


Hier gibt es eine interessante Episode, als der Stab dieses Beispiel zweimal hintereinander zeigte, und Gemini antwortete erfolgreich, nachdem er die Frage zum dritten Mal gestellt hatte. Aber es beweist nur, dass alles ein echter Test vor Ort und kein Betrug ist. Nachdem Gemini schließlich mit atemloser Konzentration geantwortet hatte, brach das Publikum in Applaus aus. Auch der kleine Bruder atmete erleichtert auf und sagte: „Danke an den Gott des Demos.“

Zwillinge können auch verstehen, was auf dem Bildschirm angezeigt wird. Wenn Sie über einen Lebensmittelladen-Vlog sabbern, können Sie Gemini direkt anweisen, „eine Liste der vom Blogger im Video gegessenen Lebensmittel zu erstellen“, und es stellt eine Verbindung zum YouTube-Video her und holt sich die erforderlichen Informationen aus den Untertiteln Befolgen Sie es auch beim nächsten Mal. Eingecheckt wie es ist.


Dafür gibt es viele Beispiele, etwa das Einrichten regelmäßiger Erinnerungen zur Synchronisierung mit „Aufgaben“, das Erstellen von Musik-Playlists, das Verfassen personalisierter E-Mails und deren Versenden über Gmail usw. Da Gemini die Arbeit auf mehr tägliche Anwendungen koordiniert, wurde die Produktions- und Lebenseffizienz der Benutzer weiter verbessert.

Was diese Erlebnisse reibungsloser und intelligenter macht, ist Gemini Live, eine neue Sprachfunktion, die offiziell von Google eingeführt wurde.

Als direkter GPT-4o-Sprachplayer ermöglicht Gemini Live Benutzern die natürlichste Echtzeitinteraktion mit Gemini. Von der Begleitung von Scheininterviews über Sprechübungen und Brainstorming bis hin zu allen Kommunikationsbedürfnissen kann Gemini Live ein echtes Chat-Erlebnis bieten. Sie können das Gespräch jederzeit pausieren, unterbrechen oder das Thema wechseln und je nach Ihren Vorlieben aus 10 Stimmen unterschiedlichen Geschlechts und Persönlichkeiten wählen.

Noch spannender ist, dass Google dieses Mal deutlich erfolgreicher ist als OpenAI.

Gerade als sich GPT-4o noch versteckte und nur einem kleinen Nutzerkreis das Ausprobieren der Beta-Version erlaubte, verkündete Google großzügig: Ab heute wird der Zugriff auf die englische Android-Version von Gemini Live allen zahlenden Nutzern offen stehen, und das wird auch so bleiben in den nächsten Wochen auf iOS und weitere Sprachen erweitert.

Sag es nicht, sag es nicht!


1

Mehr als 10 KI-Updates: automatische Anrufzusammenfassung, Screenshot-Suche, Bildbearbeitung, Echtzeitübersetzung ...

Mit dem Gemini-Modell als Kern hat Google auch eine Vielzahl einzigartiger und praktischer KI-Funktionen für Pixel-Geräte aktualisiert.

1. Neue Version der Wetteranwendung: Nutzen Sie die Technologie der künstlichen Intelligenz, um die Genauigkeit von Wettervorhersagen zu verbessern. Es kann die Anfangs- und Endzeit von Regenfällen genau vorhersagen und personalisierte Wetterberichte erstellen, wodurch die Mühe entfällt, alle Daten einzeln zu überprüfen.

2. Anrufnotizen: Diese neu eingeführte Funktion „Anrufnotizen“ erstellt nach Beendigung des Anrufs automatisch eine private Zusammenfassung und eine detaillierte Aufzeichnung des Gesprächs. Wenn Sie wichtige Informationen wie Uhrzeit und Adresse aufzeichnen müssen, aber keinen Stift und kein Papier zur Hand haben, öffnen Sie einfach Anrufnotizen und alle Textaufzeichnungen werden im Anrufprotokoll gespeichert. (Zum Schutz der Privatsphäre läuft diese Funktion vollständig auf dem lokalen Gerät und beide Teilnehmer des Anrufs werden benachrichtigt, wenn sie aktiviert ist.)


3. Pixel-Screenshots: Jeder ist es gewohnt, Screenshots auf seinem Mobiltelefon zu machen, um Informationen zu speichern, aber es ist auch schwierig, bei Bedarf Hunderte oder Tausende von Screenshots zu durchsuchen. Diese neue App erleichtert das Speichern, Organisieren und Auffinden von Screenshots von Informationen. Angenommen, Sie haben einen Screenshot des Zugangscodes für das B&B, in dem Sie einchecken möchten, können sich aber bei Ihrer Ankunft nicht mehr daran erinnern. Öffnen Sie Pixel Screenshots und fragen Sie einfach nach, es wird Ihnen schnell dabei helfen, den entsprechenden Screenshot zu finden und die Textinformationen im Bild zu extrahieren.

4. Pixel Studio: Eine neue KI-Mapping-Anwendung, die auf dem lokalen Diffusionsmodell basiert, das auf dem Tensor G4-Chip läuft, und dem Cloud-Imagen 3-Text-zu-Bild-Modell. Es kann Funktionen wie kreative Generierung, Stilanpassung und persönliche Aufkleber durch Eingabeaufforderungen in natürlicher Sprache ausführen.

Pixel-Telefone haben außerdem zwei umwerfende neue KI-gesteuerte Funktionen für Fotografie und Video hinzugefügt:

1. Add Me: Diese „Add Me“-Funktion ist sehr interessant! Wie der Name schon sagt, kann es Sie auf dem Foto einbeziehen. Zwei Mitarbeiter auf dem Demonstrationsgelände luden NBA-Star Jimmy Butler ein, schalteten die Kamera ein und schalteten sie in den Add-Me-Modus. Zuerst machte Mitarbeiter A ein Foto mit Jimmy, und dann war es unter der Anleitung von Augmented-Reality-Overlay das von Mitarbeiter B Drehen Sie sich um, um das Foto aufzunehmen. Das Ergebnis ist ein klares Ganzkörperfoto der drei, ohne dass ein zusätzlicher Fotograf erforderlich ist.


2. Magic Editor: Mithilfe generativer KI-Technologie können Benutzer Fotos im Magic Editor neu gestalten und bearbeiten. Erweitern Sie beispielsweise den Rahmen, verschieben Sie Objekte, ändern Sie den Hintergrund oder kreisen Sie sogar einen kleinen Bereich ein und bitten Sie darum, „einen Heißluftballon hinzuzufügen“.


Plus eine sehr niedliche Made You Look-Funktion: Eltern wissen alle, wie schwierig es ist, mit kleinen Puppen für Fotos zu posieren, daher verfügt die Pixel 9-Faltmaschine über eine neue „Make You Laugh“-Option, mit der sie interessante Animationsclips auf der Außenseite abspielen können Bildschirm. , ziehen Sie die Aufmerksamkeit der Kinder auf sich.


Google konzentriert sich weiterhin auf das Kameraobjektiv und hat vier KI-Verbesserungen für Menschen und Szenarien mit besonderen Bedürfnissen vorgenommen:

1. Geführter Rahmen: Speziell für Menschen mit Sehbehinderungen oder Sehbehinderungen entwickelt, hilft er Benutzern durch Sprachführung beim Aufnehmen hervorragender Fotos und Selfies. Das neueste Update verbessert die Objekterkennung, die intelligente Gesichtsfilterung bei Gruppenfotos und die Fokussierungsfähigkeiten in komplexen Szenen und kann direkt über die Kameraeinstellungen aktiviert werden.

2. Lupe: Dies ist eine exklusive App für Pixel-Telefone, die KI nutzt, um sehbehinderten Benutzern dabei zu helfen, die Welt um sie herum zu vergrößern. Zu den neuen Funktionen gehören das Durchsuchen der Umgebung nach bestimmten Wörtern, die Verwendung des Bild-in-Bild-Modus zum Anzeigen von Szenendetails, die Auswahl des besten Objektivs zum Heranzoomen und die Möglichkeit, die Selfie-Beleuchtung als Spiegel zu verwenden.


Verwenden Sie die Lupe, um Menüs und Flughafeninformationsschilder zu identifizieren

3. Dual-Screen-Modus für Echtzeit-Transkription: Der speziell für faltbare Mobiltelefone eingeführte Dual-Screen-Modus ermöglicht es Benutzern, das Mobiltelefon in eine Desktop-Haltung zu bringen, sodass mehrere Personen gleichzeitig die Echtzeit-Transkription von Gesprächen ansehen können. Dies ist sehr hilfreich für Gespräche in Besprechungen oder beim Abendessen.


4. Echtzeit-Untertitelübersetzung: Mehrsprachige Unterstützung, sieben neue Sprachübersetzungen, darunter Koreanisch und Chinesisch, wurden hinzugefügt, wodurch die Verfügbarkeit von Echtzeit-Untertiteln und Echtzeit-Transkription erweitert wird, die auch ohne Internetverbindung verwendet werden können.


Darüber hinaus wurden der Pixel-Smartwatch neue Funktionen hinzugefügt, um den Schlaf automatisch zu erkennen und den Schlafmodus zu aktivieren, Benutzern bei der Planung von Läufen zu helfen, den Lauffortschritt anzuzeigen und tägliche Laufvorschläge zu machen. Es leistete auch Pionierarbeit bei der KI-Pulserkennung und kombinierte Pixel Watch 3-Sensoren, KI und Signalverarbeitungsalgorithmen, um Pulsverlustereignisse zu erkennen, die durch Herzstillstand, Atemversagen, Überdosierung von Medikamenten usw. verursacht wurden.

Abschließend hat Google auch mehrere Projekte bekannt gegeben, die in Arbeit sind und in naher Zukunft veröffentlicht werden:

Eines davon ist das Projekt Astra, das zuvor auf der I/O-Konferenz vorgestellt wurde und Kameras verwendet, um die Umgebung anzuzeigen und mit Gemini zu interagieren. Seine praktische Anwendung wird zunächst in Gemini Live implementiert und wird zu einem agentenähnlicheren Allround-KI-Assistenten.

Das andere ist Gemini Research. Diese Funktion soll Menschen dabei helfen, fortgeschritteneres Denken, Planen und Gedächtnis zu ermöglichen, indem sie mehrstufige Forschungspläne erstellt, komplexe Informationen aus dem Internet integriert und automatisch gut strukturierte Forschungsberichte erstellt. Es wird erwartet, dass es innerhalb weniger Monate für fortgeschrittene Benutzer eingeführt wird, was die Forschungseffizienz erheblich verbessern und Zeit und Energie sparen wird.

1

Vier Pixel 9-Telefone, Buds Pro 2-Kopfhörer, Smartwatches – Google versammelt KI-Hardware für die ganze Familie

Alle oben genannten KI-Funktionen, einschließlich des aktualisierten Gemini-Assistenten und verschiedener neuer KI-Anwendungen, werden in die neuen KI-Hardwareprodukte integriert, die Google auf den Markt bringt, um den Verbrauchern gerecht zu werden.

Nachfolgend finden Sie den gesamten Funktionsumfang und die Preise zusammengefasst:

Mobiltelefone der Pixel 9-Serie

Google hat vier Telefone der Pixel-9-Serie herausgebracht: Pixel 9, Pixel 9 Pro, Pixel 9 Pro XL und Pixel 9 Pro Fold. Beide sind mit dem neuesten Google Tensor G4-Chip ausgestattet und unterstützen verschiedene KI-Leistungsverbesserungen.


Bildnachweis: Sam Rutherford/Engadget

• Pixel 9: 6,3-Zoll-Actua-Display, 12 GB RAM, 50-MP-Hauptkamera und 48-MP-Ultra-Wide-Kamera auf der Rückseite, 10,5-MP-Frontkamera. Ab 799 US-Dollar ist es in vier Farben erhältlich: Obsidianschwarz, Porzellanweiß, Stechpalmengrün und Pfingstrosenrosa.

• Pixel 9 Pro: 6,3-Zoll-Super-Actua-Display, 16 GB Speicher, 42-MP-Frontkamera, drei Rückkameras (50-MP-Hauptkamera, 48-MP-Ultraweitwinkel und 48-MP-Teleobjektiv). Die Preise beginnen bei 999 $ und sind in den Farben Obsidianschwarz, Porzellanweiß, Haselnuss und Rose erhältlich.

• Pixel 9 Pro XL: Ausgestattet mit einem 6,8-Zoll-Super-Actua-Display, ab 1.099 $, mit dem gleichen Speicher, der gleichen Designkonfiguration und den gleichen Farboptionen wie das Pro.

• Pixel 9 Pro Fold: Ein faltbares Telefon mit dem größten Display aller Zeiten bei einem Telefon von Google und dem dünnsten faltbaren Telefon. 16 GB Speicher, ähnlich der Pixel Fold-Kamerakonfiguration des letzten Jahres. Der Preis beginnt bei 1.799 $.

Alle vier Telefone bieten bis zu sieben Jahre Betriebssystem- und Sicherheitsupdates und verbessern so die Haltbarkeit und das Benutzererlebnis.

Pixel Buds Pro 2 kabellose Kopfhörer

Google hat eine neue Generation kabelloser Kopfhörer mit verbesserter Klangqualität und Konnektivität auf den Markt gebracht. Benutzer, die Pixel Buds Pro 2 tragen, können ohne Mobiltelefon mit Gemini sprechen.


Pixel Watch 3 Smartwatch

Der in zwei Größen (41 mm und 45 mm) erhältliche Bildschirm ist größer und integriert weitere Funktionen des Google-Ökosystems, wie Nest-Kamera- und Türklingel-Videostreaming, Google TV-Fernbedienungsfunktion, Offline-Google Maps usw. Die Uhr bietet außerdem KI-gesteuerte Trainingsvorschläge und verfügt über eine Akkulaufzeit von bis zu 24 Stunden, die durch Einschalten des Energiesparmodus auf 36 Stunden verlängert werden kann.


Insgesamt ist die Veröffentlichung von Google recht aufrichtig.

Bereits vor ein paar Tagen hieß es auf dem offiziellen Twitter auf die Erwartungen der Internetnutzer: „Wir wollen es einfach nicht mehr verstecken!“

Heute bringen wir nicht nur neue Hardwareprodukte der Pixel 9-Serie auf den Markt, sondern, was noch wichtiger ist, wir demonstrieren die praktische Anwendung unserer eigenen generativen KI-Technologie. Vom smarten Gemini-Assistenten bis hin zu diversen KI-Funktionen, die den Alltagskomfort verbessern, will Google einigen „Zukunftsspielern“ offenbar Taten folgen lassen: KI solle nicht nur ein Slogan sein, sondern in alle Lebensbereiche vordringen und Nutzer wirklich befähigen um es in ihrem täglichen Leben zu nutzen.

Die Enthüllung vor der Herbstkonferenz von Apple kann nicht nur für mehr Nachrichtenzyklen sorgen, sondern auch mehr Zeitfenster für Verbesserungen des Gemini Assistant schaffen. Die zukünftige Leistung hängt vom Benutzerfeedback nach der Markteinführung ab.

Angesichts der jüngsten Abwanderung von Fachkräften und des schwindenden Rufs von OpenAI könnte Google wirklich bereit sein, seine Präsenz auf dem Android-Markt auf breiter Front zu stärken und einen direkten Kampf mit Apple zu führen.