2024-08-14
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Gerade am X wurde eine Gruppe von Leuten von Bruder Strawberry geficktOpenAIVorschau, wenn Sie eine verrückte Mentalität haben.
Google trägtHergestellt von Google24Die Pressekonferenz ist da.
OpenAI hat sogar ein paar Minuten nach der Pressekonferenz einen Blog gepostet, um Google zu beschimpfen. Es war ein so schlechter Blog, und sie ließen ihre KI Strawberry sogar zwei Tage lang als Riddler fungieren.
Die aktuelle OpenAI ist wirklich wie ein weinender Wolf. Ich habe keine Erwartungen mehr und kein Vertrauen mehr in sie. Die einzigen zwei Schimpfwörter, die jedes Mal herauskamen, waren: XXX, XX!
Und Google hat noch einige zusätzliche Überraschungen parat, ohne jegliche Erwartungen.
Ich habe 11 Highlights zusammengefasst. Nachdem Sie diesen Artikel gelesen haben, haben Sie die Pressekonferenz zu Ende gesehen.
1. Google will Android auf Basis von Gemini nachbauen.
Sie haben ein Wort namens AI OS definiert. Google möchte AI OS für alle zugänglich machen.
Derzeit werden 45 Sprachen in mehr als 200 Ländern und Regionen unterstützt, es kann auf Hunderten von Mobiltelefonmodellen von Dutzenden von Geräteherstellern verwendet werden und wird auf Milliarden von Geräten auf der ganzen Welt unterstützt.
2. Die Bilderkennung von Gemini auf dem Mobiltelefon wird aufgehoben.
Das erste, was sie demonstrierten, waren die Bilderkennungsfähigkeiten von Gemini.
Als multimodale KI scheint die Erkennung von Bildaufnahmen zu einer unverzichtbaren Funktion geworden zu sein. Der beste Test für die Fotoerkennungsfähigkeit sind informationsintensive Inhalte wie Aufnahmeanweisungen und Zeitpläne. Es ist notwendig, nicht nur das Bild zu erkennen, sondern auch den Textinhalt zu verstehen und die Antwort zu geben.
Der Typ, der die Demo machte, hat ein Foto gemachtKonzertplakat aus Papier, Tourplan oben. Der Moderator bat Gemini, seinen Zeitplan zu überprüfen und einen Zeitpunkt auszuwählen, zu dem er zur Show von Sabrina Carpenter gehen könne.
Allerdings kann es bei Live-Demos zwangsläufig zu Fehltritten kommen, und jetzt kommt es.
Die ersten beiden Male, als Gemini Fotos machte, scheiterte die Live-Demonstration auf peinliche Weise. Auf der anderen Seite des Pazifischen Ozeans fühlte ich mich am Tatort zweimal unwohl. . . = =
In dieser Demonstration wurde auch ausdrücklich erwähnt, dass das Mobiltelefon Samsung Galaxy S24 Ultra verwendet wurde. Könnte es sein, dass Samsung seine Stärke ausübte?
Die Szene wurde auf ein anderes Gerät gewechselt und es erneut versucht. Der Bildinhalt wurde zum dritten Mal erfolgreich erkannt.
Zwillinge nannten direkt einen ganz konkreten Termin: Sabrina wird da sein9. November 2024Kommen Sie in San Francisco an und gehen Sie zu einer Show, wenn der Moderator an diesem Tag keine anderen Pläne hat.
Endlich begann der Applaus und die Jungs atmeten sichtlich erleichtert auf.
3. Die softwareübergreifende Interaktion ist sehr praktisch.
Gemini kann jetzt Videoinhalte direkt auf Ihrem Telefon verstehen und analysieren.
Während Sie sich das Video ansehen, können Sie Gemini anrufen, um die wichtigsten Punkte für Sie zusammenzufassen oder Ihre Fragen zum Videoinhalt zu beantworten.
Wenn Sie beispielsweise nachts ein Essensvideo auf YouTube angeschaut haben, müssen Sie die Bilder nicht einzeln lesen. Eine Liste der im Video vorkommenden Lebensmittel wird automatisch erstellt und der persönlichen „To-Probieren“-Liste des Benutzers hinzugefügt .
Gute Nachrichten für Feinschmecker.
Und Sie können für einige Reisevideos auf YouTube Sehenswürdigkeitenlisten oder Reiseroutenvorschläge erstellen.
Als jemand, der auch beim Spazierengehen in der Hintergrundmusik erscheinen muss,
Sie können gemini auch bitten, eine „K-Pop-Playlist zum Spazierengehen in Seoul“ zu erstellen, die passende Musik basierend auf der vom Benutzer beschriebenen Szene, Stimmung oder Art der Aktivität empfiehlt.
Macht das Finden von Musik intuitiver und persönlicher.
4. Die Schreibgeschwindigkeit ist sehr hoch und der Effekt ist gut.
Gemini kann Ihnen auch dabei helfen, in wenigen Sekunden E-Mails auf Ihrem Mobiltelefon zu schreiben.
Der kleine Bruder demonstrierte zwei Szenarien: Das erste bestand darin, einen höflichen Erinnerungsbrief an die Vermieterin zu schreiben und sie aufzufordern, das Stromversorgungsmodul zu Hause zu reparieren.
Die zweite Möglichkeit besteht darin, dem Professor einen Entschuldigungsbrief für die krankheitsbedingte Abwesenheit von der Arbeit zu schreiben (anscheinend habe ich so etwas schon einmal gemacht).
Darüber hinaus verfügt Gemini auch über interaktive Designs, die Benutzern das Verfeinern von Texten und das Versenden von E-Mails erleichtern.
Als ich sah, dass Gemini den Entschuldigungsbrief in nur wenigen Sekunden fertiggestellt hatte, konnte ich mein Lachen fast nicht zurückhalten.
5. Der Echtzeit-Konversationseffekt von Gemini Live ist nicht schlecht, aber es handelt sich nur um TTS mit geringer Latenz.
Google hat eine Echtzeit-Konversationsfunktion ähnlich wie GPT4o eingeführt, die jederzeit unterbrochen werden kann. Sie nennen sie Gemini Live.
Es stehen 10 Töne zur Auswahl.
Das Demo-Mädchen hat lange mit Gemini Live gechattet. Die Klangqualität ist gut und die Verzögerung niedrig genug, aber tatsächlich sieht es wie ein TTS mit niedriger Latenz aus, nicht wie das native multimodale große Modell von GPT4o.
Denn es gibt keine Demonstration von emotionalem Verständnis und Ausdruck, so der Google-Urin, wenn es einen gibt, wird er ihn auf jeden Fall verrückt zeigen. Darüber hinaus ist die Verzögerung bei einigen längeren Antworten immer noch deutlich zu spüren.
Es handelt sich also tatsächlich um eine TTS-Konversation mit geringer Latenz.
Es ist derzeit nur für Gemini Advanced-Abonnenten verfügbar. Es kostet 20 US-Dollar pro Monat und ist sofort verfügbar.
6.Pixel 9 ist das erste Mobiltelefon, das mit dem multimodalen Gemini Nano ausgestattet ist.
Dies ist das leistungsstärkste On-Device-KI-Modell, das jemals auf einem Telefon veröffentlicht wurde, dreimal leistungsstärker als die vorherige KI, die auf dem Pixel 8 Pro verwendet wurde.
Der Prozessor des Pixel 9 (TPU und Tensor G4) kann bis zu 45 Wörter in einer Sekunde generieren, doppelt so schnell wie zuvor.
Die reguläre Version von Pixel 9 verfügt über 12 GB Speicher, während die Pro-Version über mehr Speicher verfügt und 16 GB erreicht. Und das Aufregendste an ihnen ist, dass sie endlich über eine Satellitenanruffunktion verfügen. . .
Hier kann ich nur sagen: Wir sind weit vorne!
Zu den diesmal veröffentlichten Produkten gehören drei Schokoriegel-Telefone und ein Falttelefon. Das reguläre Sortiment umfasst ein Basis-Pixel 9 mit einem 6,3-Zoll-Display, ein Pixel 9 Pro XL mit einem 6,8-Zoll-Bildschirm und ein neues, kleineres 6,3-Zoll-Pixel 9 Pro.
Ehrlich gesagt finde ich es etwas hässlich. . .
Außerdem gibt es einen neuen FaltschirmPixel 9 Pro Fold.
Noch hässlicher. . .
7.Anrufnotizen können Ihnen dabei helfen, wichtige Informationen während des Telefongesprächs aufzuzeichnen.
Jetzt ist der „Anrufassistent“ von Pixel leistungsfähiger und verfügt über die Funktion „Anrufnotizen“.
Nachdem Sie Ihren Anruf beendet haben, erhalten Sie eine völlig private Zusammenfassung des Anrufs. So können Sie problemlos auf Telefonnummern, Uhrzeiten, Details und andere Informationen zugreifen, die Sie nicht vergessen möchten, auch wenn Sie während des Anrufs keinen Stift und kein Papier zur Hand haben.
Darüber hinaus wird dieser Prozess vollständig lokal ausgeführt und es gibt grundsätzlich keine Datenschutzprobleme.
Der Junge gab ein Beispiel: Er dachte kürzlich darüber nach, seine Frisur zu ändern, aber sein Friseur konnte die Frisur, die er wollte, nicht machen, also empfahl er mich einem anderen Friseurladen.
Das Problem ist jedoch, dass er vergessen hat, die Telefonnummer des Ladens aufzuschreiben. Mit Anrufnotizen können Sie ganz einfach zurückverfolgen.
7. Die Screenshot-Funktion ähnelt Recall und ist etwas seltsam.
Es gibt eine Szene, die jeder kennt: Sie sehen etwas auf Ihrem Telefon, an das Sie sich erinnern möchten. Vielleicht schreiben Sie es in Gedanken auf oder machen einen Screenshot und speichern es.
Aber oft vergessen Sie entweder, woran Sie sich erinnern möchten, oder können es nicht finden, wenn Sie es brauchen.
Dann stellten sie ein neues Produkt her.
Mithilfe der KI können Sie alle gespeicherten Bilder schnell durchsuchen. Wenn Sie beispielsweise Dutzende Bilder von Fahrrädern auf Ihrem Telefon haben und nach Fahrrädern suchen, werden diese alle angezeigt.
Sie können auch komplexere Fragen stellen, beispielsweise den Preis eines T-Shirts, und Sie können sehen, dass Pixel Screenshot nicht nur das Originalbild gefunden hat, sondern mir auch eine Antwort in natürlicher Sprache basierend auf den Informationen im Bild geliefert hat.
8. Ein gewöhnliches lokales KI-Zeichnungs-Pixel-Studio.
Jedes Pixel 9-Telefon ist mit dem neuen Pixel Studio ausgestattet, dem ersten Bildgenerator auf einem Telefon.
Ich denke, der Effekt ist nur durchschnittlich und brauchbar.
Zum Beispiel fühlt sich das Lagerfeuer am Strand bei Sonnenuntergang ganz gewöhnlich an.
9. Die KI-Kamera eignet sich hervorragend zum Aufnehmen von Gruppenfotos.
Die Pixelkamera soll die erste KI-Kamera sein.
Ich verstehe die meisten Parameter nicht, aber diese Fotoszene ist sehr interessant.
Oft können wir kein Gruppenfoto machen und es gibt immer einen Freund, der der Fotograf sein möchte.
Es verwendet eine einfache Bildschirmoberfläche, die Sie durch das Fotografieren führt und es Ihnen ermöglicht, Ihre Kamera beispielsweise an jemand anderen weiterzugeben, damit Sie den Ort tauschen können. Anschließend können Sie die Personen auf dem neuen Foto anhand ihrer Umrisse im ersten Foto ausrichten und ein weiteres Foto aufnehmen. Das resultierende Bild kombiniert die beiden Fotos miteinander, sodass es aussieht, als wären alle gleichzeitig auf demselben Foto.
Es ist sehr cool und löst ein großes Problem beim Fotografieren.
10. Neue Uhren und Kopfhörer.
Habe eine Pixel Watch 3 geschickt.
Ein Kopfhörer Pixelbuds Pro 2.
Das Headset kann Zwillinge jederzeit wecken und mit ihm sprechen.
11. Vergleichen Sie GPT4os Projekt Aster.
Das Projekt Aster wurde vor einigen Monaten auf der Google-Konferenz vorgestellt und testete das native multimodale große Modell von GPT4o direkt.
Jetzt können Sie es in Gemin Live auch in Zukunft verwendenAster.
Sie können beispielsweise Ihre Kamera teilen, während Sie mit Gemini sprechen, um direkt ein Problem zu zeigen, auf das Sie bei einer Mathe-Hausaufgabe gestoßen sind, oder um Hilfe beim nächsten Schritt der Möbelmontage zu bitten.
Und die Apps, die Sie am häufigsten verwenden, sind in Gemini Live integriert, sodass Sie in Gesprächen und Nachrichten aktiv werden und Informationen aus Apps wie Google Kalender abrufen können.
So können Sie direkt von Gemini Live aus Ihren Nachbarn Textnachrichten senden, Details zu einem Unternehmen mitteilen und gleichzeitig Ihren Kalender überprüfen, ohne eine andere App öffnen zu müssen.
Es ist ein bisschen cool, eine Kombination aus GPT4o + Apple.
Schade, es ist immer noch ein Kuchen.
In Sachen KI ist die Kombination mit Hardware zumindest nicht zukunftsweisend und schon heute einsetzbar.
Es ist immer noch viel besser als OpenAI, das nur Kuchen zeichnen kann.
Ich hoffe, dass Google immer besser wird und OpenAI tötet.
Nachdem Sie dies gelesen haben, können Sie es gerne dreimal mit einem „Gefällt mir“ markieren, ansehen und retweeten. Wenn Sie so schnell wie möglich Benachrichtigungen erhalten möchten, können Sie mir auch einen Stern geben⭐ ~Danke, dass Sie meinen Artikel gelesen haben. Bis zum nächsten Mal.
>/ Autor: Kazik, Wenwen, Xiaorui, Dawn_E