νέα

Κατά τη διάρκεια της νύχτας, κυκλοφόρησε η έκδοση της Google για τα τηλέφωνα GPT-4o και AI

2024-08-14

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Αναφορά Machine Heart

Επιμέλεια: Zenan, Chen Chen

Το Gemini Live συγκρίνεται με το GPT-4o και ο κάδος της οικογένειας κινητών τηλεφώνων της Google AI είναι online.

Πριν το GPT-4o εισέλθει στο iPhone, το Google Gemini ανέλαβε το προβάδισμα και ολοκλήρωσε την έκδοση για κινητά.

Τα ξημερώματα της Τετάρτης, όταν ο κόσμος ανυπομονούσε για το OpenAI "Strawberry Big Model", η Google κυκλοφόρησε επίσημα το Gemini Live και μια σειρά προϊόντων υλικού Pixel στην εκδήλωση Made by Google.



Στη σημερινή εκδήλωση, η Google πραγματοποίησε 100% ζωντανή επίδειξη με αυτοπεποίθηση, αν και υπήρχαν κάποια δευτερεύοντα ζητήματα.



Προσπάθησα να χρησιμοποιήσω το τηλέφωνό μου για να διαβάσω εικόνες δύο φορές (αλλά χρησιμοποίησα Samsung), και οι δύο φορές απέτυχαν.

Αλλά όπως λέει η Google, έχουμε μπει στην «εποχή των διδύμων».

Μετά τη σειρά Pixel 9, μια σειρά λειτουργιών Gemini AI που κυκλοφόρησαν σήμερα θα εμφανίζονται επίσης σε διάφορα τηλέφωνα Android με Android 15.

Gemini Live: Benchmark GPT-4o και συνδεθείτε άμεσα

Το Gemini Live είναι ένα προϊόν που κυκλοφόρησε από την Google για την προηγμένη λειτουργία φωνής OpenAI Αυτή η δυνατότητα είναι σχεδόν πανομοιότυπη με το ChatGPT και ήταν στο στάδιο άλφα δοκιμής.



Το Gemini Live παρέχει μια εμπειρία συνομιλίας μέσω κινητού που επιτρέπει στους χρήστες να έχουν ελεύθερες συνομιλίες με το Gemini και ακόμη και να διακόπτουν ή να αλλάζουν το θέμα σαν μια κανονική τηλεφωνική κλήση χωρίς να πληκτρολογούν.

Η Google το περιγράφει σε ένα ιστολόγιο: Μπορείτε να μιλήσετε στο Gemini Live (μέσω της εφαρμογής Gemini) και να επιλέξετε έναν από τους 10 νέους φυσικούς ήχους για να απαντήσετε (το OpenAI προσφέρει μόνο 3 ήχους). Μπορείτε ακόμη και να μιλήσετε με τον δικό σας ρυθμό ή να διακόψετε τη μέση της απάντησης και να κάνετε πρόσθετες ερωτήσεις, όπως σε μια κανονική συνομιλία.



视频链接:https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650930230&idx=2&sn=822b96951da8ef70408c0c3MzI4MjgzMw==&mid=2650930230&idx=2&sn=822b96951da8ef70408c0c4c3m58& 15e320f663d6c311ccab54157b0885da6dee24ce8e5260beed4153dfb2a432a&token=2010422951&lang=zh_CN#rd

Το Gemini Live μπορεί να ξυπνήσει απευθείας Μπορείτε να συνεχίσετε να μιλάτε με το Gemini όταν η εφαρμογή εκτελείται στο παρασκήνιο ή το τηλέφωνο είναι κλειδωμένο και η συνομιλία μπορεί να τεθεί σε παύση και να συνεχιστεί ανά πάσα στιγμή.

Το Gemini Live θα ενσωματωθεί επίσης με διάφορες λειτουργίες εφαρμογών Android (όπως το Keep), βελτιώνοντας έτσι τη χρηστικότητα του Gemini.



Από σήμερα, η Google διαθέτει αυτήν τη δυνατότητα στους προχωρημένους χρήστες τηλεφώνων Android Gemini μόνο στα Αγγλικά και θα επεκταθεί σε iOS και σε περισσότερες γλώσσες τις επόμενες εβδομάδες.



Ωστόσο, κατά τη διάρκεια της ζωντανής επίδειξης, το Gemini Live απέτυχε δύο φορές όταν το προσωπικό του ξενοδοχείου ζήτησε πληροφορίες για την αφίσα της συναυλίας, απαιτώντας από τον παρουσιαστή να αλλάξει το τηλέφωνό του για να λειτουργήσει σωστά. Ενώ υπήρξαν κάποιοι λόξυγκας κατά τη διάρκεια της επίδειξης, ήταν τελικά επιτυχής και το Gemini Live κατέληξε να εξάγει σχετικές πληροφορίες από τις εικόνες και να συνδέεται με το ημερολόγιο, παρέχοντας στους χρήστες ακριβή αποτελέσματα.



视频链接:https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650930230&idx=2&sn=822b96951da8ef70408c0c3MzI4MjgzMw==&mid=2650930230&idx=2&sn=822b96951da8ef70408c0c4c3m58& 15e320f663d6c311ccab54157b0885da6dee24ce8e5260beed4153dfb2a432a&token=2010422951&lang=zh_CN#rd

Αξίζει να σημειωθεί ότι, σύμφωνα με τον υπεύθυνο προϊόντων Leland Rechis, η Google δεν επιτρέπει στο Gemini Live να μιμείται άλλους ήχους εκτός από αυτούς τους 10 ήχους. Η Google μπορεί να το έκανε αυτό για να αποφύγει την παραβίαση των νόμων περί πνευματικών δικαιωμάτων. Προηγουμένως, το OpenAI είχε μηνυθεί από το τελευταίο για χρήση της φωνής της χήρας.

Συνολικά, η λειτουργία φαίνεται σαν ένας πολύ καλός τρόπος για να εμβαθύνετε σε ένα θέμα πιο φυσικά από τη χρήση μιας απλής αναζήτησης Google. Η Google σημειώνει ότι το Gemini Live είναι ένα βήμα προς τα εμπρός για το Project Astra, το πολυτροπικό μοντέλο AI που έκανε το ντεμπούτο της η εταιρεία κατά τη διάρκεια του Google I/O. Προς το παρόν, το Gemini Live υποστηρίζει μόνο φωνητικές συνομιλίες και η Google ελπίζει να προσθέσει δυνατότητες κατανόησης βίντεο σε πραγματικό χρόνο στο μέλλον.

Ευλογία τσιπ, το υλικό Google έρχεται

Ταυτόχρονα με την κυκλοφορία του Gemini Live, η Google παρουσίασε επίσης μια νέα γενιά έξυπνων συσκευών υλικού νωρίτερα από την Apple και τη Huawei.

Το νέο υλικό που κυκλοφόρησε σήμερα το πρωί περιλαμβάνει τα Pixel 9, Pixel 9 Pro και Pixel 9 Pro XL, καθώς και ένα αναδιπλούμενο τηλέφωνο με οθόνη Pixel 9 Pro Fold .

Τα τηλέφωνα Pixel 9 διαθέτουν νέα εμφάνιση που τοποθετεί την κάμερα μπροστά και στο κέντρο, βελτιώνοντας την εμβληματική μονάδα κάμερας και βελτιώνοντας την αίσθηση στο χέρι. Η Google ισχυρίζεται ότι αυτά τα τηλέφωνα είναι δύο φορές πιο ανθεκτικά από το Pixel 8.



Αυτή τη φορά, για πρώτη φορά, τα μοντέλα Pixel Pro είναι διαθέσιμα σε δύο διαφορετικά μεγέθη: Pixel 9 Pro (6,3 ίντσες) και Pixel 9 Pro XL (6,8 ίντσες), και τα δύο εξοπλισμένα με οθόνες Super Actua και μπροστινές κάμερες 42 MP. Εκτός από το μέγεθος της οθόνης, την ταχύτητα φόρτισης και την μπαταρία, τα Pixel 9 Pro και Pixel 9 Pro XL μοιράζονται ίδιες προδιαγραφές και χαρακτηριστικά.



Αξίζει να σημειωθεί ότι το κινητό τηλέφωνο Pixel 9 χρησιμοποιεί το νέο προσαρμοσμένο chip Tensor G4 της Google. Πρόκειται για μια νέα γενιά τσιπ κινητών τηλεφώνων υψηλής απόδοσης που έχουν σχεδιαστεί για να βελτιώνουν τις περιπτώσεις καθημερινής χρήσης, όπως το γρηγορότερο άνοιγμα εφαρμογών, την περιήγηση στον Ιστό και πολλά άλλα.



Το Tensor G4 έχει σχεδιαστεί από την Google DeepMind, κατασκευασμένο από τη Samsung και χρησιμοποιεί αρχιτεκτονική Arm. Το G4 είναι βελτιστοποιημένο για να εκτελεί τα πιο προηγμένα μοντέλα τεχνητής νοημοσύνης. Θα είναι ο πρώτος επεξεργαστής που θα εκτελεί το πολυτροπικό μοντέλο Gemini Nano - επιτρέποντας στα μεγάλα μοντέλα να κατανοούν εργασίες όπως κείμενο, εικόνες και ήχος μόνο από την πλευρά του κινητού τηλεφώνου.



Από τις τρέχουσες ειδήσεις, το Tensor G4 είναι το ίδιο με τον προκάτοχό του, χρησιμοποιώντας τον ίδιο πυρήνα με την τεχνολογία της τρέχουσας γενιάς - πράγμα που σημαίνει ότι σύντομα θα γίνει ένα προς τα πίσω chipset τον Σεπτέμβριο υποστηρίζεται (η υποστηριζόμενη έκδοση ονομάζεται Immortalis). Παρόλα αυτά, σε σύγκριση με εμένα, η βελτίωση της απόδοσης σε σύγκριση με το προϊόν προηγούμενης γενιάς είναι ακόμα σημαντική.

Φυσικά, ως τσιπ που αναπτύχθηκε από την DeepMind, το Tensor G4 έχει καλή υπολογιστική ισχύ τεχνητής νοημοσύνης Η Google αποκάλυψε ότι έχει μια «κορυφαία στον κλάδο» ταχύτητα εξόδου 45 μάρκες ανά δευτερόλεπτο.

Για να διασφαλίσει ότι η εμπειρία AI στη συσκευή λειτουργεί ομαλά, η Google έχει επίσης αναβαθμίσει τη μνήμη της σειράς Pixel 9, η οποία συνοδεύεται από 12 GB RAM και τα Pixel 9 Pro και Pixel 9 Pro XL διαθέτουν 16 GB RAM.

Η σειρά Pixel ήταν πάντα το σημείο αναφοράς για τις τεχνολογικές εφαρμογές της Google Τα νέα τηλέφωνα είναι εξοπλισμένα με Gemini Live και θα κυκλοφορήσουν τον Αύγουστο. Η Google είπε ότι οι χρήστες Pixel 9 Pro, Pixel 9 Pro XL και Pixel 9 Pro Fold μπορούν να απολαύσουν μια ετήσια συνδρομή Gemini Advanced μετά την αγορά του τηλεφώνου. Φαίνεται ότι σε σύγκριση με τη σειρά iPhone 16 που είναι εξοπλισμένη με μεγάλα μοντέλα OpenAI, η Google έχει πετύχει ένα βήμα μπροστά αυτή τη φορά.

Η Google παρουσίασε μια σειρά παραγωγικών δυνατοτήτων AI για το Pixel.

Μεταξύ αυτών, το Pixel Studio μπορεί να σας βοηθήσει να μετατρέψετε τις ιδέες σε εικόνες στο τηλέφωνό σας. Αποτελείται από ένα μοντέλο διάχυσης από την πλευρά της συσκευής που εκτελείται στο Tensor G4 και ένα μοντέλο Imagen 3 από κείμενο σε εικόνα στο cloud.



Το νέο μοντέλο εικόνας της Google, Imagen 3, κυκλοφόρησε για πρώτη φορά στη διάσκεψη I/O τον Μάιο. Το μοντέλο έχει βελτιστοποιηθεί και αναβαθμιστεί όσον αφορά τη δημιουργία λεπτομερειών, φωτισμού, παρεμβολών κ.λπ., και η ικανότητά του να κατανοεί τις προτροπές έχει βελτιωθεί σημαντικά. Με τη σημερινή συνέντευξη Τύπου, το Google DeepMind υπέβαλε μια εργασία Imagen 3 για το arXiv:



  • Σύνδεσμος χαρτιού: https://arxiv.org/abs/2408.07009

Τα Στιγμιότυπα οθόνης Pixel σάς βοηθούν να αποθηκεύετε, να οργανώνετε και να ανακαλείτε σημαντικές πληροφορίες που θέλετε να θυμάστε για αργότερα.

Ας υποθέσουμε ότι έχετε μια φίλη που λατρεύει τους σκίουρους και σύντομα έχει τα γενέθλιά της. Μπορείτε να αναζητήσετε δώρα και να τραβήξετε στιγμιότυπα οθόνης από πουκάμισα σκίουρους, σουβέρ για σκίουρους και όλα όσα σχετίζονται με τους σκίουρους στο Google Chrome. Τα στιγμιότυπα οθόνης Pixel θα αναλύσουν το περιεχόμενο όλων αυτών των εικόνων και θα σας βοηθήσουν να αναζητήσετε αυτές τις πληροφορίες στην εφαρμογή σας. Στη συνέχεια, απλά ανοίξτε την εφαρμογή και αναζητήστε "σκίουρος" και αυτά τα αποτελέσματα θα εμφανιστούν. Θα περιλαμβάνει επίσης συνδέσμους προς όλα όσα βρίσκετε, καθώς και μια περίληψη και σχετικές πληροφορίες σχετικά με το περιεχόμενο που προβάλλετε.



Ένα από τα πιο συνηθισμένα πράγματα που κάνουν οι άνθρωποι στα τηλέφωνά τους είναι να ελέγχουν τον καιρό. Το Pixel Weather μπορεί να παρέχει πιο ακριβείς πληροφορίες για τον καιρό και το Gemini Nano θα δημιουργήσει επίσης προσαρμοσμένες αναφορές καιρού με τεχνητή νοημοσύνη για να επιτρέπει στους ανθρώπους να κατανοήσουν τις καιρικές συνθήκες της ημέρας.

Όσον αφορά τη λήψη φωτογραφιών που απαιτούν όλα τα κινητά τηλέφωνα, το Pixel 9 προσθέτει λειτουργίες λήψης AI για τη βελτίωση της αποτελεσματικότητας της παραγωγής ταινιών.

Συχνά, ένας καθορισμένος φωτογράφος λείπει από τις ομαδικές φωτογραφίες. Με το Add Me, μπορείτε να τραβήξετε φωτογραφίες με όλους στο δωμάτιο χωρίς να χρειάζεται να κουβαλάτε τρίποδο ή να ζητάτε βοήθεια από αγνώστους.



Με το επανασχεδιασμένο Panorama, μπορείτε πλέον να τραβάτε λεπτομερείς φωτογραφίες ακόμα και σε χαμηλό φωτισμό. Αυτή είναι η υψηλότερη ποιότητα πανόραμα χαμηλού φωτισμού που διατίθεται σε οποιοδήποτε smartphone.



Επιπλέον, το Magic Editor στο Google Photos διαθέτει νέες δυνατότητες επεξεργασίας που σας επιτρέπουν να τραβήξετε τη φωτογραφία που θέλετε Η λειτουργία αυτόματης πλαισίωσης μπορεί να ανασυνθέσει τη φωτογραφία και χρειάζεται μόνο να εισαγάγετε αυτό που θέλετε να δείτε (για παράδειγμα: προσθέστε αγριολούλουδα σε ένα κενό. πεδίο) Δηλαδή, μπορείτε να ανασυνθέσετε φωτογραφίες και να κάνετε τις ιδέες σας πραγματικότητα.

Η έξυπνη καταγραφή κλήσεων μεγάλων μοντέλων είναι πλέον ενσωματωμένη και στο σύστημα Android. Η λειτουργία Clear Calling βελτιώνει περαιτέρω την ποιότητα ήχου και η νέα λειτουργία Call Notes στέλνει μια ιδιωτική σύνοψη και μια πλήρη μεταγραφή κλήσης μόλις ο χρήστης κλείσει το τηλέφωνο. Έτσι, όταν λαμβάνετε μια κλήση πίσω, δεν χρειάζεται να ψάξετε για χαρτί και στυλό για να κρατήσετε σημειώσεις. Για την προστασία του απορρήτου, η εγγραφή κλήσεων εκτελείται εξ ολοκλήρου στη συσκευή.



Οι πιο πρόσφατες συσκευές Pixel 9 είναι τα πρώτα τηλέφωνα Android που διαθέτουν τη νέα δορυφορική λειτουργία SOS, έτσι ώστε οι χρήστες να μπορούν να επικοινωνούν με τους ανταποκριτές έκτακτης ανάγκης και να μοιράζονται την τοποθεσία τους μέσω δορυφόρου ακόμα και όταν δεν υπάρχει δίκτυο κινητής τηλεφωνίας. Το SOS Satellite θα είναι πρώτα διαθέσιμο στις συσκευές Pixel 9 στις ΗΠΑ, ανεξάρτητα από το πρόγραμμα της εταιρείας κινητής τηλεφωνίας σας. Αυτή η δυνατότητα θα είναι δωρεάν για τα δύο πρώτα χρόνια στο Pixel.



Τέλος, υπάρχει τιμολόγηση για τα Pixel 9, Pixel 9 Pro και Pixel 9 Pro XL για προπαραγγελία, ξεκινώντας από $799, $999 και $1.099 αντίστοιχα. Τα Pixel 9 και Pixel 9 Pro XL θα είναι διαθέσιμα στις 22 Αυγούστου στο Google Store και στους συνεργάτες λιανικής της Google. Το Pixel 9 Pro θα είναι διαθέσιμο στις Ηνωμένες Πολιτείες στις 4 Σεπτεμβρίου, ενώ το Pixel 9 Pro Fold θα είναι διαθέσιμο σε άλλες αγορές τις επόμενες εβδομάδες.

Περιεχόμενο αναφοράς:

https://blog.google/products/pixel/google-pixel-9-pro-xl/

https://www.androidauthority.com/google-tensor-g4-explained-3466184/