νέα

Google: Τηλέφωνα Android, ακούστε με, το AI πρέπει να το κάνει αυτό

2024-08-14

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Συγγραφέας |. Xinxin
εκδίδω |. Jingyu

Ένα μήνα πριν από την Apple, η Google έχει επιδείξει όλες τις δυνατότητες των τηλεφώνων AI+ στο νέο της τηλέφωνο Pixel.

Στις 13 Αυγούστου, τοπική ώρα, η Google κυκλοφόρησε νέα προϊόντα υλικού, όπως Pixel 9, Pixel 9 Pro, δεύτερης γενιάς αναδιπλούμενη οθόνη Pixel 9 Fold, έξυπνα ρολόγια και ακουστικά. Σε σύγκριση με το υλικό, οι άνθρωποι ανησυχούν περισσότερο για το πώς η Google, ως διαχειριστής του συστήματος Android, θα χρησιμοποιήσει το AI στη συσκευή για τηλέφωνα Android, όταν τα κινητά τηλέφωνα AI+ είναι τόσο δημοφιλή.

Πριν από σχεδόν 10 μήνες, η Google κυκλοφόρησε την πρώτη γενιά κινητών τηλεφώνων με τεχνητή νοημοσύνη ανταγωνιστές έχουν." "μοντέλο.

Από τότε που το OpenAI κυκλοφόρησε τη λειτουργία φωνής ChatGPT και αποκαλύφθηκαν οι λειτουργίες AI του iPhone επόμενης γενιάς της Apple, η Google δεν είναι πρόθυμη να μείνει πίσω σε ό,τι μπορούν να κάνουν οι όμοιοί της, συμπεριλαμβανομένων των φωνητικών συνομιλιών AI, της αναζήτησης πληροφοριών σε στιγμιότυπα οθόνης κ.λπ. Ταυτόχρονα, η Google ενσωματώνει περαιτέρω την τεχνητή νοημοσύνη στο δικό της οικοσύστημα εφαρμογών.

Ποιος είναι ο ηγέτης στα κινητά τηλέφωνα με τεχνητή νοημοσύνη Η Google πρέπει να ανταγωνιστεί την Apple;

Σε απάντηση στο OpenAI,

Το Gemini Live είναι online

Το Gemini είναι ο ακρογωνιαίος λίθος των διαφόρων προϊόντων τεχνητής νοημοσύνης της Google και ο προεπιλεγμένος βοηθός για τα κινητά τηλέφωνα της σειράς Pixel 9 της Google.

Μπορείτε να καλέσετε το Gemini στα τηλέφωνα Google Pixel πατώντας το κουμπί λειτουργίας. Από σήμερα, οι χρήστες θα μπορούν να εμφανίζουν τις επικαλύψεις Gemini πάνω από τις εφαρμογές που χρησιμοποιούν για να κάνουν ερωτήσεις σχετικά με το τι εμφανίζεται στην οθόνη, σύμφωνα με στελέχη της Google. Για παράδειγμα, οι χρήστες μπορούν να κάνουν ερωτήσεις σχετικά με ένα βίντεο YouTube που παρακολουθούν ή μπορούν να δημιουργήσουν εικόνες απευθείας από τις επικαλύψεις του Gemini και να τις σύρουν και να τις αποθέσουν σε εφαρμογές όπως το Gmail και το Google Messages.

Η Google σχεδιάζει επίσης να συνδέσει το Gemini με περισσότερες εφαρμογές "τις επόμενες εβδομάδες", συμπεριλαμβανομένων των Calendar, Keep και YouTube Music. Τα συγκεκριμένα χαρακτηριστικά περιλαμβάνουν το να ζητήσω από τον Δίδυμο να "φτιάξει μια λίστα με τραγούδια που μου θυμίζουν τα τέλη της δεκαετίας του '90". βρείτε μια συνταγή στο Gmail σας και ζητήστε του να προσθέσει τα συστατικά στη λίστα αγορών σας στο Keep."


Το Gemini χρησιμοποιεί στιγμιότυπα οθόνης για να εξάγει πληροφορίες και να αλληλεπιδρά με περισσότερες εφαρμογές Πηγή εικόνας: Google

Εκτός από αυτές τις ενσωματωμένες εμπειρίες, η Google κυκλοφόρησε επίσημα το Gemini Live Αυτή η δυνατότητα μπορεί να ειπωθεί ότι είναι η απάντηση της Google στην προηγμένη λειτουργία φωνής GPT-4o που κυκλοφόρησε από το OpenAI. Αυτή η δυνατότητα είχε εκτεθεί στο παρελθόν στο συνέδριο προγραμματιστών I/O της Google το 2024 και θα κυκλοφορήσει επίσημα σήμερα.

Οι χρήστες μπορούν να χρησιμοποιήσουν τα κινητά τους τηλέφωνα για να διεξάγουν φωνητικές συνομιλίες με το Gemini, το τεχνητό chatbot της Google. Μερικά παραδείγματα συγκεκριμένων χρήσεων περιλαμβάνουν το να αφήνετε το Gemini Live να σας συνοδεύει για να προετοιμαστείτε για συνεντεύξεις για δουλειά, να εξασκηθείτε σε ομιλίες και να συζητήσετε χαλαρά για θέματα που σας ενδιαφέρουν.


Το Gemini Live προφανώς στοχεύει στη συγκριτική αξιολόγηση της φωνητικής αλληλεπίδρασης του GPT-4o|Πηγή εικόνας: Google

Λοιπόν, έχει κάποιο πλεονέκτημα το Gemini Live σε σχέση με τη λειτουργία φωνής του ChatGPT;

Λέγεται ότι η αρχιτεκτονική του μοντέλου τεχνητής νοημοσύνης που υποστηρίζει Live - Gemini 1.5 Pro και Gemini 1.5 Flash, έχει μεγαλύτερο από το μέσο όρο "παράθυρο περιβάλλοντος", πράγμα που σημαίνει ότι μπορούν να επεξεργαστούν και να αιτιολογήσουν μεγάλες ποσότητες δεδομένων πριν δημιουργήσουν μια απάντηση θεωρία Οι συνομιλίες μπορεί να διαρκέσουν για ώρες.

Το Gemini Live λειτουργεί επίσης χωρίς χέρια, επιτρέποντας στους χρήστες να συνεχίσουν τις φωνητικές συνομιλίες στο παρασκήνιο της εφαρμογής ή όταν το τηλέφωνο είναι κλειδωμένο, με 10 νέες φωνές για να διαλέξουν.

Ωστόσο, αξίζει να σημειωθεί ότι το Gemini Live δεν έχει ακόμη κυκλοφορήσει τη λειτουργία «πολυτροπικής εισαγωγής», η οποία λέγεται ότι θα κυκλοφορήσει «αργότερα φέτος».

Πριν από λίγους μήνες, η Google κυκλοφόρησε ένα προηχογραφημένο βίντεο που δείχνει πώς το Gemini Live μπορούσε να αναγνωρίσει το περιβάλλον του χρήστη μέσω φωτογραφιών και βίντεο που τραβήχτηκαν από την κάμερα του τηλεφώνου και να απαντήσει, όπως να υποδείξει ένα σπασμένο μέρος του ποδηλάτου ή να εξηγήσει τι συνέβαινε στην οθόνη του υπολογιστή Η λειτουργικότητα ενός κομματιού κώδικα, κανένα από τα οποία δεν έχει αποδειχθεί ζωντανά.

Επιπλέον, το Gemini Live είναι διαθέσιμο για συνδρομητές Gemini Advanced σε τηλέφωνα Android και δεν είναι δωρεάν. Προς το παρόν είναι διαθέσιμο μόνο στα αγγλικά, αλλά η Google λέει ότι θα επεκταθεί σε περισσότερες γλώσσες "τις επόμενες εβδομάδες" και στο iOS μέσω μιας εφαρμογής.


Επίδειξη ζωντανής εκπομπής στελεχών της Google Gemini Live|Πηγή εικόνας: Google

Μια εμπειρία του Google Gemini και στέλεχος του Google Assistant είπε: «Η Google βρίσκεται στα πρώτα στάδια της εξερεύνησης τρόπων με τους οποίους οι βοηθοί με τεχνητή νοημοσύνη μπορούν να είναι χρήσιμοι — και όπως τα τηλέφωνα Pixel, το Gemini θα γίνεται όλο και καλύτερο».

Επιπλέον, όσον αφορά τα ζητήματα απορρήτου, στελέχη από το οικοσύστημα Android της Google ανέφεραν ότι το Gemini υποστηρίζει εκατοντάδες μοντέλα κινητών τηλεφώνων από δεκάδες κατασκευαστές συσκευών και κατά την επεξεργασία των δεδομένων χρήστη, τα δεδομένα δεν θα φύγουν από το τηλέφωνο.

"Το Gemini μπορεί να σας βοηθήσει να δημιουργήσετε ένα καθημερινό πλάνο προπόνησης με βάση ένα email από τον προσωπικό σας εκπαιδευτή ή να γράψετε ένα προφίλ εργασίας χρησιμοποιώντας το βιογραφικό σας στο Google Drive. Μόνο ο Gemini μπορεί να τα κάνει όλα με αυτόν τον ασφαλή, all-in-one τρόπο χωρίς να χρειάζεται να Τα δεδομένα παραδίδονται σε έναν τρίτο πάροχο τεχνητής νοημοσύνης που μπορεί να μην γνωρίζετε ή να μην εμπιστεύεστε», δήλωσε ο Sameer Samat, Πρόεδρος του Android Ecosystem της Google.

«Επειδή το Android είναι το πρώτο λειτουργικό σύστημα για κινητά που διαθέτει ένα μεγάλο μοντέλο πολυτροπικής τεχνητής νοημοσύνης στη συσκευή - που ονομάζεται Gemini Nano - τα δεδομένα σας δεν φεύγουν ποτέ από το τηλέφωνό σας ενώ χειρίζεστε μερικές από τις πιο ευαίσθητες περιπτώσεις χρήσης».

Το AI ενσωματώνεται περαιτέρω στο Android

Το μεγαλύτερο πλεονέκτημα της Google στην προώθηση τηλεφώνων με τεχνητή νοημοσύνη είναι αναμφίβολα τα πολλαπλά εργαλεία εφαρμογών της και το οικοσύστημα Android Η Google έχει πλέον δισεκατομμύρια χρήστες Android και προφανώς υπάρχει περισσότερος χώρος για αυτό από μια εφαρμογή chatbot.

Πέρυσι, ως το πρώτο smartphone με επίκεντρο την τεχνητή νοημοσύνη, η σειρά Pixel 8 της Google έφερε διάφορα χαρακτηριστικά τεχνητής νοημοσύνης. Για παράδειγμα, οι χρήστες μπορούν να αφαιρέσουν, να μετακινήσουν ή να επεξεργαστούν μεμονωμένα στοιχεία σε μια φωτογραφία, να μετακινήσουν εκφράσεις μεταξύ φωτογραφιών για να λάβουν την καλύτερη σύνθετη φωτογραφία, να αναζητήσουν με βάση στιγμιότυπα οθόνης ή ένα "κυκλικό τμήμα" της οθόνης και πολλά άλλα.

Όλα αυτά τα χαρακτηριστικά εμφανίστηκαν για πρώτη φορά στη σειρά Pixel 8 και έκτοτε εξαπλώθηκαν σε όλο το οικοσύστημα Android.

Η λειτουργία "κύκλος αναζήτησης" της Google εμφανίστηκε για πρώτη φορά στο τηλέφωνο Galaxy AI της Samsung, ως συνεργάτης του οικοσυστήματος Android της Google, τα τηλέφωνα της Samsung έχουν προσθέσει επίσης πολλές παρόμοιες λειτουργίες AI. Ο προαναφερόμενος βοηθός AI Gemini εμφανίζεται επίσης στα Galaxy Z Fold6 της Samsung, Motorola Razr+ και σε άλλα κινητά τηλέφωνα.

Ταυτόχρονα, άλλοι κατασκευαστές έχουν επίσης ανακοινώσει ότι θα λανσάρουν τη δική τους τεχνητή νοημοσύνη για κινητά τηλέφωνα.

Σε σχεδόν ένα χρόνο, τα "κινητά τηλέφωνα τεχνητής νοημοσύνης" μπορούν να ειπωθούν ότι έγιναν η βασική προοπτική της άποψης της αγοράς για τα κινητά τηλέφωνα, όχι μόνο για τα κινητά τηλέφωνα της Google. Το πώς να χρησιμοποιήσετε το AI για να κάνετε τους ανθρώπους να λάμπουν είναι μια πρόκληση για την Google. Προς το παρόν, όπως όταν κυκλοφόρησε το τηλέφωνο πρώτης γενιάς με τεχνητή νοημοσύνη Pixel 8, το μεγαλύτερο αποτέλεσμα της Google είναι ακόμα διάφορα gadget λειτουργιών AI.

Στη φετινή εκδήλωση Made By Google, τα βασικά νέα χαρακτηριστικά τεχνητής νοημοσύνης της Google περιλαμβάνουν:

  • Το "Add Me" επιτρέπει ακόμη και στο άτομο που παίρνει τη φωτογραφία να συμπεριληφθεί στην ομαδική φωτογραφία.

  • "Pixel Studio", μια γεννήτρια εικόνας AI που μοιάζει πολύ με την επερχόμενη εφαρμογή Image Playground της Apple.

  • "Pixel Screenshots", το οποίο σαρώνει τη συλλογή ενός χρήστη για στιγμιότυπα οθόνης και τα μετατρέπει σε μια βάση δεδομένων με εύκολη αναζήτηση.

  • Οι "Σημειώσεις κλήσεων" μπορούν να αποθηκεύσουν μια περίληψη των πληροφοριών στο ιστορικό κλήσεων Μετά την ενεργοποίηση αυτής της λειτουργίας, όλοι οι συμμετέχοντες στην κλήση θα λάβουν μια ειδοποίηση.

Μεταξύ αυτών, αν θέλετε να εφαρμόσετε τη λειτουργία "Προσθήκη μου", ο φωτογράφος πρώτα βγάζει μια φωτογραφία χωρίς τον εαυτό του, και μετά ένα άλλο άτομο γίνεται φωτογράφος και βγάζει άλλη φωτογραφία. Το Pixel θα συγχωνεύσει τις δύο φωτογραφίες για να διασφαλίσει ότι όλοι βρίσκονται σε μία φωτογραφία, επομένως δεν χρειάζεται να ζητήσετε από έναν άγνωστο να τραβήξει τη φωτογραφία.


Λειτουργία ομαδικής φωτογραφίας|Πηγή εικόνας: Google

Ένα σημαντικό σημείο πώλησης της τοποθέτησης της Google για τη σειρά Pixel 9 είναι επίσης η κάμερα AI, την οποία αυτοαποκαλείται «η πρώτη κάμερα στον κόσμο που βασίζεται σε AI». Τα στελέχη της Google δήλωσαν επίσης ότι "Το Pixel ήταν το πρώτο τηλέφωνο που χρησιμοποίησε το Night Sight σε φωτογραφίες και βίντεο και τώρα είναι επίσης το πρώτο τηλέφωνο που απαθανάτισε εκπληκτικά πανοραμικά τοπία και αστικά τοπία σε περιβάλλοντα χαμηλού φωτισμού, επίσης, στελέχη της Google." συνέκρινε τις φωτογραφίες που τραβήχτηκαν από το Pixel 9 Pro XL με το iPhone 15 Pro Max της Apple.


Εφέ νυχτερινής φωτογραφίας κινητού τηλεφώνου Google εναντίον κινητού τηλεφώνου Apple|Πηγή: Google

Το εξαιρετικά μεγάλης αναδιπλούμενης οθόνης Pixel 9 Pro Fold διαθέτει επίσης μια λειτουργία "Made You Look" που μπορεί να χρησιμοποιηθεί για να προσελκύσει την προσοχή των χρηστών και να τους κάνει να χαμογελούν στην κάμερα. Όταν χρησιμοποιείτε αυτήν τη λειτουργία, ξεδιπλώστε το τηλέφωνο και θα αναπαραχθεί ένα εντυπωσιακό οπτικό κινούμενο σχέδιο στη μία πλευρά της εξωτερικής οθόνης, όπως ένα έντονο κίτρινο κοτόπουλο ή άλλα αστεία κινούμενα σχέδια.


Λειτουργίες οθόνης που προσελκύουν την προσοχή των χρηστών|Πηγή εικόνας: Google

Μετά τη λήψη μιας φωτογραφίας, υπάρχουν επίσης εργαλεία επεξεργασίας φωτογραφιών και το Magic Editor του Google Photos κυκλοφόρησε ορισμένες νέες λειτουργίες φέτος. Για παράδειγμα, η λειτουργία "Auto Frame" χρησιμοποιείται για τη διόρθωση της γωνίας των φωτογραφιών με κλίση, ενώ χρησιμοποιείται η γενετική τεχνητή νοημοσύνη για να συμπληρώσει τα κενά γύρω από το θέμα για να δημιουργήσει ένα ευρύτερο οπτικό πεδίο. Υπάρχει επίσης μια λειτουργία "Reimagine" Αφού περιγράψετε το επιθυμητό εφέ στο πλαίσιο κειμένου, μπορείτε να χρησιμοποιήσετε τη γενετική τεχνητή νοημοσύνη σε εικόνα P, όπως να μετατρέψετε το γρασίδι στο έδαφος σε αγριολούλουδα, να προσθέσετε ένα αερόστατο σε ένα συγκεκριμένο μέρος του. ουρανό, κλπ.

Επιπλέον, η Google ακολούθησε τα βήματα της Apple και κυκλοφόρησε μια λειτουργία "Satellite SOS" για χρήση σε καταστάσεις έκτακτης ανάγκης Αυτή η δυνατότητα επιτρέπει στους χρήστες να επικοινωνούν με τους ανταποκριτές έκτακτης ανάγκης και να μοιράζονται πληροφορίες τοποθεσίας όταν δεν υπάρχει υπηρεσία κινητής τηλεφωνίας. Σύμφωνα με στελέχη της Google, η σειρά Pixel 9 θα είναι «τα πρώτα τηλέφωνα Android που θα μπορούν να χρησιμοποιούν δορυφορικό SOS».


Δορυφορική λειτουργία SOS|Πηγή εικόνας: Google

Από λειτουργική άποψη, ο συνδυασμός του Pixel 9+ Gemini δεν οδηγεί πολύ τους σημερινούς εγχώριους κατασκευαστές Android όσον αφορά την τεχνητή νοημοσύνη. Ωστόσο, πρέπει να σημειωθεί ότι, σε αντίθεση με την Apple, η Google έχει τα δικά της συστήματα και τερματικά, καθώς και μεγάλα μοντέλα και υπολογιστικό νέφος σύννεφο πυρήνα».

Μόλις υπάρξει μια σημαντική ανακάλυψη στο τερματικό AI, η Google, η οποία είναι έτοιμη για όλα, έχει πολύ μεγαλύτερες πιθανότητες να «το κάνει ξανά σπουδαίο» από τους ανταγωνιστές της.

Ίσως αυτό που λείπει από την Google είναι απλώς μια μεγαλύτερη φιλοδοξία.

*Πηγή εικόνας κεφαλίδας: Google

Αυτό το άρθρο είναι ένα πρωτότυπο άρθρο από το Geek Park Για επανέκδοση, επικοινωνήστε με το Geek Jun στο WeChat geekparkGO