Τα στοιχεία επικοινωνίας μου
Ταχυδρομείο[email protected]
2024-08-14
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Ο Jin Lei προέρχεται από τον ναό Aofei
Qubits | Δημόσιος λογαριασμός QbitAI
Ανατροπή, μεγάλη ανατροπή.
Μόλις νωρίς σήμερα το πρωί, η Google έκδοση της Her—Gemini LiveΚυκλοφόρησε επίσημα.
Άλλωστε, είναι προφανώς ένα σημείο αναφοράς για το GPT-4o του OpenAI, το οποίο μπορεί να πει κανείς ότι έχει τραβήξει την προσοχή του τεχνολογικού κύκλου.
Στο demo που κυκλοφόρησε στην επίσημη ιστοσελίδα,Φωτογραφία Q&AΤο αποτέλεσμα της συνάρτησης είναι το εξής:
Η γενική λειτουργία που εφαρμόζει είναι να χρησιμοποιεί το κινητό σας για να τραβήξει φωτογραφίες από αφίσες συναυλιών και να αφήνει το Gemini να ελέγξει το ημερολόγιο του χρήστη για να δει αν το πρόγραμμα είναι κατάλληλο για συμμετοχή.
Και μπορείτε επίσης να εκτελέσετε μια σειρά επακόλουθων λειτουργιών με βάση αυτό, συμπεριλαμβανομένου του ελέγχου των ναύλων σε καθορισμένο χρόνο κ.λπ.
Ωστόσο... όταν ήρθε η επιτόπια επίδειξη της συνέντευξης Τύπου, το ύφος του πίνακα άλλαξε εντελώς.
Παρακαλώ παρακολουθήστε βίντεο:
Διεύθυνση βίντεο: https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA
Χμ... Η έκφραση του μικρού αδερφού είναι κάπως πανικόβλητη με γυμνό μάτι.
Ακόμη και το γνωστό τεχνολογικό μέσο TechCrunch έχει συμπεριλάβει τέτοια emoji:
Μερικοί χρήστες του Διαδικτύου ενεργοποίησαν ακόμη και τη λειτουργία hot comment:
Μπορώ να κάνω αναζήτηση στο ημερολόγιό μου σε 10 δευτερόλεπτα.
Φυσικά, αυτό είναι μόνο ένα μικρό επεισόδιο του Made by Google σήμερα.
Για περισσότερες πληροφορίες σχετικά με το Gemini Live, ας συνεχίσουμε να διαβάζουμε παρακάτω.
Όπως μόλις αναφέραμε, οι λειτουργίες του Gemini Live και του GPT-4o μοιάζουν πολύ.
Εκτός από το "photo Q&A", μπορεί επίσης να διεξάγει συνομιλίες σε πραγματικό χρόνο και ακόμη και να διακόπτει τους Gemini κατά τη διαδικασία απάντησης.
Εννοείται ότι οι λειτουργίες του Gemini Live είναι προς το παρόν ανοιχτές σε Προχωρημένους συνδρομητές στο σύστημα Android (μόνο στα Αγγλικά).
Τις επόμενες εβδομάδες, αυτή η δυνατότητα θα επεκταθεί σε περισσότερες γλώσσες και θα διατεθεί στο iOS.
υπάρχωακούγονται οι διάλογοιΑπό την άλλη, ξεκίνησε το Gemini Live10 είδηΝέοι ήχοι είναι διαθέσιμοι για επιλογή και το εφέ είναι το εξής:
Διεύθυνση βίντεο: https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA
υπάρχωλειτουργώΑπό την άλλη, δεδομένου ότι το Gemini είναι πλήρως ενσωματωμένο στο σύστημα, μπορεί να γίνει επίκλησή του πατώντας και κρατώντας πατημένο το κουμπί λειτουργίας ή λέγοντας "Hey Google".
Για παράδειγμα, όταν γράφετε ένα email, αφήστε το Gemini να σας βοηθήσει να δημιουργήσετε μια αντίστοιχη εικόνα.
Ωστόσο, τα ξένα μέσα έχουν μικτές κριτικές σχετικά με αυτό το χαρακτηριστικό.
Για παράδειγμα, ένας συγγραφέας από το The Verge έγραψεΠροσωπικό τεστΟ τίτλος που δίνεται αργότερα είναι——
Το Gemini Live είναι πιο γρήγορο από το Google, αλλά πιο άβολο.
Ο συγκεκριμένος λόγος ήταν ότι το ηχοσύστημα αυτοκινήτου του συγγραφέα απέτυχε ξαφνικά σε ένα τριήμερο οδικό ταξίδι.
Η εύρεση λύσης χρησιμοποιώντας τον αρχικό Βοηθό Google χρειάστηκε τουλάχιστον πέντε λεπτά, αλλά το Gemini Live χρειάστηκε μόνο 15 δευτερόλεπτα.
Ωστόσο, η συνεχής ομιλία του Gemini Live κατά τη διάρκεια της συνομιλίας και η μέθοδος αλληλεπίδρασης που απαιτεί από τους χρήστες να διακόπτουν ενεργά έκανε τον συγγραφέα να αισθάνεται αμήχανα.
Πιστεύει:
Η φωνή και ο τρόπος ομιλίας είναι τόσο ανθρώπινος που νιώθω άβολα να τη διακόψω.
Περισσότερο συναίσθημα επενδύεται στην αλληλεπίδραση με το Gemini Live παρά στη χρήση του ως εργαλείο επίλυσης προβλημάτων.
Συμπτωματικά, για το Gemini Live inΤρέξτε στο σύννεφοΗ Wall Street Journal έδωσε επίσης μια οξεία αξιολόγηση σε αυτό το σημείο--
Πρόοδος στο διάλογο, οπισθοδρόμηση στη λειτουργικότητα.
Ειδικά σε τεχνικό επίπεδο, το GPT-4o είναι ένα σύστημα από άκρο σε άκρο, αλλά αν κρίνουμε από το περιεχόμενο που κυκλοφόρησε από την Google, το Gemini Live δεν ισχύει.
Αντίθετα, τα συστήματα STT, VAD, LLM και TTS είναι ενσωματωμένα:
Επιπλέον, το Gemini Live εμφανίζεται και στη νέα σειρά κινητών τηλεφώνων Pixel που κυκλοφόρησε από την Google.
Συμπεριλαμβανομένων των Pixel 9 Pro Fold, Pixel 9, Pixel 9 Pro και Pixel 9 Pro XL.
Όσον αφορά τις λειτουργίες AI, τα τηλέφωνα Pixel της Google έχουν προσθέσει μια δυνατότητα που ονομάζεται"Προσθήκη με"λειτουργία.
Η τεχνολογία επαυξημένης πραγματικότητας (AR) και AI μπορούν να χρησιμοποιηθούν για να «μπουκώσουν» χαρακτήρες σε δύο διαφορετικές φωτογραφίες μαζί.
Αν και η κυκλοφορία του Gemini Live από την Google αυτή τη φορά είναι μια απάντηση στο OpenAI GPT-4o, από τότε που ξεκίνησε η εποχή των μεγάλων μοντέλων, μπορούμε να δούμε μια πολύ προφανή τάση——
Η Google δεν μπορεί να συμβαδίσει με το OpenAI.
Πρώτον, το OpenAI έγινε πρωτοπόρος στο πιο κρίσιμο σημείο της κυκλοφορίας του ChatGPT, αλλά η Google κυκλοφόρησε στη συνέχεια το Bard, το οποίο έμοιαζε πολύ με το Gemini Live αυτή τη φορά, και στη συνέχεια ανατράπηκε.
Τον τελευταίο ενάμιση χρόνο, φαίνεται ότι το OpenAI ηγείται της κυκλοφορίας όλων των μεγάλων μοντέλων και εφαρμογών.
Από την άλλη πλευρά, στη Google, όχι μόνο η τεχνολογία δείχνει αργό ρυθμό, ακόμη και από την άποψη της κοινής γνώμης, το OpenAI επισκίασε τη μεγαλύτερη ετήσια εκδήλωση της Google (συνέδριο I/O) με την είδηση μιας αλλαγής προσωπικού (παραίτηση του Ilya).
Γιατί λοιπόν η Google αποτυγχάνει στην εποχή των μεγάλων μοντέλων;
Από την άποψη αυτή,Πρώην διευθύνων σύμβουλος της GoogleΟ Έρικ Σμιντ (που υπηρέτησε από το 2001 έως το 2011) εξέφρασε τις απόψεις του στην τελευταία του ομιλία στο Στάνφορντ:
Η Google αποδίδει μεγάλη σημασία στην ισορροπία επαγγελματικής και προσωπικής ζωής, όπως να επιτρέπει στους υπαλλήλους να εργάζονται από το σπίτι.
Αλλά στις startups, δουλεύουν πολύ σκληρά.
Διεύθυνση βίντεο: https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA
Μερικοί χρήστες του Διαδικτύου έδωσαν μάλιστα την είδηση:
Ο αδερφός μου είναι κορυφαίος προγραμματιστής τεχνητής νοημοσύνης στην Google. Έχει 3 θέσεις πλήρους απασχόλησης και ξοδεύει μόνο 2 ώρες την ημέρα στη Google.
Λοιπόν, τι πιστεύετε για αυτό, αφήστε ένα μήνυμα στην περιοχή σχολίων για να το συζητήσετε.
Σύνδεσμοι αναφοράς:
[1]https://x.com/techcrunch/status/1823410187404743131?s=46&t=6eepxw1G6XRQ7VO0ANjJWg
[2]https://x.com/GoogleDeepMind/status/1823409674739437915
[3]https://blog.google/products/gemini/made-by-google-gemini-ai-updates/
[4]https://x.com/alexkehr/status/1823480786349383879?s=46&t=6eepxw1G6XRQ7VO0ANjJWg
[5]https://www.theverge.com/2024/8/13/24219736/gemini-live-hands-on-pixel-event
[6]https://blog.google/products/pixel/google-pixel-9-new-ai-features/#pixel9phones