νέα

κάναμε μια βιντεοκλήση στο ai και διαπιστώσαμε ότι φαινόταν ότι μπορεί να μιλήσει για τα πάντα. . .

2024-08-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


στο συνέδριο openai πριν από τρεις μήνες, πιστεύω ότι κάποιοι από εσάς είδαν το gpt-4o.δυνατότητες μεταξένιας συνομιλίας βίντεο.

υπάρχει επίσης το project astra που κυκλοφόρησε από την google, το οποίο δεν είναι κατώτερο από το gpt-4o όσον αφορά τη δύναμη.


εκείνη την εποχή, σχεδόν ολόκληρο το διαδίκτυο καυχιόταν για το πόσο ισχυρές είχαν εξελιχθεί οι διαδραστικές δυνατότητες του ai και χρησιμοποιήθηκαν όροι όπως το epic και το next level.

τι συνέβη η λειτουργία βιντεοκλήσης που υποσχέθηκε το gpt-4o έχει καθυστερήσει ξανά και ξανά για αρκετούς μήνες.κάθε ένα από αυτά είναι σχεδόν εξοργισμένο από τους κακούς κριτικούς. . .

ωστόσο, διαπίστωσα ότι φαίνεται να υπάρχει ένας κανόνας στον κύκλο της τεχνητής νοημοσύνης, δηλαδή, δεν μπορείτε να κρατήσετε τους ανθρώπους να περιμένουν πολύ καιρό για καλά πράγματα. βλέπετε, η sora ήταν μυστικοπαθής για περισσότερο από μισό χρόνο. ως αποτέλεσμα, ο keling, ο luma ai και ο zhipu qingying εμφανίστηκαν το ένα μετά το άλλο.

τις τελευταίες δύο ημέρες, στο συνέδριο εξόρυξης δεδομένων kdd στη βαρκελώνη, ο zhipu βρέθηκε μπροστά στην παγκόσμια ακαδημαϊκή κοινότητα και βιομηχανία.όχι μόνο κυκλοφόρησε το τελευταίο μεγάλο βασικό μοντέλο glm-4-plus, αλλά έχει επίσης αναβαθμίσει τη λειτουργία βιντεοκλήσεων του zhipu qingyan.


επιτρέψτε μου να επισημάνω τα βασικά σημεία για όλους.είναι αυτός στο θρύλο που μπορεί να δει και να συνομιλήσειόλα συμπεριλαμβάνονταιη λειτουργία βιντεοκλήσης είναι πλέον διαθέσιμη απευθείας στην εφαρμογή qingyan. μπορείτε να κατεβάσετε πρώτα την εφαρμογή και να υποβάλετε αίτηση για δοκιμή.

ας μην μιλήσουμε για τίποτα άλλο σε σύγκριση με το openai, η ταχύτητα του zhipu είναι ήδη καλύτερη από αυτή του openai. . .

επομένως, μόλις ξεκίνησε η λειτουργία βιντεοκλήσεων του qingyan, ο κύριος bianbing ήταν ο πρώτος που τη χρησιμοποίησε. ανοίξτε την εφαρμογή qingyan, κάντε κλικ στο κουμπί κλήσης στην κάτω δεξιά γωνία, μετά μεταβείτε στο βίντεο και ξεκινήστε απευθείας την αναπαραγωγή ~


οι φίλοι πρέπει επίσης να γνωρίζουν ότι ένας από τους σημαντικούς λόγους για τους οποίους το gpt-4o είναι τόσο δημοφιλές είναι ότι έχει μια πολύ ισχυρή ικανότητα κατανόησης βίντεο.

όσο για το πιο βασικό πράγμα, η ικανότητα κατανόησης βίντεο του qingyan πρέπει να δοκιμαστεί πρώτα, σωστά;

ο κριτής έριξε μια ματιά στην αίθουσα συνεδριάσεων όπου το συντακτικό μας τμήμα κάνει συνήθως καταιγισμό ιδεών, για να δει αν μπορούσε να μαντέψει τι έκανα με βάση το περιβάλλον που το περιέβαλλε, επίσης σκόπιμα τίναξε την κάμερα χωρίς να κρατήσει το βίντεο εντελώς ακίνητο.

μαντέψτε, και μόνο που έλεγα «ουάου, μάντεψε τι κάνεις» σχεδόν με δυσκόλεψε. αλλά το να κάθεσαι στο τραπέζι στην αίθουσα συνεδριάσεων δεν είναι λάθος τα χάρτινα ποτήρια στο τραπέζι, το τηλεχειριστήριο και η τηλεόραση δίπλα του περιγράφονται επίσης με μεγάλη ακρίβεια.

όταν έβαλα τον φακό στον υπολογιστή του συναδέλφου μου, μπορούσα να δω ότι επεξεργαζόταν ένα βίντεο.

μη μου πείτε, αυτό το είδος της ικανότητας να αντιλαμβάνεστε το συνολικό περιβάλλον γύρω σας έχει παρατηρηθεί μόνο στο openai και στο demo της google. σήμερα, το βίωσα προσωπικά.

επιπλέον, το qingyan είναι το ίδιο με το gpt-4o.μπορείτε να διακόψετε οποιαδήποτε στιγμή κατά τη διάρκεια της συνομιλίας.κατά καιρούς, θα χρησιμοποιεί επίσης τις τροπικές λέξεις "ouch" και "ouch" και θα γελάει πριν μιλήσει, όπως ακριβώς να συνομιλεί με ένα πραγματικό άτομο.

στη συνέχεια, δοκίμασα τη λειτουργία αναγνώρισης συγκεκριμένων αντικειμένων για να δω το απόθεμα γνώσης του qingyan.

ξεκινώντας από την απλούστερη σάρωση του σταθμού εργασίας, ουσιαστικά δεν λείπουν μεγάλα στοιχεία, όπως λευκά πληκτρολόγια, μαύρα ποντίκια και οθόνες. οι χαρακτήρες κινουμένων σχεδίων στο τζάμι.

δεν μπορώ να πω 100%, αλλά σε αυτό το τραπέζιτουλάχιστον 80%-90%όλα τα είδε ο qingyan.

επιπλέον, το qingyan έχει και μια άλλη λειτουργία, δηλαδήαναγνώριση κύκλου, κύκλωσα από απόσταση το μεγάλο στερεοφωνικό του συναδέλφου μου ήξερε τη μάρκα, το μοντέλο και ακόμη και τον συγκεκριμένο σκοπό.

αν και υπάρχουν λέξεις στα ηχεία, ο καθένας θα πρέπει να μπορεί να δει τη διαύγεια. πρέπει να πω ότι τα καθαρά μάτια είναι πραγματικά εύχρηστα. . .

επιπλέον, βρήκα και αυτόη αναγνώριση των αντικειμένων από τον qingyan υπερβαίνει τις απλές κατηγορίες.

για παράδειγμα, αν ρωτήσετε αν αυτό το χειριστήριο παιχνιδιών είναι από τη sony ή τη microsoft, μπορεί να το αναλύσει με βάση το σχήμα του χειριστηρίου αυτό είναι το xbox της microsoft. αντί να σας πω απλώς ότι πρόκειται για ένα χειριστήριο παιχνιδιών ή απλά να το μπερδεύουμε και να μην μπορούμε να το εξηγήσουμε ξεκάθαρα.

υπάρχουν επίσης οι λεπτομέρειες αυτού του αρχαίου τηλεφώνου χαρακτηριστικών, της nokia, το συγκεκριμένο μοντέλο είναι το n95 και το κλασικό μοντέλο του 2007.

αργότερα, ζήτησα από τον qingyan να αναγνωρίσει το σύστημα υπολογιστή, να μαντέψει την ηλικία του tony κοιτάζοντας τις φωτογραφίες του tony και να μαντέψει τα ονόματα των ανθρώπων κοιτάζοντας φωτογραφίες διασημοτήτων. . . ας το θέσω έτσι, από τότε που άρχισα να χρησιμοποιώ το qingyan, τώρα θέλω να ανοίξω μια βιντεοκλήση και να ρωτήσω για οτιδήποτε προλάβω.

φυσικά, είναι διασκεδαστικό. υπάρχουν στην πραγματικότητα πολλές μορφές βιντεοκλήσεων.πρακτικά σενάρια

ας πάρουμε ως παράδειγμα την καθημερινή αναζήτηση θεμάτων και υλικών του τμήματος σύνταξης τα καυτά σημεία στην αυτοκινητοβιομηχανία αυτές τις δύο ημέρες είναι βασικά αδιαχώριστα από το σαλόνι αυτοκινήτου του τσενγκντού αυτή τη στιγμή, μπορείτε να ρωτήσετε την κινγκγιάν για την έκθεση αυτοκινήτου του τσενγκντού θέματα κατά τη διάρκεια της συνομιλίας.

κυρίως, βρήκα επίσης ότι ο qingyan έχειλειτουργία μνήμης, του μίλησα για αυτό στην τελευταία βιντεοκλήση και την επόμενη φορά που το άνοιξα, μου ήρθε και με ρώτησε ποια νέα ενεργειακά οχήματα στην έκθεση αυτοκινήτου ακολούθησα.

υπάρχει επίσης το μάθημα για το σπίτι, το οποίο είναι το πιο ενοχλητικό πράγμα για τους γονείς στο παρελθόν, η αλληλεπίδραση με τεχνητή νοημοσύνη βασιζόταν ακόμα στη λήψη φωτογραφιών και στη μεταφόρτωση ερωτήσεων, αλλά αν αντικατασταθεί από βιντεοκλήσεις, θα είναι το ίδιο με τις ατομικές κλήσεις. ένα μάθημα για το σπίτι με διαδικτυακούς καθηγητές.

προσπάθησα να ζητήσω από τον qingyan να κάνει μερικά μαθηματικά προβλήματα χαμηλής δυσκολίας.μερικές απλές ερωτήσεις άλγεβρας στο δημοτικό και στο γυμνάσιο μετά βίας μπορούν να λυθούν.

δεν ξέρω αν έχετε παρατηρήσει ότι όταν λύνετε προβλήματα, το qingyan δεν θα σας πει όλη τη διαδικασία αμέσως, ούτε θα σας δώσει απλώς ένα αποτέλεσμα, θα σας καθοδηγήσει βήμα προς βήμα, επιτρέποντάς σας να έχετε μια διαδικασία σκέψης.

εκτός από τα μαθηματικά, έχω δοκιμάσει επίσης κινέζικα και αγγλικά ένα προς ένα, δεν μπορεί να πει κανείς ότι είναι ανώτερος δάσκαλοςείναι απολύτως επαρκής για την καθημερινή εργασία, την απομνημόνευση λέξεων και την απομνημόνευση αρχαίων ποιημάτων.

αν πιστεύετε ότι αυτές οι σκηνές δεν είναι αρκετές, ας χρησιμοποιήσουμε λίγη περισσότερη φαντασία.

δεν έχω εμπειρία να μαγειρεύω για πρώτη φορά, η λάμπα στο δωμάτιό μου είναι σπασμένη και δεν ξέρω πώς να καλλιεργήσω πράσινα φυτά. . . αν συναντήσετε παρόμοια πράγματα στη ζωή και δεν ξέρετε τι να κάνετε, γιατί να μην ρωτήσετε τον qingyan.

για παράδειγμα, πολλά παιδιά μπορεί να μην είναι σε θέση να διακρίνουν τους θετικούς και αρνητικούς πόλους της μπαταρίας προς το παρόν, έτσι προσποιηθήκαμε ότι τοποθετήσαμε την μπαταρία της αριθμομηχανής προς τα πίσω και καταλάβαμε ποιο ήταν το πρόβλημα με λίγες μόνο λέξεις, κάτι που δείχνει ότι έχει ακόμα κοινή λογική στη ζωή.

τέλος πάντων, χρησιμοποιώ το qingyan αυτές τις μέρες, μου αρέσει να το ψάχνω όταν δεν έχω τίποτα να κάνω. επιπλέον, αυτό το gadget είναι ιδιαίτερα ικανόδώστε συναισθηματική αξία, αφήστε το να λέει ιστορίες και αστεία και να απαντήσει σε κάθε πρόταση.

παίξτε blackjack με φίλους και μπορεί να λειτουργήσει ακόμη και ως διαιτητής.

αναρωτιέμαι αν μπορούμε να εξελιχθούμε σε σημείο που να μπορούμε να παίζουμε mahjong στο μέλλον και να αφήσουμε το ai να αναλάβει. δεν είναι αυτό πιο ενδιαφέρον από τις αρχικές δακτυλογραφημένες και φωνητικές συνομιλίες;

για να είμαι ειλικρινής, αυτή η σημαντική αναβάθμιση του qingyan μου έφερε ακόμα πολλές εκπλήξεις, αλλά υπάρχουν ακόμα πολλές μικρές ατέλειεςμπορεί να λέει ανοησίες, να προσδιορίζει εσφαλμένα τα πράγματα και να βγάζει κάποιες ανοησίες.


για παράδειγμα, όταν ήμουν διαιτητής μπλάκτζακ, είπα κάποτε ότι το 9 ήταν ένα 4 και το μπαστούνι ήταν ένα ρόπαλο. . .

ωστόσο, απλώς καθιστώντας τις βιντεοκλήσεις ai διαθέσιμες στην κίνα πριν από το openai και την google,πρέπει επίσης να δώσουμε ένα μπράβο στον zhipu.

αυτή τη φορά, η πρώτη παρτίδα λειτουργιών βιντεοκλήσεων θα είναι διαθέσιμη μόνο σε ορισμένους χρήστες, η zhipu θα επεκτείνει σταδιακά την κλίμακα, ώστε όλοι οι εργαζόμενοι να μπορούν να τη χρησιμοποιήσουν το συντομότερο δυνατό. αν είστε πραγματικά άπληστοι,μπορείτε να κάνετε λήψη της εφαρμογής qingyan ή να συνδεθείτε στον υπολογιστή (chatglm.cn) για να υποβάλετε αίτηση για εσωτερική δοκιμή στον ιστότοπο.

επιπλέον, μπορεί να υπάρχουν πολλοί φίλοι που δεν είναι εξοικειωμένοι με το zhipu, ας το πούμε έτσι, αυτή η εταιρεία μπορεί επίσης να ειπωθεί ότι είναι η καλύτερη στον κύκλο της ai.δημοφιλές τηγανητό κοτόπουλο.


ειδικά φέτος, οι ενέργειές τους σε μεγάλα μοντέλα είναι εξαιρετικά σκληρές από την τρελή επανάληψη βασικών μεγάλων μοντέλων μέχρι τη συχνή εφαρμογή μεγάλων μοντέλων, οι ενέργειες της zhipu δεν σταμάτησαν ποτέ.

σε αυτό το kdd, το νέο τους μεγάλο μοντέλο glm-4-plus έχει κάνει μεγάλες βελτιώσεις στην κατανόηση της γλώσσας και στο μεγάλο κείμενο.


επιπλέον, η zhipu επιμένει στη δημιουργία μοντέλων ανοιχτού κώδικα τα δεδομένα δείχνουν ότι οι αθροιστικές λήψεις των μοντέλων ανοιχτού κώδικα της zhipu ήτανξεπέρασε τα 20 εκατ.

ούτως ή άλλως, η zhipu πρωτοστατεί στο να κάνει μια τέτοια «φασαρία» αυτή τη φορά εκτιμάται ότι οι εγχώριοι αλλά και οι ξένοι κύκλοι τεχνητής νοημοσύνης θα ξεκινήσουν σύντομα ένα κύμα τρελλών νέων προϊόντων.


αυτό είναι φυσικά καλό για εμάς τους χρήστες. ειδικά για τις βιντεοκλήσεις τεχνητής νοημοσύνης, μια νέα μορφή αλληλεπίδρασης, όσο προχωράτε, τόσο μεγαλύτερο είναι το περιθώριο φαντασίας σε σενάρια εφαρμογών.

για παράδειγμα, εάν η τεχνητή νοημοσύνη είναι εγκατεστημένη σε γυαλιά ή περιδέραια, μπορεί να μην χρειαστεί καν ένα κινητό τηλέφωνο στο μέλλον, ή μπορεί να εγκατασταθεί στο δεκανίκι ενός τυφλού για να βοηθήσει στην καθοδήγηση ή μπορεί να συνδυαστεί με ενσωματωμένη νοημοσύνη για να επιτρέψει το ρομπότ για να καταλάβει πραγματικά τι βλέπει.

για να δανειστώ τα λόγια του ceo zhipu zhang peng:«τουλάχιστον δεν το έχουμε δει ακόμα (όλα συμπεριλαμβάνονται) ανώτατο όριο τεχνολογίας».

μπορείτε επίσης να σκεφτείτε πόσο μακριά θα εξελιχθεί η τεχνητή νοημοσύνη στο μέλλον και τι αξία θα δημιουργήσει.

γράψτε ένα άρθρο: xixi

εκδίδω:jiangjiang

συντάκτης τέχνης:χουανιάν

εικόνες, πηγές

καθαρά λόγια σοφίας

μέρος του δικτύου πηγής εικόνας