νέα

Έκδοση υπολογιστή Doubao "unboxed", από ένταση φωνής σε διάλεκτο

2024-08-24

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Στις 22 Αυγούστου, το Volcano Engine AI Innovation Tour άνοιξε στη Σαγκάη.Οι δυνατότητες φωνής είναι το επίκεντρο αυτής της έκδοσης.

Η μεγάλη ομάδα μοντέλων εστιάζει στην αλληλεπίδραση και την έξοδο συνομιλίας AI σε πραγματικό χρόνο Seed-ASR, αυτό το επίτευγμα μπορεί να είναι συγκρίσιμο με τη νέα προηγμένη λειτουργία φωνής του ChatGPT που κυκλοφόρησε από την OpenAI στις 31 Ιουλίου.

Οι υπάλληλοι του OpenAI μπόρεσαν να διακόψουν το chatbot και να του ζητήσουν να αφηγηθεί την ιστορία με διαφορετικό τρόπο, και το chatbot ανέλαβε τις διακοπές τους και προσάρμοσε τις απαντήσεις του, σύμφωνα με βίντεο που δημοσιεύτηκαν εκείνη την εποχή στα μέσα κοινωνικής δικτύωσης.

Για να το θέσω απλά, υποστηρίζει «τη σκέψη και την ομιλία ταυτόχρονα».Έχετε ισχυρότερη επίγνωση του πλαισίου, επομένως έχετε καλύτερη ικανότητα συλλογισμού και πιο ακριβή αποτελέσματα απαντήσεων.

Το εντυπωσιακό είναι ότισακούλα φασολιώνΙσχυρισμοί για τις λεκτικές του ικανότητεςΥποστηρίζει αναγνώριση μοντέλουμανταρίνικαι Καντονέζικα, Σαγκαϊνέζικα, Σετσουάν, Σιάν, Χοκίν και άλλες κινεζικές διαλέκτους.

Αυτό με κάνει να ανυπομονώ να του μιλήσω στο Χονγκ Κονγκ και στο Σιτσουάν.

Στη συνέχεια θα το βασίσω στην έκδοση 1.19.5_macΈκδοση υπολογιστή Doubao AI,δοκιμήΑνάγνωση κειμένου AI και αναγνώριση στιγμιότυπου οθόνηςΌπως και το πρόσφατα δημοφιλέςΠροβολή βίντεο AI, αναγνώριση διαλέκτου AIκαι άλλες λειτουργίες,Δείτε πώς συγκρίνονται οι σακούλες φασολιώνΔιάφορες εκδόσεις ιστού μεγάλα μοντέλα AIΤι νέα πράγματα παρέχονται.

Όπως είναι ο παλιός κανόνας, οι ανήσυχοι φίλοι μπορούν να κάνουν κύλιση προς τα κάτω απευθείας στην ενότητα περίληψης.

Σύντροφος ανάγνωσης κειμένου AI

Το πρώτο είναι η συνοδευτική ανάγνωση κειμένου AI.

Άνοιξα μια είδηση, έκανα κύλιση προς τα κάτω στην ενότητα σύνοψης, επέλεξα την παράγραφο που ήθελα να βοηθήσω και εμφανίστηκε αυτόματα το beanbag.Αναζήτηση, μετάφραση, ερμηνεία, αντιγραφήκαι άλλες λειτουργίες.

υπάρχωΑνακαλύψτε περισσότερες δεξιότητεςΜεταξύ αυτών, είναι η γραμμή εργαλείων οριοθέτησης λέξεων AI, η οποία έχει 6 λειτουργίες όπως συντομογραφία κειμένου, διόρθωση και στίλβωση, 3 λειτουργίες όπως copywriting μέσων κοινωνικής δικτύωσης ή σενάρια βίντεο και 4 λειτουργίες όπως δημιουργία εβδομαδιαίων αναφορών, OKR και κώδικα διόρθωση σφαλμάτων, συμπεριλαμβανομένης της περίληψης των πλεονεκτημάτων και των μειονεκτημάτων, της εξαγωγής στοιχείων εργασιών, του καταιγισμού ιδεών, κ.λπ., καθώς και εκείνων που είναι δύσκολο να ταξινομηθούν,Υπάρχουν συνολικά 22 λειτουργίες μονάδας με προσαρμόσιμες κορυφαίες ρυθμίσεις.

Επέλεξα το πιο βασικό αίτημα για την εξήγηση Doubao Μετά από περίπου 25 δευτερόλεπτα, έλαβα το ακόλουθο περιεχόμενο.

Μπορεί να φανεί ότι ο Doubao συνοψίζει πρώτα τη γενική ιδέα, ακολουθούμενη από μια πιο ομιλητική λαϊκή εξήγηση.Αυτό που είναι εντυπωσιακό είναι ότι προσδιορίζει και εξηγεί ενεργά τα ουσιαστικά της επιλεγμένης παραγράφου κειμένου, όπως ο «Κανόνας Pareto» παραπάνω.

Σε αυτό το σημείο, μένει να δούμε αν οι 22 λειτουργίες που παρέχονται από τη μονάδα Doubao μπορούν να δείξουν μια βαθύτερη κατανόηση όσον αφορά την ευφυΐα και την εξατομίκευση.Αλλά αυτό που είναι ξεκάθαρο είναι ότι όταν ο υπολογιστής λειτουργεί στο παρασκήνιο, δεν χρειάζεται να τον αντιγράψω και να τον επικολλήσω σε άλλο παράθυρο για αναζήτηση ή ακόμη και να διαλέξω τα κατάλληλα ουσιαστικά για αναζήτηση ή να κάνω ερωτήσεις ξεχωριστά.

Αναγνώριση εικόνας AI

Όταν τράβηξα ένα στιγμιότυπο οθόνης χρησιμοποιώντας το Beanbao, εμφανίστηκεΕρώτηση και απάντηση, μετάφραση, QQ bean bagΥπάρχουν 3 στοιχεία συνάρτησης, οπότε επέλεξα ένα μαθηματικό πρόβλημα γυμνασίου και ζήτησα από τον Doubao να το λύσει και να απαντήσει στις ερωτήσεις.

Το Doubao όχι μόνο παρέχει τη διαδικασία λύσης και την απάντηση σε μια ερώτηση στην περιοχή του στιγμιότυπου οθόνης, αλλά παρέχει επίσης αρκετές παρόμοιες ερωτήσεις και τις λύσεις τους.

Αλλά όταν χρησιμοποιώ το Translate και το Ask Doubao, όχι μόνο δεν μπορώ να τμηματοποιήσω τις προτάσεις με έξυπνο τρόπο, αλλά κάνω και συχνά λάθη.

Λαμβάνοντας υπόψη τη δυσκολία της αναγνώρισης εικόνας, πέρασα σε κείμενο παραγράφου, αλλά δεν υπήρξε βελτίωση.

Προσπάθησα ξανάΡωτήστε για τα φασόλια, υποδεέστερος σεΟργανώστε το βασικό περιεχόμενο στην εικόνακαιΕξαγωγή κειμένουΔοκίμασα τις δύο μονάδες ξεχωριστά.

Συνολικά, η απόδοση της λειτουργίας οργάνωσης βασικού περιεχομένου είναι εξαιρετική.Αλλά η εξαγωγή κειμένου δεν αναγνώριζε καν την πλήρη εικόνα, και αυτή ήταν ακόμα τακτοποιημένη γραμματοσειρά.

AI παρακολούθηση βίντεο

Η λειτουργία παρακολούθησης βίντεο με τεχνητή νοημοσύνη περιορίζεται προς το παρόν σε βίντεο του ιστότοπου b και απαιτείταιΆνοιγμα στη διεπαφή DoubaoΚαι συνδεθείτε στο λογαριασμό του σταθμού Β.

Έτσι επέλεξα τυχαία το περιεχόμενο της τρίτης σεζόν και του επεισοδίου 7 του "The Genre of Late Drinking", και μετά από αναμονή για περίπου 20 δευτερόλεπτα, έλαβα το ακόλουθο περιεχόμενο.

Μπορεί να φανεί ότι στο χρονοδιάγραμμα των τμημάτων βίντεο, η αντιστοίχιση εικόνας και κειμένου του AI δεν είναι ακριβής, αλλάΒασικά, μπορεί να επιτευχθεί τμηματοποίηση περιεχομένου.

Το βίντεο είναι μεταγλωττισμένο στα ιαπωνικά με παραδοσιακούς κινέζικους υπότιτλους, κάτι που είναι μάλλον λίγο ενοχλητικό.

Υπάρχει μια σαφής περίληψη της κύριας ιδέας στην αρχή του βίντεο, αλλά δεν αντικατοπτρίζεται ξεκάθαρα στη σύνοψη του κειμένου στα δεξιά. Επιπλέον, στην ενότητα "Ευγνωμοσύνη στους άλλους", ο χαρακτήρας του βίντεο ευχαρίστησε την κα Ozo αντί για τον κύριο Ushida, κάτι που είναι ένα λάθος στη σύνοψη του beanbag.

Αναγνώριση διαλέκτου AI

Σύμφωνα με την επίσημη ανακοίνωση, το Doubao υποστηρίζει Καντονέζικα, Σαγκάη, Σετσουάν, Σιάν και Χόκιεν Στη συνέχεια, ας δούμε αν το Doubao μπορεί να αναγνωρίσει τα σπασμένα καντονέζικα μου (δεν υπάρχει γηγενής διάλεκτος, μόνο τα σπασμένα καντονέζικα που προέκυψαν από μισό χρόνο. που ζει στο Χονγκ Κονγκ, ανυπομονώ να μοιραστώ περισσότερη γηγενή εμπειρία~).

Δεν υπάρχει πρόβλημα με την αναγνώριση γλώσσας Το Doubao καταλαβαίνει το "Θέλω να φάω ζεστή κατσαρόλα με βάση το χυλό" και παρέχει ακόμη και μια επιλογή αναζήτησης "Πού μπορώ να βρω νόστιμη κατσαρόλα με βάση το χυλό στο Πεκίνο;", αλλά μετά την αποστολή του μηνύματος, μεταπήδησε στη διεπαφή συνομιλίας της αναζήτησης AI και η απάντηση σε εμένα ήταν κείμενο αντί για φωνή.

Επιπλέον, η εισαγωγή διαλέκτου είναι διαθέσιμη μόνο στην αρχική σελίδα και δεν μπορώ να συνεχίσω να εισάγω διάλεκτο στη διεπαφή συνομιλίας. Επομένως, πρέπει να επιστρέφω ξανά και ξανά στην αρχική σελίδα και κάθε φορά που αποστέλλεται ένα μήνυμα, θα ανοίγει ένα νέο παράθυρο σελίδας πλοήγησης. . .

Ωστόσο, η δυνατότητα εισαγωγής διαλέκτων εξακολουθεί να είναι μια μεγάλη ανακάλυψη και η συνολική απόδοση δεν είναι ικανοποιητική. Είναι κατανοητό ότι η εφαρμογή Doubao υποστηρίζει φωνητικές απαντήσεις.

Δοκίμασα να χρησιμοποιήσω την εφαρμογή για κινητάπροφορά διαλέκτουΜπήκε η ίδια πρόταση, τελείωσε ο ΝτουμπάοΦωνή μανταρίνιΜου απάντησε και παρείχε τον επιλεγμένο όρο αναζήτησης "Πού μπορώ να βρω νόστιμο χυλό στο Πεκίνο;"

Με άλλα λόγια, το Doubao υποστηρίζει εισαγωγή διαλέκτου, αλλά δεν υποστηρίζει επί του παρόντος αλληλεπίδραση διαλέκτου.Αυτή η λειτουργία χρησιμοποιείται κυρίως σε ψυχαγωγικές και επαγγελματικές καταστάσεις, όπως η οργάνωση πρακτικών συναντήσεων για συμμετέχοντες σε διαφορετικές γλώσσες.

Συνοπτική συνεδρία

Στη φαντασία μου, υπάρχει μια ηλεκτρονική κούκλα τεχνητής νοημοσύνης στην επιφάνεια εργασίας, η οποία μου προσφέρει συναισθηματική αξία όπως η γάτα μου και με βοηθάει πραγματικά να χειριστώ τα πάντα για εμένα. Είναι τόσο εύκολο να ξυπνάς όσο το Siri, αλλά πιο δυνατό από το Siri.

Η ανάγνωση κειμένου της τεχνητής νοημοσύνης του Doubao μπορεί να χρησιμοποιηθεί σε όλες τις εφαρμογές από την πλευρά του υπολογιστή, παρέχοντας 22 λειτουργίες δομοστοιχείων τις βασικές λειτουργίες που φανταζόμουν, αλλά υπάρχει επίσης πολύς χώρος για εξερεύνηση και ανάπτυξη.

Όσον αφορά την αναγνώριση εικόνων, είναι καλό στην επίλυση προβλημάτων και στην απάντηση ερωτήσεων, κάτι που ισοδυναμεί με τις συμμορίες και τους πιθήκους για την εργασία του υπολογιστή. Ωστόσο, λαμβάνοντας υπόψη τη βάση χρηστών υπολογιστών, η Doubao αναμένεται να καταβάλει εις βάθος προσπάθειες στα προηγμένα μαθηματικά+. Εξάλλου, οι απαντήσεις σε ερωτήσεις και απαντήσεις για κοινές εργασίες για το σπίτι και τα τεστ είναι πιο γρήγορες στα κινητά τηλέφωνα Μόνο με ηλεκτρονικές εκδόσεις ερωτήσεων ή γραπτών θα υπάρχει ζήτηση για υπολογιστές.

Οι λειτουργίες τμηματοποίησης και σύνοψης των βίντεο AI είναι πολύ εντυπωσιακές, ειδικά για τα δημοφιλή επιστημονικά βίντεο. Το θέμα των ανθρωπιστικών και κοινωνικών επιστημών είναι ένα κοινό πρόβλημα για όλα τα μεγάλα μοντέλα.

Στην πραγματικότητα, η διάλεκτος AI είναι το χαρακτηριστικό που περιμένω περισσότερο,Άλλωστε, «η τοπική προφορά παραμένει αμετάβλητη και οι τρίχες στους κροτάφους σβήνουν μερικές φορές η πατρίδα μου είναι μια μακρά λίστα μενού και μερικές φορές είναι η γνωστή «αυτή η γεύση». Αλλά συνολικά, η διαλεκτική διαλεκτική οικολογία του Doubao έχει ακόμα δρόμο να διανύσει.

Ο διαλεκτικός διάλογος προσδιορίζει όχι μόνο τα αισθήματα της πατρίδας των σύγχρονων αστικών κατοίκων. Το πιο σημαντικό, η τεχνολογία διεισδύει στην ψυχρή οθόνη και νοιάζεται για όσους δεν μπορούν να μιλήσουν καθολικά "Κινέζικα", αλλά συχνά ξεχνιούνται από την ιστορία .

Όταν οι διάλεκτοι περνούν από την αναγνώριση στην αλληλεπίδραση, το Doubao μπορεί επίσης να προχωρήσει περισσότερο.