νέα

το πρώτο εγχώριο μοντέλο μεγάλης κλίμακας με «μάτια» αποκαλύφθηκε στην εμπορική έκθεση service

2024-09-13

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

το εγχώριο μεγάλο μοντέλο ξεκλείδωσε με επιτυχία τα «μάτια» και η zhipu ai (beijing zhipu huazhang technology co., ltd.) παρουσίασε την πιο πρόσφατη σαφή έκδοση στη διεθνή έκθεση της κίνας για το εμπόριο υπηρεσιών του 2024 (αναφέρεται ως έκθεση για το εμπόριο υπηρεσιών ), που άνοιξε στις 12 σεπτεμβρίου. λειτουργία "βιντεοκλήση" της εφαρμογής yan. αναφέρεται ότι αυτή είναι η πρώτη λειτουργία βιντεοκλήσεων μεγάλης κλίμακας στον κόσμο που είναι ανοιχτή σε δημόσιους χρήστες.
σύμφωνα με αναφορές, η λειτουργία βιντεοκλήσεων του qingyan εκτείνεται σε τρεις κύριες λειτουργίες: κείμενο, ήχο και βίντεο και έχει δυνατότητες συλλογιστικής σε πραγματικό χρόνο. οι χρήστες μπορούν να ενεργοποιήσουν την κάμερα και να επικοινωνήσουν με τον qingyan μέσω του παραθύρου της βιντεοκλήσης, όχι μόνο μπορούν να «βλέπουν» την οθόνη του χρήστη, αλλά και να κατανοούν τις οδηγίες και να τις εκτελούν με ακρίβεια και μπορούν να ανταποκρίνονται γρήγορα ακόμη και αν διακόπτονται συχνά. επισημαίνοντας τα βασικά σημεία στην οθόνη, το qingyan μπορεί επίσης να καταλάβει σε τι θέλει ο χρήστης να εστιάσει.
παρέχετε βοήθεια για την εργασία.
το zhipu ai δήλωσε ότι το gpt-4o κυκλοφόρησε στο παρελθόν τη φωνή, αλλά δεν άνοιξε τη λειτουργία βίντεο στο κοινό χρησιμοποιώντας το qingyan, μπορείτε να δοκιμάσετε την πιο προηγμένη τεχνολογία ai/μεγάλου μοντέλου. στο παρελθόν, η αλληλεπίδραση με την τεχνητή νοημοσύνη ήταν κυρίως με τη μορφή κειμένου με τη λειτουργία βίντεο, οι χρήστες μπορούν να αποχαιρετήσουν τις προτροπές μεγάλου κειμένου και να επικοινωνούν ομαλά με την τεχνητή νοημοσύνη. το qingyan είναι σαν ένας ανθρώπινος βοηθός με όραμα και κατανόηση γύρω από τον χρήστη, όσο η κάμερα τραβάει μια φωτογραφία, το ai θα γνωρίζει το περιβάλλον του χρήστη και τι θέλει να κάνει ο χρήστης οδηγίες.
εγχώριο μεγάλο μοντέλο ξεκλειδώνει με επιτυχία τα «μάτια».
η λειτουργία κλήσης βίντεο qingyan μπορεί επίσης να μετατραπεί σε φορητό μεταφραστή αγγλικών, ο οποίος μπορεί να πραγματοποιήσει άμεση μετάφραση μεταξύ κινεζικών και αγγλικών, να διεξάγει αγγλικές συνομιλίες με βάση τις περιβαλλοντικές πληροφορίες του χρήστη και να βοηθήσει στη διόρθωση της προφοράς και των γραμματικών σφαλμάτων του χρήστη. τα σενάρια χρήσης αυτής της λειτουργίας περιλαμβάνουν αφήγηση ιστοριών γραφικών σημείων ανά πάσα στιγμή όταν ταξιδεύετε, προσδιορίζοντας το περιβάλλον για άτομα με προβλήματα όρασης κ.λπ. μπορεί επίσης να παρέχει μαθήματα διδασκαλίας και καθοδήγησης συνεντεύξεων, πλήρη πρακτικά και περιλήψεις σε συναντήσεις, ανάλυση σύνθετων δεδομένων γραφήματα και ερμηνεύουν τον κώδικα οθόνης σε πραγματικό χρόνο.
σε αυτήν την εμπορική έκθεση υπηρεσιών, η zhipu ai θα παρουσιάσει μια ποικιλία από πιο πρόσφατα προϊόντα. εκτός από τη λειτουργία βιντεοκλήσεων της εφαρμογής qingyan, περιλαμβάνει επίσης μια λειτουργία βίντεο που δημιουργείται από ai. η zhipu κυκλοφόρησε το μοντέλο παραγωγής βίντεο cogvideox νωρίτερα φέτος και κυκλοφόρησε τη λειτουργία "qingying" της δημιουργίας βίντεο στην εφαρμογή zhipu qingyan. το qingying είναι ανοιχτό σε όλους τους χρήστες απλώς πληκτρολογήστε κείμενο ή μεταφορτώστε μια εικόνα και ένα βίντεο 6 δευτερολέπτων μπορεί να δημιουργηθεί μέσα σε 30 δευτερόλεπτα. τον ιούλιο του τρέχοντος έτους, η qingying κυκλοφόρησε την εφαρμογή qingyan και οι χρήστες δημιούργησαν περισσότερα από 1 εκατομμύριο βίντεο σε έξι ημέρες.
ο δημοσιογράφος της εφημερίδας ζανγκ τζινγκ
(αυτό το άρθρο είναι από το the paper. για περισσότερες πρωτότυπες πληροφορίες, κάντε λήψη της εφαρμογής "the paper")
αναφορά/σχόλια