νέα

η minimax πραγματοποίησε το πρώτο της συνέδριο partner day και κυκλοφόρησε μοντέλα παραγωγής βίντεο και μουσικής

2024-09-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

01:55
σε μια ζωντανή εκπομπή που συνδυάζει τεχνολογία και μουσική, στις 31 αυγούστου, ξεκίνησε το πρώτο συνέδριο προγραμματιστών της εταιρείας ai unicorn minimax shanghai xiyu technology co., ltd. (εφεξής minimax) - "minimaxlink partner day". την ίδια μέρα, η minimax κυκλοφόρησε επίσημα το video model-video-01 και το music model music-01.
τα πολυτροπικά μοντέλα έχουν γίνει μια ερώτηση που πρέπει να απαντηθεί για τις μεγάλες εταιρείες μοντέλων, μεταξύ των οποίων η ενσωμάτωση μοντέλων βίντεο είναι η πιο προφανής. από τη shi technology, τη vidu από την shengshu technology, το "keling ai" από την kuaishou, κ.λπ.
01:55
η τοποθέτηση πολυτροπικών μοντέλων είναι μόνο η αρχή
είναι κατανοητό ότι το βίντεο-01 που κυκλοφόρησε αυτή τη φορά εστιάζει στη δημιουργία εγγενών βίντεο υψηλής ανάλυσης και υψηλής ταχύτητας καρέ εμπειρία του προϊόντος.
το minimax κυκλοφορεί επίσημα το μοντέλο βίντεο—video-01
αφού αξιολόγησε το μοντέλο βίντεο video-01, ένας σχεδιαστής προϊόντων είπε: "το συνολικό αποτέλεσμα είναι πολύ καλό, με σωστή φυσική, καλό δυναμικό εύρος και σταθερότητα, και η απόκριση σε έννοιες επιστημονικής φαντασίας και φαντασίας είναι σχετικά ακριβής, αλλά η πλαστική αίσθηση είναι βαριά η αισθητική απόδοση είναι σχετικά κακή, η ποιότητα της εικόνας και οι λεπτομέρειες της εικόνας είναι κακές.
από την άποψη αυτή, ο ιδρυτής και διευθύνων σύμβουλος της minimax, yan junjie, δήλωσε ότι αυτό που εκτίθεται επί του παρόντος είναι μόνο η πρώτη έκδοση του προϊόντος και οι ενημερωμένες εκδόσεις θα κυκλοφορήσουν σταδιακά στο μέλλον.
για το λόγο αυτό, το μοντέλο βίντεο θα παρέχεται στους χρήστες δωρεάν για ένα χρονικό διάστημα η εμπορευματοποίηση δεν θα ληφθεί υπόψη μέχρι να ενημερωθεί το προϊόν σε ικανοποιητική κατάσταση. «η μελλοντική εμπορευματοποίηση χωρίζεται κυρίως σε δύο μορφές η μία βασίζεται στην ανοιχτή πλατφόρμα της εταιρείας και οι περισσότεροι από 2.000 συνεργάτες της εταιρείας είναι πρόθυμοι να χρησιμοποιήσουν τις δυνατότητες αναγνώρισης φωνής οι δυνατότητες αναγνώρισης από μόνες τους έχουν εισαχθεί μηχανισμοί διαφήμισης στα προϊόντα.
σύμφωνα με αναφορές, τα τρέχοντα προϊόντα μήτρας πολυτροπικών μοντέλων της minimax περιλαμβάνουν επίσης το music-01, ένα πολυλειτουργικό μοντέλο παραγωγής μουσικής από άκρο σε άκρο, ομιλία-01, μια νέα γενιά παραγωγικού μοντέλου σύνθεσης ομιλίας κ.λπ. "αυτή είναι μόνο η αρχή. θα συνεχίσουμε να βελτιώνουμε την ταχύτητα και το αποτέλεσμα του μοντέλου και να κυκλοφορήσουμε περαιτέρω αντίστοιχα προϊόντα."
το κλειδί για τη βελτίωση της απόδοσης του μοντέλου
«ως εταιρεία τεχνολογίας, η τεχνολογία είναι πάντα το βασικό στοιχείο, ο yan junjie είπε ότι σε αυτό το στάδιο, η εστίαση της minimax δεν είναι στην εμπορευματοποίηση».
ο yan junjie είπε ότι το μοντέλο του minimax χειρίζεται επί του παρόντος περισσότερες από 3 δισεκατομμύρια αλληλεπιδράσεις πελατών. πριν από ένα χρόνο, ο χρόνος αλληλεπίδρασης του minimax ήταν μόνο 3% του chatgpt, τώρα αυτό το ποσοστό έχει αυξηθεί στο 53%, αλλά ακόμα κι έτσι, οι συνδεδεμένοι χρήστες δεν έχουν φτάσει στο 1% του παγκόσμιου πληθυσμού. για να αυξηθεί από 1% σε 100%, το πιο σημαντικό πράγμα είναι να αυξηθεί το ποσοστό διείσδυσης και το βάθος χρήσης των προϊόντων τεχνητής νοημοσύνης μεταξύ των χρηστών.
δεδομένα αλληλεπίδρασης χρήστη minimax
υπάρχουν πολλές τεχνικές δυσκολίες που πρέπει να ξεπεραστούν. "δεν είναι δύσκολο να βρει κανείς από τη ζωή ότι η αλληλεπίδραση κειμένου είναι μόνο ένα μικρό μέρος, και περισσότερο είναι η αλληλεπίδραση φωνής και βίντεο. το πολυτροπικό περιεχόμενο, όπως ο ήχος, τα γραφικά, το κείμενο και το βίντεο, έχει γίνει η κύρια ροή της μετάδοσης πληροφοριών. για να βελτιωθεί η ταχύτητα διείσδυσης, η πολυτροπικότητα είναι ο μόνος τρόπος.» ο yan junjie είπε ότι για να ξεπεραστούν αυτές οι δυσκολίες, η «ταχύτητα» είναι ο βασικός στόχος τεχνολογικής έρευνας και ανάπτυξης του υποκείμενου μεγάλου μοντέλου του minimax. «μεταξύ δύο μοντέλων με παρόμοια απόδοση, αυτό με ταχύτερη εκπαίδευση και εξαγωγή συμπερασμάτων μπορεί να χρησιμοποιήσει πιο αποτελεσματικά υπολογιστικούς πόρους για να επαναλάβει περισσότερα δεδομένα, έχοντας έτσι καλύτερη ικανότητα μοντέλου».
σύμφωνα με αναφορές, το minimax έχει βιώσει δύο βασικές υποκείμενες αλλαγές τεχνολογίας στο παρελθόν, συμπεριλαμβανομένων των moe (mixed expert architecture) και linear attention (γραμμική προσοχή). τον απρίλιο του τρέχοντος έτους, η εταιρεία ανέπτυξε ένα μοντέλο νέας γενιάς βασισμένο στο moe+ linear attention, το οποίο θεωρείται συγκρίσιμο με το επίπεδο του gpt-4o. όταν επεξεργάζεστε 100.000 μάρκες, η αποτελεσματικότητα επεξεργασίας του νέου μοντέλου μπορεί να βελτιωθεί έως και 2-3 φορές και όσο αυξάνεται το μήκος, η απόδοση του μοντέλου αυξάνεται πιο εμφανώς.
εννοείται ότι τα μοντέλα κειμένου της σειράς abab7 που χρησιμοποιούν τεχνολογία νέας γενιάς θα κυκλοφορήσουν επίσημα τις επόμενες εβδομάδες.
οι δημόσιες εκθέσεις δείχνουν ότι η minimax, που ιδρύθηκε τον δεκέμβριο του 2021, έχει ολοκληρώσει προηγουμένως τρεις γύρους χρηματοδότησης, όπως η tencent, η mihoyo κ.λπ., και η τρέχουσα αποτίμησή της έχει ξεπεράσει τα 2,5 δισεκατομμύρια δολάρια.
ο ρεπόρτερ της εφημερίδας yu yan και ο ασκούμενος wang chun
(αυτό το άρθρο είναι από το the paper. για περισσότερες πρωτότυπες πληροφορίες, κάντε λήψη της εφαρμογής "the paper")
αναφορά/σχόλια