νέα

Η Huawei Hubble επένδυσε αθόρυβα σε δύο ομάδες ανθρώπων από το Πανεπιστήμιο Tsinghua

2024-08-20

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Κείμενο/Wang Shuoguo Editor/Yan Ziwei

Δύο μεγάλες εταιρείες μοντέλων στις οποίες η Huawei Hubble έχει επενδύσει αθόρυβα, κυκλοφόρησαν νέες εξελίξεις η μία μετά την άλλη.

Στα μέσα Αυγούστου, η Facewall Intelligence ανακοίνωσε ότι η σειρά MiniCPM του μοντέλου της μεγάλης γλώσσας έχει λάβει πάνω από ένα εκατομμύριο λήψεις από την κυκλοφορία της τον Φεβρουάριο.

Στα τέλη Ιουλίου, η Shenshu Technology έγινε παγκόσμια και κυκλοφόρησε το Vidu, ένα μεγάλο μοντέλο Wensheng Video, με συγκριτικές επιδόσεις έναντι του Sora.

Το Wall-facing Intelligence και το Shengshu Technology ιδρύθηκαν το 2022 και το 2023 αντίστοιχα, και οι βασικές τους ομάδες είναι όλες από το Πανεπιστήμιο Tsinghua. Ο Διευθύνων Σύμβουλος της Wall-Facing Intelligence είναι ο Li Dahai, ο πρώην CTO της Zhihu ο Διευθύνων Σύμβουλος της Shengshu Technology είναι ο Tang Jiayu, ο οποίος σπούδασε στο Τμήμα Επιστήμης Υπολογιστών στο Πανεπιστήμιο Tsinghua με πτυχίο και μεταπτυχιακό.

Το κομμάτι AI είναι καυτό και το Huawei Hubble είναι αισιόδοξο για τις δυνατότητες αυτών των δύο νέων ταλέντων.

Νέα ομάδα

Η Hubble Investment είναι ένας επενδυτικός οργανισμός που ανήκει εξ ολοκλήρου στην Huawei.

Σύμφωνα με την Qichacha, έχει δύο οντότητες, συγκεκριμένα τη Hubble Technology Investment Co., Ltd. και τη Shenzhen Hubble Technology Investment Partnership.

Προηγουμένως, η επένδυση της Huawei Hubble επικεντρώθηκε στη σκληρή τεχνολογία, επενδύοντας σε μια σειρά από εταιρείες τσιπ ημιαγωγών Φέτος, υποστήριξε διαδοχικά δύο εταιρείες αιχμής Tsinghua, δείχνοντας την έμφαση στην πίστα AI.

Σύμφωνα με τα στοιχεία της IT Orange, το Hubble έχει κάνει διαδοχικά στοιχήματα στον τομέα της τεχνητής νοημοσύνης φέτος, με σωρευτικό ποσό επένδυσης 132 εκατομμυρίων γιουάν.

Στην κατεύθυνση των μεγάλων μοντέλων, προτιμά τις ελίτ από σχολές κύρους.

Οι δύο εταιρείες που επένδυσαν στην εταιρεία έχουν παρόμοιες δομές ιδρυτικής ομάδας και υποστηρίζονται και οι δύο από το Πανεπιστήμιο Tsinghua.

Τα βασικά μέλη της Τεχνολογίας Shengshu προέρχονται από το Ερευνητικό Ινστιτούτο Τεχνητής Νοημοσύνης του Πανεπιστημίου Tsinghua και η ιδρυτική ομάδα του Wall-Facing Intelligence γεννήθηκε από το Εργαστήριο Επεξεργασίας Φυσικής Γλώσσας του σχολείου (THUNLP).

Μια ομάδα προσώπων Tsinghua αποτελούν τα ανώτερα στελέχη της βιοτεχνολογίας. Εκτός από τον Διευθύνοντα Σύμβουλο, επικεφαλής επιστήμονας είναι ο Zhu Jun, αναπληρωτής διευθυντής του Ινστιτούτου Τεχνητής Νοημοσύνης Tsinghua, και ο CTO Bao Fan είναι ο συμφοιτητής του Tang Jiayu και μέλος της ερευνητικής ομάδας του Zhu Jun.

Από τον Ιούνιο έως τον Αύγουστο του περασμένου έτους, η Shengshu Technology ολοκλήρωσε δύο κύκλους χρηματοδότησης στη σειρά και έλαβε εκατοντάδες εκατομμύρια γιουάν συνολικά. Τον Ιούνιο του τρέχοντος έτους, το Hubble επένδυσε σε μετοχές και συμμετείχε στον κύκλο χρηματοδότησής του Α+.

Η πορεία ανάπτυξης της νοημοσύνης που βλέπει στον τοίχο είναι παρόμοια.

Ο συνιδρυτής της Liu Zhiyuan είναι διδακτορικός επόπτης στο Τμήμα Επιστήμης Υπολογιστών στο Πανεπιστήμιο Tsinghua και η ερευνητική του κατεύθυνση είναι η επεξεργασία φυσικής γλώσσας στον υπολογιστή της εταιρείας, Zeng Guoyang, 26 ετών, προτείνεται φοιτητής στο διαγωνισμό και συμμετείχε στο Εργαστήριο Επεξεργασίας Φυσικής Γλώσσας Tsinghua στο δεύτερο έτος.

Σύμφωνα με τον Li Dahai, η έξυπνη επιστημονική ερευνητική ομάδα που βλέπει στον τοίχο έχει περισσότερα από 100 άτομα, το 80% των οποίων αποφοίτησε από το Qingbei, με μέσο όρο ηλικίας μόλις 28 ετών. Έχουν δημοσιεύσει περισσότερες από 100 εργασίες σε έγκυρα περιοδικά και συνέδρια.

Πριν ιδρύσει το Wall-face Intelligence, ο Li ήταν ο CTO του Zhihu, δημιουργώντας μια επιχείρηση αναζήτησης και συστάσεων για την πλατφόρμα από την αρχή, λανσάροντας μια «έξυπνη κοινότητα» AI και αυξάνοντας τον αριθμό των μηνιαίων ενεργών χρηστών.

Πέρυσι, το ChatGPT ήταν πολύ δημοφιλές και όλοι μιλούσαν για AGI (τεχνητή γενική νοημοσύνη). Αφού επιβεβαιώσετε ότι το AGI είναι πεποίθηση όλων, εγγραφείτε αποφασιστικά.

Ο παλιός εργοδότης του υποστήριξε την επιχειρηματικότητά του και τον Απρίλιο του ίδιου έτους, η Face Wall Intelligence έλαβε μια επένδυση δεκάδων εκατομμυρίων γιουάν από τον Zhihu. Ένα χρόνο αργότερα, το Hubble πήρε ένα μερίδιο.

Συνεχώς λανσάρετε νέα προϊόντα

Και οι δύο startup κυκλοφόρησαν νέα προϊόντα σε σχετικά σύντομο χρονικό διάστημα. Αυτός είναι ένας σημαντικός λόγος για την προσέλκυση επενδύσεων από ιδρύματα όπως η Huawei και το Hubble.

Στα τέλη Απριλίου, η Shengshu Technology συνεργάστηκε με το Πανεπιστήμιο Tsinghua για να κυκλοφορήσει ένα μεγάλο μοντέλο βίντεο - το Vidu. Στα τέλη Ιουλίου, το Vidu κυκλοφόρησε παγκοσμίως, ανοίγοντας τις δύο βασικές λειτουργίες του Wensheng Video και του Tusheng Video, παρέχοντας δύο επιλογές διάρκειας 4 δευτερολέπτων και 8 δευτερολέπτων, με ανάλυση έως 1080P.

Το Vidu δημιουργεί ένα κλιπ 4 δευτερολέπτων σε μόλις 30 δευτερόλεπτα. Επί του παρόντος, οι χρήστες μπορούν να εγγραφούν απευθείας με τη διεύθυνση email τους για να βιώσουν το Vidu.

Σύμφωνα με αναφορές, το βίντεο που δημιουργείται από το Vidu είναι ομαλό και συνεκτικό, χωρίς εμφανές φαινόμενο εισαγωγής καρέ, και η γλώσσα του φακού είναι πλούσια και μπορούν να αλλάξουν διαφορετικοί φακοί, όπως μακρινές λήψεις, κοντινές λήψεις και κοντινά πλάνα.

«Η απόδοση του Vidu είναι πολύ εξαιρετική όσον αφορά τη μακροπρόθεσμη διατήρηση 16 δευτερολέπτων και τη σημασιολογική κατανόηση, σχολίασε ο Zhu Jun, επικεφαλής επιστήμονας της Shengshu».

Η ευφυΐα που βλέπει στον τοίχο προωθεί επίσης συνεχώς νέες κινήσεις.

Τον Μάιο κυκλοφόρησε το μεγάλο μοντέλο Luca. Ο Li Dahai είπε ότι οι δυνατότητες πολλαπλών γλωσσικών μοντέλων του Luca είναι ισοδύναμες με το ChatGPT.

Τον ίδιο μήνα, κυκλοφόρησε το MiniCPM-V2.0 που βλέπει στον τοίχο, το οποίο μπορεί να αναγνωρίσει με ακρίβεια σκηνές δρόμου με περίπλοκες λεπτομέρειες και να διαβάσει αρχαία γραφή σε δελτία Tsinghua που χρονολογούνται περισσότερα από 2.300 χρόνια.

Ήδη από πέρυσι, η Face Wall Intelligence παρουσίασε την έξυπνη πλατφόρμα ανάπτυξης λογισμικού ChatDev. Οι χρήστες που έχουν ανάγκες για δημιουργία μικρών παιχνιδιών, ανάπτυξη ιστοσελίδων, δημιουργικό σχεδιασμό κ.λπ. μπορούν να το εφαρμόσουν γρήγορα περιγράφοντας απλώς το όνομα του έργου και τις σχετικές ιδέες μέσω του ChatDev.

Σύμφωνα με τα λόγια του Li Dahai, ένας απλός χρήστης μπορεί να δημιουργήσει ένα μικρό λογισμικό «σε ένα μόνο φλιτζάνι κόκα κόλα και με κόστος λιγότερο από ένα δολάριο».

Η εμπορευματοποίηση έχει αρχικά εφαρμοστεί. Η Face Wall Intelligence ένωσε τα χέρια με την China Merchants Bank, το Digital Network, το Zhihu κ.λπ. για να εφαρμόσουν την τεχνολογία σε σενάρια όπως τα οικονομικά, η εκπαίδευση και τα έξυπνα τερματικά.

Για παράδειγμα, στα τέλη Ιουνίου, το σύστημα δοκιμών με τη βοήθεια τεχνητής νοημοσύνης που αναπτύχθηκε από την εταιρεία τέθηκε σε λειτουργία στο Ενδιάμεσο Λαϊκό Δικαστήριο του Shenzhen, καλύπτοντας διαδικασίες όπως η κατάθεση υπόθεσης, η εξέταση φακέλου, η ακρόαση στο δικαστήριο και η παραγωγή εγγράφων.

Από τη δοκιμαστική λειτουργία του, τον Ιανουάριο του τρέχοντος έτους, το σύστημα έχει βοηθήσει στην κατάθεση 291.000 υποθέσεων και βοήθησε στη δημιουργία 11.600 πρώτων σχεδίων εγγράφων.

Βρείτε έναν νέο τρόπο

Ο Li Dahai και ο Tang Jiayu έχουν τα ίδια χαρακτηριστικά, δεν είναι δεισιδαίμονες για το μονοπάτι που ακολούθησαν οι προκάτοχοί τους.

Για παράδειγμα, η GPT τονίζει ότι "οι μεγάλες προσπάθειες μπορούν να κάνουν θαύματα", ενώ η προσέγγιση της ομάδας που βλέπει στον τοίχο είναι να προβλέψει την απόδοση μεγάλων μοντέλων μέσω μικρών μοντέλων: πρώτα εκπαιδεύστε σε ένα μοντέλο με παραμέτρους που κυμαίνονται από 0,009B έως 0,03B και στη συνέχεια προέκταση σε ένα μοντέλο 2.4B Προγνωστική απόδοση, τέλος, τρένο μοντέλο 2.4B.

Αυτή η μέθοδος έχει το διπλάσιο αποτέλεσμα με τη μισή προσπάθεια.

Πριν την ίδρυση της εταιρείας, ως μέλος του έργου «Διαφωτισμός» του Ινστιτούτου Τεχνητής Νοημοσύνης του Beijing Zhiyuan, η ομάδα Wall-Facing άρχισε να εκπαιδεύει μεγάλα γλωσσικά μοντέλα το 2020.

Η εμπειρία του παρελθόντος τους επιτρέπει να γνωρίζουν τι είδους δεδομένα χρειάζονται για μεγάλα μοντέλα.

"Είναι εύκολο για όλους να πέσουν σε παρεξήγηση και να εστιάσουν υπερβολικά στον απόλυτο όγκο δεδομένων. Στην πραγματικότητα, η ποιότητα των δεδομένων, ο τρόπος χρήσης των δεδομένων και η κατανόηση των δεδομένων είναι πιο σημαντικά." είπε.

Λόγω των περιορισμών πόρων, η ομάδα έχει χρησιμοποιήσει εδώ και καιρό μεθόδους όπως η κατανεμημένη επιτάχυνση και η προσαρμογή των παραμέτρων για τη μείωση του κόστους. Το 2022, η εργασία βελτίωσης παραμέτρων της ομάδας που βλέπει στον τοίχο δημοσιεύτηκε επίσης στο υποπεριοδικό Nature.

Το στυλ παιχνιδιού της τεχνολογίας Shengshu είναι παρόμοιο.

Στον τεχνικό οδικό χάρτη, το Shengshu χρησιμοποιεί την ίδια συγκλίνουσα αρχιτεκτονική με το Sora, αλλά στη διαδρομή προϊόντων, τα δύο είναι διαφορετικά.

Η ομάδα Sora τα επέλεξε όλα σε μεγάλα βίντεο, τα οποία υποστηρίζονται από την τεχνική δύναμη του Open AI και την υπολογιστική ισχύ της Microsoft. Οι συνθήκες για τις νεοφυείς επιχειρήσεις να αναπτύξουν ψηφιακές τεχνολογίες είναι ασύγκριτες.

Η ομάδα του Tang Jiayu επέλεξε να ξεκινήσει με εικόνες 2D και στη συνέχεια να επεκταθεί σε πεδία 3D και βίντεο.

Το βίντεο είναι ουσιαστικά μια ενίσχυση εικόνων σε χρονικές σειρές, οι οποίες μπορούν να προβληθούν ως διαδοχικές εικόνες πολλαπλών καρέ, όπως η συλλογή δεδομένων, ο καθαρισμός, ο σχολιασμός και η αποτελεσματική εκπαίδευση μοντέλων.

Καθ' όλη τη διάρκεια του 2023, οι κύριοι πόροι του Shengshu θα τοποθετούνται σε εικόνες και 3D. Μόνο τον Ιανουάριο του τρέχοντος έτους κυκλοφόρησε η δημιουργία βίντεο μικρού μήκους 4 δευτερολέπτων. Μετά την κυκλοφορία του Sora τον Φεβρουάριο, η πρόοδος της εταιρείας επιταχύνθηκε και τον Απρίλιο θα μπορούσε να δημιουργήσει σύντομα βίντεο 16 δευτερολέπτων.

Στη μεγάλη πίστα του μοντέλου, εγχώριες και ξένες ομάδες ανταγωνίζονται για να «λύσουν τους μυς τους». Αυτές οι δύο ομάδες της Tsinghua μόλις άρχισαν να κάνουν ζέσταμα και ανυπομονούν να πετύχουν καλά αποτελέσματα.

Μέχρι τότε, η Huawei Hubble, η οποία επένδυσε νωρίς, αναμένεται να έχει υπερβολικές αποδόσεις.