νέα

Αποκαλύπτοντας τα μυστικά του FancyTech: η καινοτομία αλγορίθμου πίσω από την «ισχυρή μείωση» και την «υπερ-σύγκλιση»

2024-08-25

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Στο πρόσφατο κύμα τεχνολογικών αλλαγών, το AIGC (τεχνητή νοημοσύνη που δημιουργείται περιεχόμενο) γίνεται ένα σημαντικό εργαλείο για την αυτοέκφραση και τη δημιουργία των ανθρώπων. Η κινητήρια δύναμη αυτού του κύματος τεχνολογικής καινοτομίας δεν είναι απλώς τεράστια μοντέλα αλγορίθμων, αλλά βαθιά προσαρμοσμένες λύσεις που εστιάζουν στις ανάγκες συγκεκριμένων τομέων. Τα τελευταία δύο χρόνια, η AIGC αναπτύχθηκε ταχύτερα από ό,τι περίμεναν πολλοί και οι εφαρμογές της επεκτάθηκαν από τη δημιουργία κειμένου σε όλο το φάσμα εικόνων και βίντεο.
Πρόσφατα, το «Heart of the Machine» πραγματοποίησε μια αποκλειστική συνέντευξη με μια κινεζική εταιρεία startup που ονομάζεται FancyTech. Η εταιρεία όχι μόνο επέκτεινε γρήγορα την αγορά παρέχοντας τυποποιημένα εμπορικά προϊόντα παραγωγής οπτικού περιεχομένου, αλλά ήταν επίσης η πρώτη που απέδειξε τα πλεονεκτήματα του κάθετου μοντέλου σε πρακτικές εφαρμογές.
Το "Heart of the Machine" παρουσιάζει επίσης λεπτομερώς το πιο πρόσφατο κάθετο μοντέλο βίντεο της FancyTech DeepVideo, το οποίο ανταποκρίνεται με επιτυχία στην πρόκληση του πώς να επαναφέρετε με ακρίβεια και να ενσωματώσετε φυσικά προϊόντα σε βίντεο, διασφαλίζοντας ότι τα προϊόντα παραμένουν αμετάβλητα σε κίνηση.
Το κάθετο μοντέλο της FancyTech βασίζεται στο υποκείμενο πλαίσιο αλγορίθμου ανοιχτού κώδικα, που επικαλύπτεται με τον δικό του σχολιασμό δεδομένων και έχει επανεκπαιδευτεί και απαιτεί μόνο μερικές εκατοντάδες GPU για συνεχείς επαναλήψεις εκπαίδευσης για την επίτευξη καλών αποτελεσμάτων παραγωγής. Αντίθετα, οι δύο παράγοντες «δεδομένα προϊόντος» και «μέθοδοι εκπαίδευσης» είναι πιο κρίσιμοι για το τελικό αποτέλεσμα υλοποίησης.
Με βάση τη συσσώρευση μεγάλου όγκου τρισδιάστατων δεδομένων εκπαίδευσης, η FancyTech εισήγαγε την ιδέα της χωρικής νοημοσύνης για να καθοδηγήσει τη δημιουργία 2D περιεχομένου του μοντέλου. Όσον αφορά τη δημιουργία περιεχομένου εικόνας, η ομάδα πρότεινε μια «συσκευή πολλαπλών λειτουργιών» για τη διασφάλιση της αποκατάστασης των αγαθών και εξασφάλισε τη φυσική ενοποίηση των αγαθών και του φόντου μέσω ειδικής συλλογής δεδομένων. Όσον αφορά τη δημιουργία περιεχομένου βίντεο, η ομάδα δημιούργησε ξανά τους υποκείμενους συνδέσμους της δημιουργίας βίντεο, του πλαισίου σχεδιασμού κατεύθυνσης και της μηχανικής δεδομένων για τη δημιουργία βίντεο με επίκεντρο τα προϊόντα.
Επιπλέον, το "Heart of the Machine" αποκαλύπτει σε βάθος πώς η FancyTech εφαρμόζει τις ερευνητικές ιδέες χωρικής νοημοσύνης σε μοντέλα οπτικής παραγωγής. Σε αντίθεση με τα παραδοσιακά μοντέλα παραγωγής, η χωρική νοημοσύνη αναλύει μεγάλες ποσότητες δεδομένων αισθητήρων και εκτελεί ακριβή βαθμονόμηση, επιτρέποντας στο μοντέλο να αντιληφθεί και να κατανοήσει τον πραγματικό κόσμο.
Το FancyTech χρησιμοποιεί σάρωση lidar αντί της παραδοσιακής λήψης στούντιο και έχει συγκεντρώσει μεγάλη ποσότητα τρισδιάστατων δεδομένων υψηλής ποιότητας.
Για το δύσκολο έργο της διαμόρφωσης εφέ φωτός και σκιάς στη δημιουργία οπτικού περιεχομένου, η FancyTech ανέπτυξε πολλαπλά φώτα με ρυθμιζόμενη φωτεινότητα και θερμοκρασία χρώματος σε κάθε περιβάλλον για τη συλλογή όσο το δυνατόν περισσότερων δεδομένων φυσικού φωτός και σκιάς για τη βελτίωση της χωρικής διαστρωμάτωσης των δημιουργούμενων εικόνων.
Αυτή η συλλογή δεδομένων υψηλής έντασης προσομοιώνει τον φωτισμό πραγματικών σκηνών λήψης, καθιστώντας τον πιο σύμφωνο με τα χαρακτηριστικά των σκηνών ηλεκτρονικού εμπορίου. Συνδυάζοντας υψηλής ποιότητας 3D συσσώρευση δεδομένων, η FancyTech έχει κάνει μια σειρά από καινοτομίες στο πλαίσιο αλγορίθμων, συνδυάζοντας οργανικά χωρικούς αλγόριθμους με αλγόριθμους εικόνας και βίντεο, επιτρέποντας στο μοντέλο να κατανοήσει καλύτερα την αλληλεπίδραση μεταξύ αντικειμένων πυρήνα και περιβάλλοντος.
Η εξερεύνηση της εμπορευματοποίησης δεν σταμάτησε ποτέ στον τομέα της AIGC Αν και υπάρχει συναίνεση, υπάρχουν και διαφορετικές κατευθύνσεις ανάπτυξης. Η «Heart of the Machine» αποκάλυψε στο άρθρο την καινοτομία αλγορίθμου της FancyTech πίσω από την «ισχυρή μείωση» και την «υπερ-σύντηξη».
Η «γεννήτρια πολλαπλών χαρακτηριστικών» της FancyTech εξάγει χαρακτηριστικά προϊόντος σε πολλαπλές διαστάσεις και στη συνέχεια χρησιμοποιεί αυτές τις δυνατότητες για να δημιουργήσει εικόνες που συνδυάζονται με τη σκηνή. Η εξαγωγή χαρακτηριστικών χωρίζεται σε καθολικά χαρακτηριστικά και τοπικά χαρακτηριστικά: τα καθολικά χαρακτηριστικά περιλαμβάνουν βασικά στοιχεία όπως το περίγραμμα και το χρώμα του προϊόντος, τα οποία εξάγονται με χρήση κωδικοποιητών VAE εστιάζονται στις λεπτομέρειες του προϊόντος και εξάγονται μέσω νευρωνικών δικτύων γραφημάτων. Αυτή η μέθοδος μπορεί να αποτυπώσει λεπτομερώς τα εσωτερικά χαρακτηριστικά του προϊόντος Η σχέση μεταξύ των λεπτομερειών και των βασικών pixel, βελτιώνοντας έτσι την ακρίβεια της επαναφοράς των λεπτομερειών του προϊόντος.
Στο δρόμο προς την εμπορευματοποίηση, είτε υιοθετείται ένα γενικό μοντέλο είτε ένα κάθετο μοντέλο, ο απώτερος στόχος είναι η επίτευξη εμπορικής επιτυχίας. Η FancyTech αξιοποίησε τον πλούτο των μοναδικών δεδομένων και την τεχνογνωσία της για να κερδίσει ευρεία αναγνώριση στις εγχώριες και ξένες αγορές και έχει δημιουργήσει σχέσεις συνεργασίας με διεθνείς εταίρους όπως η Samsung, η LG και η πλατφόρμα ηλεκτρονικού εμπορίου Lazada της Νοτιοανατολικής Ασίας Η Kate Somerville και η αγαπημένη από τοπικές μάρκες όπως η Solawave στην Ευρώπη, κέρδισε το Βραβείο Καινοτομίας LVMH και έχει εις βάθος συνεργασία με Ευρωπαίους πελάτες.
Επιπλέον, το FancyTech παρέχει επίσης λειτουργίες αυτόματης δημοσίευσης πλήρους συνδέσμου και ανατροφοδότησης δεδομένων σύντομων βίντεο με τεχνητή νοημοσύνη, οδηγώντας ουσιαστικά στη συνεχή αύξηση των πωλήσεων προϊόντων.
Η επιτυχημένη εφαρμογή του κάθετου μοντέλου όχι μόνο προωθεί την ανάπτυξη της εμπορικής αγοράς, αλλά διευκολύνει το ευρύ κοινό να χρησιμοποιήσει την τεχνολογία AIGC για τη βελτίωση της παραγωγικότητας.
Με την εξάπλωση της τεχνολογίας, σχεδόν όλοι μπορούν πλέον να τραβούν βίντεο, να ηχογραφούν μουσική και να μοιράζονται τις δημιουργίες τους με τον κόσμο μέσω των κινητών τους τηλεφώνων. Προσβλέπουμε σε ένα μέλλον στο οποίο η τεχνολογία AIGC θα απελευθερώσει ξανά την προσωπική δημιουργικότητα - επιτρέποντας στους απλούς ανθρώπους να περάσουν εύκολα τα επαγγελματικά κατώφλια και να μετατρέψουν τις ιδέες σε πραγματικότητα, προωθώντας έτσι άλματα παραγωγικότητας σε όλους τους τομείς της ζωής και γεννώντας περισσότερες αναδυόμενες βιομηχανίες.
Text/Lin Ke που εστιάζει στην AI
Αναφορά/Σχόλια