Νέα

Το Figure AI δημιούργησε τον "Terminator"

2024-08-07

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Αναφορά Machine Heart

Τμήμα Σύνταξης Machine Heart

Δυνατότητα φωνητικών συνομιλιών, όρασης VLM και εργασίας 20 ώρες την ημέρα.

Πάντα θα υπάρχει αυτή η μέρα, αλλά δεν περιμέναμε να έρθει τόσο σύντομα.

Το βράδυ της 6ης Αυγούστου, ώρα Πεκίνου, η Figure, μια πολύ γνωστή startup ενσωματωμένης νοημοσύνης στη Silicon Valley, κυκλοφόρησε επίσημα τη νέας γενιάς ανθρωποειδές ρομπότ Figure 02.





Εκτός από την εμφάνιση επιστημονικής φαντασίας, αυτό το είδος ρομπότ έχει επίσης αρκετή γενική νοημοσύνη που μπορεί να μιλήσει σε ανθρώπους σε πραγματικό χρόνο και να μάθει αυτόματα πώς να συναρμολογεί εξαρτήματα. Στην πραγματικότητα, το Figure 02 εργάζεται ως ασκούμενος στο εργοστάσιο της BMW στο Spartanburg, και μας φαίνεται σαν να έχουμε μπει στο μέλλον.



Η ομάδα μηχανικής και σχεδιασμού του Figure ολοκλήρωσε έναν πλήρη επανασχεδιασμό του υλικού και του λογισμικού του Figure 02. Σημαντική πρόοδος έχει σημειωθεί σε βασικές τεχνολογίες όπως η τεχνητή νοημοσύνη, η όραση, οι μπαταρίες, οι ηλεκτρονικές συσκευές, οι αισθητήρες και οι ενεργοποιητές.

Η καρδιά της μηχανής

,Μπράβο

539

Συγκεκριμένα, το Σχήμα 02 περιλαμβάνει κυρίως τα ακόλουθα χαρακτηριστικά:

  • Φωνητική συνομιλία σε πραγματικό χρόνο: Εικόνα 02 Δυνατότητα συνομιλίας με άτομα μέσω ενσωματωμένων μικροφώνων και ηχείων που είναι συνδεδεμένα σε ένα προσαρμοσμένο μεγάλο μοντέλο OpenAI.
  • ΦΩΤΟΓΡΑΦΙΚΗ ΜΗΧΑΝΗ: Σύστημα όρασης AI που οδηγείται από 6 κάμερες RGB.
  • Παραποιητής: Ο χειριστής τέταρτης γενιάς με 16 βαθμούς ελευθερίας και την ίδια δύναμη με τους ανθρώπους.
  • Ενσωματωμένο VLM: Υποστήριξη καμερών ρομπότ για γρήγορο οπτικό συλλογισμό κοινής λογικής.
  • Μπαταρία μεγάλης χωρητικότητας: Μια προσαρμοσμένη μπαταρία 2,25 KWh στον κορμό του ρομπότ παρέχει περισσότερο από 50% ισχύ.
  • CPU/GPU: Σε σύγκριση με την προηγούμενη γενιά, οι ενσωματωμένες δυνατότητες υπολογισμού και συλλογιστικής τεχνητής νοημοσύνης έχουν αυξηθεί κατά 3 φορές.

Ολοκληρωμένη βελτίωση: γενική + ανθρωποειδής + πρακτική

Ίσως η μεγαλύτερη αλλαγή σε αυτήν την αναβάθμιση είναι ότι το Σχήμα 02 είναι πραγματικά έτοιμο να ανταποκριθεί σε φωνητικές εντολές.

Στην εκπληκτική επίδειξη τεχνολογίας του περασμένου έτους, ένας άνθρωπος που στεκόταν μπροστά από το Σχήμα 01 ρώτησε το ρομπότ: «Μπορείς να μου δώσεις κάτι να φάω, όχι μόνο αναγνώρισε ότι το αντικείμενο μπροστά του ήταν ένα μήλο, αλλά κατάλαβε και ότι τα μήλα;» μπορεί να φάει κατευθείαν, έτσι έδωσε το μήλο στο άτομο που είχε μπροστά του και είπε: "Φυσικά, πάρ' το και φάε το".

Τον Μάρτιο του τρέχοντος έτους, το OpenAI ανακοίνωσε ότι θα συνεργαστεί με τη Figure για την ανάπτυξη ενσωματωμένης νοημοσύνης, επιτρέποντας στα ανθρωποειδή ρομπότ να έχουν σε πραγματικό χρόνο και αποτελεσματικές δυνατότητες συνομιλίας. Υποστηριζόμενο από το OpenAI, το Figure μπορεί να επαναλάβει γρήγορα τις δυνατότητες φωνής σε ομιλία ρομπότ. Ο Σχήμα ανέφερε ότι λόγω της σημαντικής αύξησης της υπολογιστικής ισχύος στην τελική πλευρά του Σχήματος 02, μπορεί πλέον να εκτελεί διάφορες εργασίες στον πραγματικό κόσμο με πλήρη αυτονομία.

Στο Σχήμα 02, η υλοποίηση της συλλογιστικής ομιλίας ρομπότ επωφελείται κυρίως από το ενσωματωμένο μικρόφωνο και το ηχείο που είναι συνδεδεμένα με το προσαρμοσμένο μοντέλο AI που εκπαιδεύεται σε συνεργασία με το OpenAI.



Το σύστημα πλοήγησης της Εικόνας 02 χρησιμοποιεί ένα VLM (Visual Language Model), το οποίο επιτρέπει στην κάμερα του ρομπότ να εκτελεί σημασιολογική έρευνα και γρήγορο οπτικό συλλογισμό κοινής λογικής. Το VLM είναι μια νέα κατεύθυνση στην έξυπνη οδήγηση που μελετάται επί του παρόντος από πολλές νέες δυνάμεις κατασκευής αυτοκινήτων στον τομέα της ρομποτικής, αυτή η μέθοδος μπορεί προφανώς να επιτύχει καινοτόμα αποτελέσματα σε πολλές εργασίες.



Η διάρκεια ζωής της μπαταρίας μπορεί να ειπωθεί ότι είναι μια από τις μεγαλύτερες προκλήσεις που αντιμετωπίζει η πρακτική χρήση των ανθρωποειδών ρομπότ. Το Σχήμα 02 έχει μια προσαρμοσμένη μπαταρία χωρητικότητας 2,25 KWh στον κορμό του ρομπότ, η οποία μπορεί να παρέχει περισσότερο από 50% περισσότερη ενέργεια από την Εικόνα 01, μεγιστοποιώντας έτσι τον χρόνο λειτουργίας του ρομπότ. Ο Brett Adcock, ιδρυτής και Διευθύνων Σύμβουλος της Figure AI, είπε ότι ελπίζουν ότι το Σχήμα 02 μπορεί να επιτύχει περισσότερες από 20 ώρες αποτελεσματικής εργασίας κάθε μέρα.



Μπορούμε να δούμε ότι η εμφάνιση του Σχήματος 02 έχει γίνει πιο ολοκληρωμένη επειδή υιοθετεί μια νέα δομή εξωσκελετού. Σε σύγκριση με το Σχήμα 01, ο σχεδιασμός της εμφάνισης του ρομπότ έχει αλλάξει περισσότερο. Επιπλέον, υιοθετεί επίσης ενσωματωμένο σχεδιασμό καλωδίωσης. Η ενσωματωμένη καλωδίωση έχει τα ακόλουθα πλεονεκτήματα:

  • υψηλότερη αξιοπιστία
  • Κρυφά καλώδια
  • Πιο σφιχτή συσκευασία



Από το Σχήμα 01 έως το Σχήμα 02, η εμφάνιση έχει αλλάξει πολύ.

Εκτός από την καλύτερη καλωδίωση, το Σχήμα 02 σχεδίασε προσαρμοσμένους ακροδέκτες και υποδοχές καλωδίων για να αυξήσει την αξιοπιστία του ρομπότ.



Προκειμένου να κατανοήσουμε τον κόσμο όπως οι άνθρωποι, το Σχήμα 02 χρησιμοποιεί πολλαπλές κάμερες + οπτικά συστήματα που βασίζονται σε AI για την εκτέλεση αντίληψης και συλλογισμού. Διαθέτει συνολικά 6 ενσωματωμένες κάμερες RGB στο κεφάλι, τον μπροστινό κορμό και τον πίσω κορμό, δίνοντας στο ρομπότ οπτικές δυνατότητες πέρα ​​από αυτές των ανθρώπων.



Τέλος, υπάρχουν ευκίνητα δάχτυλα. Το Σχήμα 02 είναι εξοπλισμένο με έναν χειριστή τέταρτης γενιάς, ο οποίος έχει 16 βαθμούς ελευθερίας και έχει την ίδια δύναμη με τον άνθρωπο. Μπορεί να εκτελέσει διάφορες σύνθετες εργασίες.



Ο Brett Adcock είπε ότι καθώς το ρομπότ συνεχίζει να λειτουργεί, η μηχανή δεδομένων AI θα συλλέγει και θα οργανώνει δεδομένα για μοντέλα εκπαίδευσης για να βελτιώνει συνεχώς την απόδοση.



Βλέποντας μια τόσο υπέροχη εμφάνιση του Figure 02, οι άνθρωποι δεν μπορούν παρά να σκεφτούν το Optimus Prime του Musk Σε σύγκριση με τα δύο, δεν ξέρω ποιος είναι καλύτερος.



Μερικοί χρήστες του Διαδικτύου είπαν, "Το Σχήμα 02 προαναγγέλλει την αρχή μιας νέας εποχής. Αυτό είναι αυτή τη στιγμή το πιο προηγμένο ρομπότ στον κόσμο και το μέλλον είναι εδώ."



Startup εταιρεία Σχήμα: Η μισή Silicon Valley επενδύει

Η Figure, που ιδρύθηκε το 2022 από τον Brett Adcock, είναι μια εταιρεία ρομποτικής με έδρα τις ΗΠΑ που ειδικεύεται στην ανάπτυξη ανθρωποειδών ρομπότ. Στόχος της εταιρείας είναι η ανάπτυξη καθολικών ανθρωποειδών ρομπότ που έχουν θετικό αντίκτυπο στην ανθρωπότητα και δημιουργούν μια καλύτερη ζωή για τις μελλοντικές γενιές.

Μετά την έκρηξη της γενετικής τεχνολογίας AI, έχουν εμφανιστεί πολλές εταιρείες ρομποτικής που στοχεύουν στην ενσωματωμένη νοημοσύνη, και το Figure είναι ιδιαίτερα εντυπωσιακό ανάμεσά τους. Τον Μάρτιο του 2023, η Figure βγήκε από τη λειτουργία stealth και κυκλοφόρησε το πρωτότυπο ρομπότ Figure 01, το οποίο μοιάζει και κινείται σαν άνθρωποι. Αυτό είναι ένα δίποδο ρομπότ σχεδιασμένο για χειρωνακτική εργασία, αρχικά στοχεύοντας στη βιομηχανία logistics και αποθήκευσης.

Τον Μάιο του 2023, η εταιρεία συγκέντρωσε 70 εκατομμύρια δολάρια από επενδυτές με επικεφαλής την Parkway Venture Capital.

Τον Οκτώβριο του ίδιου έτους, ο Figure κυκλοφόρησε ένα βίντεο με το δίποδο ρομπότ Figure 01 να περπατά.



Γρήγορα προς τον Ιανουάριο του τρέχοντος έτους, η Εικόνα 01 έμαθε να φτιάχνει καφέ.



Στις 18 Ιανουαρίου 2024, η Figure ανακοίνωσε μια συνεργασία με τη BMW για την ανάπτυξη ανθρωποειδών ρομπότ σε εργοστάσια κατασκευής αυτοκινήτων. Αυτή τη στιγμή, το Σχήμα 01 λέγεται ότι μπορεί να ολοκληρώσει αυτόνομα εργασίες στον πραγματικό κόσμο.



Εικόνα 01 Εργασία στο εργοστάσιο της BMW.

Τον Μάρτιο του τρέχοντος έτους, η Figure ανακοίνωσε την ολοκλήρωση μιας εκπληκτικής χρηματοδότησης 675 εκατομμυρίων δολαρίων της Σειράς Β, ανεβάζοντας την αποτίμηση της εταιρείας στα 2,6 δισεκατομμύρια δολάρια. Οι επενδυτές περιλαμβάνουν Microsoft, Intel, OpenAI Startup Fund, Amazon Industrial Innovation Fund, Nvidia, Bezos, "Mr. Mu's" Ark Investment, Parkway Venture Capital, Align Ventures κ.λπ.

Ταυτόχρονα, η Figure ανακοίνωσε επίσης μια συνεργασία με το OpenAI, συμπεριλαμβανομένης της OpenAI κατασκευής ενός εξειδικευμένου μοντέλου τεχνητής νοημοσύνης για το ανθρωποειδές ρομπότ της Figure, έτσι ώστε το ρομπότ του να μπορεί να επεξεργάζεται και να συλλογίζεται τη γλώσσα.

Στις 13 Μαρτίου, με τη βοήθεια της τεχνολογίας OpenAI, το Σχήμα 01 μπορεί να πραγματοποιήσει μια περιεκτική συνομιλία με ανθρώπους.

Από το περπάτημα σε όρθια θέση και την ολοκλήρωση πολύπλοκων εργασιών μέχρι τη φυσική αλληλεπίδραση με τους ανθρώπους. Αυτά τα τεχνικά στιγμιότυπα είναι επίσης ένας από τους σημαντικούς λόγους για τους οποίους η Figure κατέληξε σε συμφωνία συνεργασίας με την OpenAI, η οποία πάντα ήθελε να επιστρέψει στον τομέα της ρομποτικής - να συνδυάσει την έρευνα του OpenAI με τη ρομποτική εμπειρία της Figure για την ανάπτυξη μοντέλων AI επόμενης γενιάς για ανθρωποειδή ρομπότ .

Μετά την κυκλοφορία του Σχήματος 02 σήμερα, ο συνδυασμός υψηλά ενσωματωμένου υλικού και τεχνολογιών τεχνητής νοημοσύνης επόμενης γενιάς, όπως το VLM, μας έφερε ένα βήμα πιο κοντά σε ανθρωποειδή ρομπότ με πραγματικά καθολικές δυνατότητες.

Σύντομα, ο φυσικός κόσμος θα εισάγει επίσης αλλαγές που θα επιφέρει η τεχνητή νοημοσύνη;

Περιεχόμενο αναφοράς:

https://x.com/Figure_robot/status/1820791819023909031

https://www.youtube.com/watch?v=0SRVJaOg9Co

https://www.therobotreport.com/figure-02-humanoid-robot-is-ready-to-get-to-work/