Ο νέος πρόλογος του Zhu Jiaming: Η τεχνητή νοημοσύνη και η ανθρώπινη νοημοσύνη αρχίζουν να «μοιράζονται νοημοσύνη» σε οκτώ σημαντικές τάσεις 2024 Shanghai Book Fair
2024-08-19
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
"The Era of Dialogue: The Road to a Strong Country by Forging New Productivity" των Zhu Jiaming, Tao Hu, Shen Yang, κ.λπ., που δημοσιεύτηκε από τον Peking University Press τον Αύγουστο του 2024, με τιμή 78 γιουάν
[Εισαγωγή] Η Έκθεση Βιβλίου της Σαγκάης βρίσκεται σε πλήρη εξέλιξη, με πλήθη κόσμου εντός και εκτός του εκθεσιακού χώρου, και πληροφορίες και πνεύματα σε όλα τα επίπεδα ρέουν και μολύνουν.
Το νέο βιβλίο «The Era of Dialogue: The Road to a Strong Country by Forging New Productivity», που εκδόθηκε από τις εκδόσεις Peking University Press και συγκεντρώθηκε από ομιλητές από το Wenhui Lecture Hall, παρουσιάστηκε στην έκθεση βιβλίου και πραγματοποιήθηκε στην οδό Chang'an Λέσχη ανάγνωσης στις 14 Αυγούστου Μάθετε νέα βιβλία. Το βιβλίο χωρίζεται σε τρία μεγάλα κεφάλαια: την «ανάδυση» της τεχνητής νοημοσύνης, την ολοκληρωμένη ανάπτυξη εικονικών και πραγματικών κόσμων και την υποδομή της τεχνολογίας ψηφιακής νοημοσύνης , Web3, δορυφορικό Διαδίκτυο, ψηφιακή οικολογία και μετα-Το σύμπαν, ηθική της τεχνητής νοημοσύνης και άλλα θέματα.
Δεκατέσσερις διαλέξεις, 41 ειδικοί, μελετητές και ελίτ της βιομηχανίας, συμπεριλαμβανομένων των Zhu Jiaming, Lin Baojun, Wang Jianyu, Shen Yang, Li Miao, Cai Hengjin, Lu Yong, Lin Longnian, Lin Yonghua, Tao Hu, Yang Guang, Wei Hui και Οι προσκεκλημένοι του He Liang Lecture, συμπεριλαμβανομένων των Ji Weidong, Feng Xiang, Jiang Xiaoyuan, Yu Hai, He Jing, Fu Changzhen, Li Quanmin, κ.λπ., έδωσαν μια εις βάθος ανάλυση της τεχνολογικής καινοτομίας και της τεχνολογικής καινοτομίας στους τομείς της τεχνολογίας πληροφοριών νέας γενιάς, της τεχνητής νοημοσύνη, αεροδιαστημική, βιοϊατρική, κβαντική τεχνολογία κ.λπ. Η βιομηχανική ανάπτυξη, η εξερεύνηση των συνόρων, των τάσεων και των προκλήσεων της παγκόσμιας ανάπτυξης τεχνητής νοημοσύνης, καθώς και ζητήματα όπως η ηθική διακυβέρνηση της τεχνητής νοημοσύνης, θα βοηθήσουν τους αναγνώστες να κατανοήσουν την έννοια και τη σημασία των νέων παραγωγικών δυνάμεων και τον σημαντικό ρόλο τους στην προώθηση της ανάπτυξης του κινεζικού εκσυγχρονισμού. Αυτό το βιβλίο ενσωματώνει τον διάλογο μεταξύ της επιστήμης και της τεχνολογίας και των ανθρωπιστικών επιστημών, καθώς και τη σύνδεση μεταξύ της τεχνολογικής ανάπτυξης και της κοινωνικής αλλαγής. Είναι τόσο αιχμής όσο και μπορεί να αποκτήσει νέα γνώση στην προώθηση της ανάπτυξης του κινεζικού εκσυγχρονισμού.
Αξίζει ιδιαίτερα να αναφέρουμε ότι ο πρόλογος αυτού του βιβλίου είναι 17.000 λέξεων και γράφτηκε προσωπικά από έναν από τους συγγραφείς, τον οικονομολόγο Zhu Jiaming. Επικεντρώνεται στα σύνορα, τις τάσεις και τις προκλήσεις της ανάπτυξης της τεχνητής νοημοσύνης από το 2022 έως το 2024, και επίσης επεξεργάζεται. σχετικά Οι τελευταίες πληροφορίες που περιέχονται σε αυτόν τον πρόλογο σχετικά με τον αντίκτυπο της τεχνητής νοημοσύνης στη μακροοικονομία είναι στις αρχές Ιουλίου 2024. Αυτή η ενότητα αποσπά τα σύνορα, τις τάσεις και τις προκλήσεις της ανάπτυξης της τεχνητής νοημοσύνης από αυτόν τον πρόλογο.
Κατά τη διάρκεια της έκθεσης βιβλίου, οι αναγνώστες μπορούν να πάνε στο Peking University Press που βρίσκεται στο E1-07, East Hall 1 για να αγοράσουν (40% έκπτωση) ή να παραγγείλουν σε διαδικτυακές πλατφόρμες όπως οι Dangdang, JD.com και Taobao.
"The Age of Dialogue" στην Έκθεση Βιβλίου της Σαγκάης, Peking University Press (Booth E1-07, East Hall 1)
Η τεχνητή νοημοσύνη και η ανθρώπινη νοημοσύνη έχουν αρχίσει να εισέρχονται στις οκτώ κύριες τάσεις της «συν-νοημοσύνης»
Η τεχνητή νοημοσύνη είναι ένα σημαντικό μέρος της νέας παραγωγικότητας. Η τεχνητή νοημοσύνη είναι μια ολοκληρωμένη τεχνολογία που περιλαμβάνει σκέψη, τεχνολογία, οικονομία και κοινωνία. Η τεχνολογία της τεχνητής νοημοσύνης είναι διαφορετική από την αγροτική τεχνολογία, τη βιομηχανική τεχνολογία και την τεχνολογία της πληροφορίας στην ανθρώπινη ιστορία. όντα Οι μηχανές που δημιουργήθηκαν μπορεί επίσης να παράγουν νοημοσύνη, επειδή η νοημοσύνη μπορεί τελικά να υπολογιστεί. Η γέννηση της μηχανής Turing το 1936 είναι αναμφίβολα ένα ορόσημο στην ιστορία της τεχνητής νοημοσύνης. Για περισσότερα από 80 χρόνια, για την ανθρώπινη κοινωνία, η τεχνητή νοημοσύνη δεν σήμαινε μόνο κάποιο είδος επιστήμης και τεχνολογίας, αλλά σήμαινε επίσης ανατρεπτικές αλλαγές στη σκέψη, την οικονομία και την κοινωνία. Μετά από συνεχή επανάληψη και εξέλιξη, η τεχνητή νοημοσύνη έχει και θα συνεχίσει να αποδεικνύει την ιστορική σημασία της αλληλεπίδρασης μεταξύ μακροπρόθεσμου και επιταχυνσινισμού. Αυτό το άρθρο εξετάζει τα σύνορα, τις τάσεις και τις προκλήσεις της παγκόσμιας ανάπτυξης τεχνητής νοημοσύνης από το 2022.
1. Μεγάλο μοντέλο γλώσσας (ή μεγάλο μοντέλο)
Μεγάλη ανακάλυψη τον Ιούνιο: Τα σφάλματα "Ενισχυτική μάθηση" μπορούν να βρεθούν και να διορθωθούν
Το ιστορικό ανάπτυξης της τεχνητής νοημοσύνης μπορεί να χωριστεί σε διαφορετικά στάδια. Τον Νοέμβριο του 2022, το OpenAI κυκλοφόρησε το ChatGPT και η γενετική τεχνητή νοημοσύνη (Generative Artificial Intelligence, GenAI) άρχισε να ανθίζει. Η γενετική τεχνητή νοημοσύνη βασίζεται στην τεχνολογία μηχανικής μάθησης που μιμείται τα ανθρώπινα νευρωνικά δίκτυα για τη δημιουργία νέου περιεχομένου μέσω κειμένου, εικόνων, μουσικής, βίντεο κ.λπ.
Ο κεντρικός εκπρόσωπος της GenAI είναι το Large Language Model (LLM). Το λεγόμενο μοντέλο μεγάλης γλώσσας είναι ένα μοντέλο βαθιάς μάθησης που εκπαιδεύεται βάσει μεγάλου όγκου δεδομένων κειμένου, το οποίο μπορεί να δημιουργήσει κείμενο φυσικής γλώσσας ή να κατανοήσει την έννοια του γλωσσικού κειμένου. Μπορεί επίσης να ειπωθεί ότι τα μεγάλα γλωσσικά μοντέλα βασίζονται στη βαθιά μάθηση και χρησιμοποιούν πολυεπίπεδα νευρωνικά δίκτυα για τον εντοπισμό πολύπλοκων μοτίβων στα δεδομένα προσομοιώνοντας τον τρόπο με τον οποίο ο ανθρώπινος εγκέφαλος επεξεργάζεται τις πληροφορίες.
Σε αυτό το στάδιο, ο πυρήνας της τεχνητής νοημοσύνης είναι το μεγάλο γλωσσικό μοντέλο. Οι μεγάλες χώρες και οι μεγάλες εταιρείες του κόσμου έχουν πρωτοστατήσει στην ανάπτυξη μεγάλων γλωσσικών μοντέλων, παρουσιάζοντας εκρηκτική ανάπτυξη και σχηματίζοντας ένα διαρκώς διευρυνόμενο σύμπλεγμα μεγάλων γλωσσικών μοντέλων. Οι κύριες μεταβλητές που επηρεάζουν την απόδοση μεγάλων μοντέλων γλώσσας είναι τα δεδομένα εκπαίδευσης, το μέγεθος του μοντέλου (δηλαδή, ο αριθμός των παραμέτρων), οι αλγόριθμοι παραγωγής και οι τεχνικές βελτιστοποίησης. Τα χαρακτηριστικά των μεγάλων γλωσσικών μοντέλων περιλαμβάνουν: (1) Μεγάλες παραμέτρους. Ο αριθμός των παραμέτρων για μεγάλα μοντέλα γλώσσας μπορεί συχνά να φτάσει τα δισεκατομμύρια ή ακόμα και τις εκατοντάδες δισεκατομμύρια. (2) Να διαθέτουν δυνατότητες αναγνώρισης εικόνας και προγνωστικής ανάλυσης. (3) Να έχουν την ικανότητα κατανόησης και γενίκευσης δεδομένων. Μπορεί να μάθει και να εκτελέσει μια ποικιλία σύνθετων εργασιών και να επιτύχει ακριβή και αποτελεσματική μηχανική μετάφραση, ανάλυση συναισθημάτων και έξυπνες ερωτήσεις και απαντήσεις στην επεξεργασία φυσικής γλώσσας (NLP).
Το ChatGPT, το Gopher της Google, το LaMDA και το Meta's Llama είναι παγκόσμιοι εκπρόσωποι μεγάλων γλωσσικών μοντέλων. Μεταξύ αυτών, το GPT-4 που κυκλοφόρησε από την OpenAI το 2023 είναι το γενικό όνομα μιας σειράς μοντέλων, όχι ενός μοντέλου. Τον Μάιο του 2024, το μοντέλο GPT-4o που κυκλοφόρησε από την OpenAI έδειξε εξαιρετικές ικανότητες στην επεξεργασία εκατοντάδων γλωσσών όσον αφορά την κατανόηση κειμένου, ομιλίας και εικόνων και ήταν σε θέση να διεξάγει φωνητικές συνομιλίες σε πραγματικό χρόνο και να καταγράφει και να εκφράζει με ακρίβεια τα ανθρώπινα συναισθήματα. . Τον Ιούνιο του ίδιου έτους, η Anthropic παρουσίασε επίσημα το μοντέλο Claude 3.5 Sonnet, το οποίο ξεπέρασε τα Claude 3 Opus και GPT-4o όσον αφορά τις δυνατότητες κωδικοποίησης, τις οπτικές δυνατότητες και τους νέους τρόπους αλληλεπίδρασης. Το ακόμα πιο συναρπαστικό είναι ότι το Claude 3.5 Sonnet εισάγει την καινοτόμο λειτουργία "Artifacts", η οποία επιτρέπει στους χρήστες να επεξεργάζονται και να δημιουργούν περιεχόμενο που δημιουργείται από AI σε πραγματικό χρόνο σε έναν δυναμικό χώρο εργασίας, μετατρέποντας την τεχνητή νοημοσύνη συνομιλίας σε συνεργάτη συνεργασίας που ενσωματώνεται απρόσκοπτα στους χρήστες έργα και τη ροή εργασίας. Συγκεκριμένα, το Claude 3.5 Sonnet επαναπροσδιορίζει επίσης την απόδοση κόστους των έξυπνων μοντέλων με διπλάσια ταχύτητα από την προηγούμενη γενιά και 1/5 του κόστους.
Επίσης, τον Ιούνιο, σημειώθηκε μια σημαντική ανακάλυψη στον τομέα των μεγάλων γλωσσικών μοντέλων: το OpenAI κυκλοφόρησε το CriticGPT με βάση το μοντέλο GPT-4, το οποίο χρησιμοποιείται για την καταγραφή σφαλμάτων στην έξοδο κώδικα ChatGPT. Με άλλα λόγια, το CriticGPT είναι ένα μοντέλο που χρησιμοποιεί το GPT-4 για την εύρεση σφαλμάτων GPT-4. Μπορεί όχι μόνο να γράψει τα σχόλια των χρηστών στα αποτελέσματα απόκρισης του ChatGPT, αλλά και να βοηθήσει τους ανθρώπινους εκπαιδευτές να κατανοήσουν και να ικανοποιήσουν καλύτερα τις ανθρώπινες προθέσεις, να τις ανακαλύψουν και να τις διορθώσουν. Τα σφάλματα στην Ενισχυτική Μάθηση με Ανθρώπινη Ανάδραση (RLHF) αντιπροσωπεύουν ένα κρίσιμο βήμα προς τον στόχο της αξιολόγησης της παραγωγής προηγμένων συστημάτων τεχνητής νοημοσύνης.
2.Πλατφόρμα AI
Υπάρχουν εννέα μεγάλες πλατφόρμες στον κόσμο και η τάση είναι η καθετοποίηση και η εξειδίκευση.
Καθώς η τεχνητή νοημοσύνη καλύπτει όλες τις πτυχές της ανθρώπινης παραγωγής και ζωής, η κατασκευή μιας πλατφόρμας τεχνητής νοημοσύνης έχει γίνει μια γενική τάση. Η πλατφόρμα AI παρέχει τις κορυφαίες πολυτροπικές τεχνολογίες τεχνητής νοημοσύνης στον κόσμο, όπως φωνή, εικόνα και NLP, καθώς και ένα ανοιχτό σύστημα και οικοσύστημα τεχνητής νοημοσύνης συνομιλίας. Επί του παρόντος, υπάρχουν εννέα μεγάλες πλατφόρμες τεχνητής νοημοσύνης στον κόσμο που παρέχονται από τις Google, TensorFlow, Microsoft Azure, OpenAI, NVIDIA, H2O.ai, Amazon Web Services (AWS), DataRobot και Fotor. Μεταξύ αυτών, το NVIDIA Omniverse είναι μια ανοιχτή πλατφόρμα σχεδιασμένη για εικονική συνεργασία και ρεαλιστική προσομοίωση σε πραγματικό χρόνο Με τη βοήθεια ενός ισχυρού οικοσυστήματος όπως το λογισμικό GPU και CUDAX AI, παρέχει κορυφαίες λύσεις στον κλάδο, συμπεριλαμβανομένης της μηχανικής εκμάθησης, της βαθιάς μάθησης. και ανάλυση δεδομένων.
Η τάση ανάπτυξης των πλατφορμών AI είναι κυρίως η καθετοποίηση και η εξειδίκευση. Για παράδειγμα, η πλατφόρμα τέχνης AI είναι μια πλατφόρμα για επεξεργασία και δημιουργία εικόνας μέσω τεχνολογίας τεχνητής νοημοσύνης, βοηθώντας καλλιτέχνες και μη επαγγελματίες να δημιουργήσουν γρήγορα ενδιαφέροντες και αισθητικά πολύτιμους πίνακες με τη μορφή ζωγραφικής τεχνητής νοημοσύνης, από τους οποίους μπορούν να δημιουργήσουν δημιουργικούς έμπνευση και καλλιτεχνική εμπειρία, δίνοντας τέχνη Φέρνοντας περισσότερη καινοτομία και δυνατότητες στον κόσμο. Το Midjourney και το Stable Diffusion είναι πλατφόρμες τέχνης AI των οποίων η επιρροή συνεχίζει να επεκτείνεται. Για ένα άλλο παράδειγμα, το Suno v3.5 είναι ένα εργαλείο δημιουργίας μουσικής με τεχνητή νοημοσύνη Η διάρκεια της μουσικής που παράγεται έχει αλλάξει από τα αρχικά 2 λεπτά σε 4 λεπτά και η δομή της μουσικής έχει βελτιστοποιηθεί σημαντικά. Η πλατφόρμα παραγωγής μουσικής AI είναι ειδικός στην ακουστική τέχνη που είναι δύσκολο να περιγραφεί ξεκάθαρα με λέξεις, καταδεικνύοντας τις δημιουργικές της δυνατότητες πέρα από αυτές των ανθρώπων. Η Suno ανακοίνωσε ότι θα κυκλοφορήσει επίσης μια νέα λειτουργία που επιτρέπει στους χρήστες να συνθέτουν τραγούδια με οποιαδήποτε φωνή. Αυτή η νέα δυνατότητα μπορεί να μετατρέψει διάφορους ήχους της καθημερινής ζωής σε μουσική, φέρνοντας νέες δυνατότητες για τη δημιουργία μουσικής.
3.Στοίβα AI
Οι θεμελιώδεις πυλώνες περιλαμβάνουν: δεδομένα, υπολογισμούς και μοντέλα
Από την άποψη του υλικού, η βάση της στοίβας AI είναι η GPU, η CPU και η TPU. Το πιο σημαντικό πράγμα στη γενετική στοίβα AI είναι η GPU. Ωστόσο, η στοίβα AI περιλαμβάνει επίσης ένα σύστημα λογισμικού AI και η τελικά χτισμένη στοίβα AI είναι ένα σύστημα και ένα οικοσύστημα.
Μια εις βάθος ανάλυση δείχνει ότι η στοίβα AI είναι ένα δομημένο πλαίσιο που περιέχει διάφορα επίπεδα και στοιχεία που απαιτούνται για την ανάπτυξη και την ανάπτυξη συστημάτων AI. Τα βασικά στοιχεία της στοίβας AI περιλαμβάνουν διαχείριση δεδομένων, υπολογιστικούς πόρους, πλαίσια μηχανικής μάθησης και πλατφόρμες μηχανικής μάθησης (MLOps). Η γενετική στοίβα AI αποτελείται από τρία επίπεδα: πάνω, μεσαίο και κάτω. Το ανώτερο επίπεδο περιλαμβάνει γνώση και εξειδίκευση σε συγκεκριμένους τομείς, το μεσαίο επίπεδο παρέχει δεδομένα και υποδομή που μπορούν να χρησιμοποιηθούν για τη δημιουργία μοντέλων τεχνητής νοημοσύνης και το κάτω επίπεδο είναι πόροι και υπηρεσίες υπολογιστικού νέφους. Η πρόοδος σε κάθε επίπεδο είναι κρίσιμη για την προώθηση της τεχνητής νοημοσύνης. Οι βασικοί πυλώνες της στοίβας AI περιλαμβάνουν: δεδομένα, υπολογισμούς και μοντέλα. Μεταξύ αυτών, το Generative AI απαιτεί μεγάλο όγκο υπολογιστικών πόρων και μεγάλα σύνολα δεδομένων, τα οποία υποβάλλονται σε επεξεργασία και αποθηκεύονται σε κέντρα δεδομένων υψηλής απόδοσης.
Σε γενικές γραμμές, με βάση τη στοίβα AI, μπορούν να κατασκευαστούν εφαρμογές τεχνητής νοημοσύνης με χαρακτηριστικά όπως γρήγορη αναζήτηση, γρήγορη μετάφραση, έξυπνη αναγνώριση και έξυπνος έλεγχος.
4. Προσομοιωτής Φυσικού Κόσμου
Το τρίτο είναι ο φυσικός κόσμος της τεχνητής νοημοσύνης: πέρα από την αντίληψη του ανθρώπινου χωροχρόνου
Για τους σύγχρονους ανθρώπους, υπάρχουν τρεις κόσμοι: ο πραγματικός κόσμος της εμπειρίας, ο εικονικός κόσμος και ο φυσικός κόσμος πέρα από την ανθρώπινη αντίληψη του χρόνου και του χώρου. Η τεχνητή νοημοσύνη επηρεάζει άμεσα τη σχέση μεταξύ των ανθρώπων και των παραπάνω τριών κόσμων. Στον πραγματικό κόσμο της εμπειρίας, ο παραλληλισμός και η αλληλεπίδραση της τεχνητής νοημοσύνης και της φυσικής νοημοσύνης έχουν αλλάξει τον τρόπο που υπάρχει ο πραγματικός κόσμος στον εικονικό κόσμο, η τεχνητή νοημοσύνη και η εικονική τεχνολογία πραγματικότητας μπορούν να οδηγήσουν τους ανθρώπους σε μια εξωπραγματική κατάσταση εμβαπτιστικής εμπειρίας, μεταξύ των οποίων. the metaverse is Ένας τρόπος στον φυσικό κόσμο που ξεπερνά την ανθρώπινη αντίληψη του χρόνου και του χώρου, η τεχνητή νοημοσύνη μπορεί να βοηθήσει τους ανθρώπους να ξεπεράσουν τους περιορισμούς των αισθήσεων και να κατανοήσουν το σύμπαν με δεκάδες δισεκατομμύρια έτη φωτός, όπως η κλίμακα και οι μικροσκοπικές σκηνές. νανόμετρα ως μονάδα μέτρησης. Στον τομέα των επιστημονικών πειραμάτων, η τεχνολογία τεχνητής νοημοσύνης δεν είναι πλέον απλώς εργαλείο, αλλά προϋπόθεση.
Η θεμελιώδης σημασία της εμφάνισης του Sora στις αρχές του 2024 είναι ότι μέσω της δικής του λειτουργίας προσομοιωτή φυσικού κόσμου, δείχνει έναν φυσικό κόσμο που οι άνθρωποι μπορεί να μην αντιλαμβάνονται, έναν φυσικό κόσμο που είναι πιθανό να είναι πιο πραγματικός από αυτό που μπορούν να δουν τα ανθρώπινα μάτια. Μόλις οι άνθρωποι αντιληφθούν και ενσωματωθούν στον κόσμο που δημιουργήθηκε από τη μηχανή φυσικής τεχνητής νοημοσύνης, θα βιώσουν πιο διαφορετικούς φυσικούς κανόνες.
Όταν το Sora εκτελεί εργασίες δημιουργίας βίντεο, με βάση την υποστήριξη μονάδων αντίληψης, μνήμης και ελέγχου, τα βίντεο που δημιουργούνται μπορούν να ακολουθούν τους φυσικούς νόμους του πραγματικού κόσμου σε κάποιο βαθμό, γεγονός που το καθιστά πιο ικανό να προσομοιώνει ανθρώπους, ζώα, περιβάλλοντα, κ.λπ. στον πραγματικό κόσμο Ο ευρύς χώρος φαντασίας ουσιαστικά πραγματοποιεί χωρική συνέπεια, χρονική συνέπεια και αιτιακή συνέπεια. Το Sora είναι ένα ευανάγνωστο παγκόσμιο μοντέλο Το πόσο καλά τα πάει σε αυτό το στάδιο δεν είναι η ουσία του προβλήματος. Μετά την κυκλοφορία του Open-Sora 1.1, η ποιότητα και η διάρκεια της δημιουργίας βίντεο έχουν βελτιωθεί σημαντικά. Η βελτιστοποιημένη αρχιτεκτονική Causal Video VAE βελτιώνει σημαντικά την απόδοση και την αποτελεσματικότητα των συμπερασμάτων του Sora.
Μία από τις σημαντικές συνεισφορές της NVIDIA είναι η ολοκλήρωση του ψηφιακού μοντέλου δίδυμης γης Earth-2. Το Earth-2 συνδυάζει το παραγωγικό μοντέλο AI CorrDiff και εκπαιδεύεται με βάση την αριθμητική προσομοίωση WRF, η οποία μπορεί να προβλέψει με ακρίβεια τις καιρικές πληροφορίες με 12 φορές μεγαλύτερη ανάλυση (αυξήθηκε από 25 χιλιόμετρα σε 2 χιλιόμετρα). Το επόμενο βήμα για το Earth-2 είναι να βελτιώσει την ακρίβεια πρόβλεψης από 2 χιλιόμετρα σε δεκάδες μέτρα. Η ανάλυση είναι υψηλότερη, η ταχύτητα λειτουργίας είναι 1000 φορές υψηλότερη από αυτή της φυσικής προσομοίωσης και η ενεργειακή απόδοση είναι 3000 φορές υψηλότερη, πράγμα που σημαίνει ότι μπορεί να προβλεφθεί σε πραγματικό χρόνο.
Το όραμα είναι πολύ σαφές: οι άνθρωποι κατασκευάζουν ως σύμπλοκα αντίληψης/μνήμης/ελέγχου, με την ικανότητα να κατασκευάζουν ρεαλιστικά και φυσικά σωστά «μοντέλα του κόσμου». Με αυτή την έννοια, ο επιστήμονας της Microsoft, Sébastien Bubeck, πρότεινε την ιδέα και την ερευνητική κατεύθυνση της «φυσικής AI». Ο Διευθύνων Σύμβουλος της NVIDIA, Jensen Huang, πρότεινε επίσης ότι το επόμενο κύμα τεχνητής νοημοσύνης θα είναι το φυσικό AI. Επομένως, το ψηφιακό δίδυμο της Nvidia στοχεύει όχι μόνο τη γη, αλλά και ολόκληρο τον φυσικό κόσμο.
5. Ενσωματωμένη νοημοσύνη και έξυπνα ρομπότ
Η απόλυτη εφαρμογή: Αφήστε την τεχνητή νοημοσύνη να γίνει «άνθρωπος»
Η ανάπτυξη της τεχνητής νοημοσύνης θα οδηγήσει αναπόφευκτα στη διαμόρφωση ενός οικοσυστήματος τεχνητής νοημοσύνης. Η ενσωματωμένη τεχνητή νοημοσύνη (EAI) ή τα ευφυή ρομπότ έχουν γίνει το κύριο σώμα στο οικοσύστημα τεχνητής νοημοσύνης.
Η ενσωματωμένη νοημοσύνη είναι μια περαιτέρω επέκταση της τεχνητής νοημοσύνης στον φυσικό κόσμο. Είναι ένα έξυπνο σύστημα που μπορεί να κατανοήσει, να συλλογιστεί και να αλληλεπιδράσει με τον φυσικό κόσμο δράση. Επιπλέον, τα έξυπνα ρομπότ θα μάθουν προσομοιώνοντας μονοπάτια ανθρώπινης σκέψης και θα δώσουν ανατροφοδότηση συμπεριφοράς που αναμένεται από τους ανθρώπους. Συνεχής εξέλιξη. Δηλαδή, η εκτέλεση ποικίλων εργασιών που μπορούν να επιθεωρηθούν και να μετρηθούν σε ένα πραγματικό φυσικό περιβάλλον. Εν ολίγοις, το χαρακτηριστικό της ενσωματωμένης νοημοσύνης είναι η ικανότητα να αντιλαμβάνεται αυτόνομα τον φυσικό κόσμο από την οπτική γωνία του πρωταγωνιστή.
Όσον αφορά τις διάφορες μορφές έξυπνων ρομπότ, είναι φυσικές μορφές ενσωματωμένης νοημοσύνης. Η συνολική τους αρχιτεκτονική αποτελείται από ένα επίπεδο αντίληψης, ένα στρώμα αλληλεπίδρασης και ένα στρώμα κίνησης. Το ανθρωποειδές ρομπότ της Tesla "Optimus Prime" αναπτύχθηκε από την πρώτη γενιά στη δεύτερη γενιά, η αμερικανική startup ανθρωποειδή ρομπότ Figure AI έλαβε μια τεράστια επένδυση τον Φεβρουάριο του τρέχοντος έτους και η NVIDIA παρουσίασε 25 ανθρωποειδή ρομπότ στο Παγκόσμιο Συνέδριο Τεχνολογίας (GTC) του 2024. Όλα δείχνουν την ταχεία ανάπτυξη του τομέα των ανθρωποειδών ρομπότ.
Τον Μάρτιο του 2024, η NVIDIA κυκλοφόρησε το πρώτο παγκόσμιο βασικό μοντέλο ανθρωποειδούς ρομπότ-Project GR00T στον κόσμο. Το ρομπότ που βασίζεται σε μοντέλα είναι σε θέση να κατανοεί τη φυσική γλώσσα και να μιμείται τις ενέργειες παρατηρώντας την ανθρώπινη συμπεριφορά και οι χρήστες μπορούν να το διδάξουν να μαθαίνει γρήγορα να συντονίζει διάφορες δεξιότητες για να προσαρμοστεί και να αλληλεπιδράσει με τον πραγματικό κόσμο. Η εμφάνιση του Project GR00T δείχνει ότι η πραγματική εποχή των ρομπότ μπορεί να πλησιάζει. Αυτή είναι και η απόλυτη εφαρμογή της τεχνητής νοημοσύνης: να γίνει η τεχνητή νοημοσύνη «άνθρωπος».
Η άνοδος της ενσωματωμένης νοημοσύνης σηματοδοτεί τη μετάβαση από την παραδοσιακή τεχνολογία ρομποτικής που βασίζεται στον έλεγχο σε ένα νέο παράδειγμα μάθησης και λειτουργίας. Η έκρηξη της τεχνολογίας μεγάλων μοντέλων και η μείωση του κόστους υλικού οδήγησαν στην εμφάνιση εταιρειών ενσωματωμένης νοημοσύνης που στοχεύουν στην ανάπτυξη ευφυών ρομπότ που μπορούν να αλληλεπιδρούν με τον φυσικό κόσμο.
Τον Μάιο του 2024, το Διεθνές Συνέδριο για τη Ρομποτική και τον Αυτοματισμό (IEEE ICRA), ένα από τα διεθνή ακαδημαϊκά συνέδρια με τη μεγαλύτερη επιρροή στον τομέα της ρομποτικής, θα πραγματοποιηθεί στη Γιοκοχάμα της Ιαπωνίας. Το θέμα του φετινού συνεδρίου «CONNECT+» όχι μόνο παρουσιάζει τις τελευταίες εξελίξεις στην τεχνολογία της ρομποτικής, αλλά και μια επανάσταση στην «ενσωματωμένη νοημοσύνη» και τη «μάθηση». Μακροπρόθεσμα, η ενσωματωμένη νοημοσύνη έχει μεγάλη σημασία για την ανάπτυξη της βιομηχανίας τεχνητής νοημοσύνης και έχει μια αξία που δεν μπορεί να αγνοηθεί για την Τεχνητή Γενική Νοημοσύνη (AGI).
6. Χωρική νοημοσύνη
Περισσότερο από μια μηχανική έκδοση του ανθρώπινου ματιού, αποκαλύπτει τον κόσμο από μια γωνία που δεν φανταζόμασταν
Υπάρχουν δύο τύποι χωρικής νοημοσύνης: ο ένας είναι η χωρική νοημοσύνη που σχηματίζεται από τη φυσική εξέλιξη. Η φύση χρειάστηκε εκατομμύρια χρόνια για να εξελίξει οι άνθρωποι τη χωρική νοημοσύνη. Η άλλη είναι η χωρική νοημοσύνη που βασίζεται στην τεχνολογία τεχνητής νοημοσύνης, στην οποία οι μηχανές προσομοιώνουν πολύπλοκους ανθρώπινους οπτικούς συλλογισμούς και ενέργειες και κατανοούν και λειτουργούν άμεσα τον τρισδιάστατο κόσμο μέσω οπτικών πληροφοριών με τη βοήθεια πολλαπλών αισθητήρων.
Συγκρίνοντας τη χωρική νοημοσύνη που σχηματίζεται από τη φυσική εξέλιξη και τη χωρική νοημοσύνη που βασίζεται στην τεχνολογία τεχνητής νοημοσύνης, η διαφορά είναι σημαντική: η χωρική νοημοσύνη που σχηματίζεται από τη φυσική εξέλιξη είναι περιορισμένη στη χωρική διάσταση και είναι δύσκολο ή και αδύνατο να διαρρήξεις τον τρισδιάστατο χώρο . Ωστόσο, η χωρική νοημοσύνη που βασίζεται στην τεχνολογία τεχνητής νοημοσύνης μπορεί να ξεπεράσει τη χωρική διάσταση. Ένας τέτοιος χώρος σπάει τα γεωγραφικά όρια και βρίσκεται σε ρευστή, απεριόριστη, ελεύθερη και ανοιχτή κατάσταση. Όχι μόνο αυτό, ένας τέτοιος χώρος δεν υπόκειται πλέον στους χρονικούς περιορισμούς του Νεύτωνα, επιτυγχάνοντας επικαιρότητα και βελτιστοποίηση χρόνου. Για παράδειγμα, οι ερευνητές της Google ανέπτυξαν έναν αλγόριθμο που μπορεί να μετατρέψει δεδομένα σε τρισδιάστατα σχήματα ή σκηνές χρησιμοποιώντας μόνο ένα σύνολο φωτογραφιών.
Από αυτή την άποψη, ο Li Feifei, διευθυντής του Human-Centered AI Research Institute στο Πανεπιστήμιο του Στάνφορντ (ακαδημαϊκός της Εθνικής Ακαδημίας Μηχανικής), έχει τις ακόλουθες βαθιές σκέψεις: «Ο συνδυασμός της οπτικής οξύτητας με το βάθος της εγκυκλοπαιδικής γνώσης μπορεί να δημιουργήσει μια επωνυμία Αυτό το είδος δεν είναι ακόμη γνωστό ποιες θα είναι οι νέες δυνατότητες, αλλά πιστεύω ότι θα είναι κάτι περισσότερο από μια μηχανική έκδοση του ανθρώπινου ματιού. σε θέση να δούμε από γωνίες που ποτέ δεν έχουμε φανταστεί Αποκαλύπτοντας τον κόσμο «Δηλαδή, η χωρική νοημοσύνη που βασίζεται στην τεχνολογία τεχνητής νοημοσύνης θα διαπεράσει τη χωρική νοημοσύνη που σχηματίζεται από τη φυσική εξέλιξη και θα αποκαλύψει μια χωρική κατάσταση στην οποία οι άνθρωποι δεν μπορούν να βασιστούν στον εγκέφαλό τους. φαντάζομαι. Για παράδειγμα, ο κβαντικός χώρος που περιγράφεται από την κβαντομηχανική αναφέρεται σε ένα χώρο με τοπολογικά χαρακτηριστικά που αποτελείται από ορισμένες διακριτές ή συνεχείς καταστάσεις. Είναι αδύνατο για τη χωρική νοημοσύνη που έχουν φυσικά εξελιχθεί οι άνθρωποι να αντιληφθούν και να αναγνωρίσουν τον κβαντικό χώρο, αλλά είναι δυνατό για τη χωρική νοημοσύνη που υποστηρίζεται από την τεχνολογία τεχνητής νοημοσύνης.
Εν ολίγοις, η χωρική νοημοσύνη που βασίζεται σε μεγάλα μοντέλα τεχνητής νοημοσύνης οδηγεί τους ανθρώπους σε «μια ολοκαίνουργια ύπαρξη» και η ενσωματωμένη νοημοσύνη είναι πιθανό να είναι η «αβορίγινα» εδώ.
7. Βαθιά εξέλιξη της τεχνητής νοημοσύνης
Ο νόμος του Μουρ μπορεί να σπάσει, η μεταγνώση οδηγεί στην αποτυχία του νόμου κλιμάκωσης
Η τεχνητή νοημοσύνη βρίσκεται σε μια ιστορική στιγμή βαθιάς εξέλιξης. Ο νόμος του Moore και ο νόμος κλιμάκωσης παίζουν σταδιακά έναν όλο και πιο σημαντικό ρόλο.
Ο νόμος του Moore είναι ένας κανόνας που συνοψίζεται από τον συνιδρυτή της Intel, Gordon Moore, με βάση την εμπειρία, δηλαδή, ο αριθμός των τρανζίστορ που μπορούν να τοποθετηθούν σε ένα ολοκληρωμένο κύκλωμα θα διπλασιάζεται περίπου κάθε 18 έως 24 μήνες. Με άλλα λόγια, η απόδοση του επεξεργαστή διπλασιάζεται περίπου κάθε δύο χρόνια. Το πρόβλημα είναι ότι όταν τα τσιπ πήγαν στα 28 νανόμετρα (nm), υπήρχε μια κρίση του νόμου του Moore. Όταν το τσιπ εισέρχεται στο τσιπ διαδικασίας 1 νανομέτρου, σημαίνει ότι φτάνει στο όριο του νόμου του Μουρ. Τώρα ολόκληρη η βάση υλικού της τεχνητής νοημοσύνης με τα τσιπ ως πυρήνα αντιμετωπίζει μια κρίση του νόμου του Moore ή ένα όριο του νόμου του Moore. Τον Ιούνιο του 2024, στη Διεθνή Έκθεση Υπολογιστών της Ταϊπέι 2024 (Computex 2024), ο Διευθύνων Σύμβουλος της Nvidia Jen-Hsun Huang ανακοίνωσε ότι η συχνότητα ενημέρωσης της αρχιτεκτονικής GPU της θα επιταχύνεται από κάθε δύο χρόνια σε μία φορά το χρόνο, αλλά η αύξηση της υπολογιστικής ισχύος δεν έχει στάσιμο και η τεχνητή νοημοσύνη του Η υπολογιστική ισχύς των τσιπ έχει επιτύχει μια εκπληκτική αύξηση 1.000 φορές τα τελευταία οκτώ χρόνια, γεγονός που δείχνει ότι υπάρχει μια τεχνολογική δυνατότητα να ξεπεράσουμε την κρίση του νόμου του Μουρ και τα όρια του νόμου του Μουρ.
Ο νόμος κλιμάκωσης περιλαμβάνει κυρίως τη μελέτη κρίσιμων φαινομένων Η βασική του ιδέα είναι ότι καθώς αυξάνεται το μέγεθος των παραμέτρων του μοντέλου, το μέγεθος του συνόλου δεδομένων και ο αριθμός των υπολογισμών κινητής υποδιαστολής που χρησιμοποιούνται για την εκπαίδευση, η απόδοση του μοντέλου θα βελτιώνεται. . Για βέλτιστη απόδοση, οι τρεις παραπάνω παράγοντες πρέπει να ενισχύονται ταυτόχρονα. Όταν δεν περιορίζεται από τους άλλους δύο παράγοντες, η απόδοση του μοντέλου έχει σχέση ισχύος-νόμου με κάθε μεμονωμένο παράγοντα.
Ειδικά στον τομέα της τεχνητής νοημοσύνης, η πρόβλεψη απόδοσης του GPT-4 σε συγκεκριμένα προβλήματα μπορεί να προβλεφθεί από ένα μοντέλο που είναι 1.000 φορές μικρότερο από το GPT-4. Με άλλα λόγια, το GPT-4 δεν έχει ξεκινήσει ακόμη την εκπαίδευση και η απόδοσή του σε αυτό το πρόβλημα είναι ήδη γνωστή. Επομένως, οι νόμοι κλιμάκωσης είναι σημαντικοί για την εκπαίδευση μεγάλων μοντέλων. Μπορεί να ειπωθεί ότι ο νόμος κλιμάκωσης είναι ένας άλλος πιθανός νόμος για τη βαθιά εξέλιξη της τεχνητής νοημοσύνης.
Πριν από λίγο καιρό, ο Bill Gates εξέφρασε μια βαθιά άποψη για τον νόμο της κλιμάκωσης σε ένα επεισόδιο του podcast The Next Big Idea: "Ο νόμος της κλιμάκωσης σίγουρα θα συνεχίσει να ισχύει. Αλλά ταυτόχρονα, από όσα γνωρίζουμε σήμερα, θα είναι μια μετατόπιση από απλούς αλγόριθμους σε πιο ανθρώπινες μεταγνωστικές ενέργειες, κάτι που είναι μεγαλύτερο όριο "Επειδή η συνείδηση μπορεί να σχετίζεται με τη μεταγνώση και η μεταγνώση δεν είναι ένα μετρήσιμο φαινόμενο." Με άλλα λόγια, η μεταγνώση προκαλεί την αποτυχία του νόμου κλιμάκωσης.
8. Βραχυπρόθεσμες και μεσοπρόθεσμες τάσεις
Το γενικό στάδιο της τεχνητής νοημοσύνης επιταχύνεται και η «αυγή» του σούπερ AI εμφανίστηκε
Στο χρονικό σημείο του 2024, μπορούμε γενικά να δούμε τις βραχυπρόθεσμες και μεσοπρόθεσμες τάσεις της τεχνητής νοημοσύνης:
(1) Το στάδιο Τεχνητής Στενής Νοημοσύνης (ANI) πλησιάζει στο τέλος του. Σε αυτό το στάδιο, η τεχνητή νοημοσύνη είναι ένα σύστημα AI που μπορεί να εκτελέσει συγκεκριμένες εργασίες, όπως η αναγνώριση εικόνας ή η αναγνώριση ομιλίας. Το αποκορύφωμα αυτού του σταδίου είναι η εμφάνιση μεγάλων μοντέλων που υποστηρίζουν τη γενετική τεχνητή νοημοσύνη και η εκλαΐκευση των ευφυών μηχανών.
(2) Το στάδιο της γενικής τεχνητής νοημοσύνης επιταχύνεται.
(3) Η «αυγή» της Τεχνητής Υπέρ Νοημοσύνης (ASI) έχει εμφανιστεί στον ορίζοντα. Η σούπερ τεχνητή νοημοσύνη έχει την ικανότητα να ξεπερνά το «ανθρώπινο μυαλό», να προσεγγίζει και να ξεπερνά γρήγορα τη συλλογική νοημοσύνη όλης της ανθρωπότητας και είναι ένα σύστημα τεχνητής νοημοσύνης που είναι πιο ισχυρό από την ανθρώπινη νοημοσύνη.
Η τεχνητή νοημοσύνη βρίσκεται ήδη σε μια ιστορική περίοδο όπου η φαντασία των ανθρώπων ανανεώνεται καθημερινά. Κατά τη διάρκεια αυτής της περιόδου, τα θέματα και τα συστήματα αναφοράς του κόσμου θα αλλάξουν μέχρι στιγμής, το σύστημα γνώσης θα ανακατασκευαστεί, η ανθρώπινη νοημοσύνη και η τεχνητή νοημοσύνη θα αρχίσουν να εισέρχονται σε κατάσταση «συν-νοημοσύνης» και οι παραδοσιακοί οικονομικοί οργανισμοί, τα εθνικά συστήματα και τα νομικά συστήματα θα Θα υπάρξουν επίσης αλλαγές, και ο ανθρώπινος πολιτισμός θα αναδιοργανωθεί ακόμη και στο μέλλον.
Ζου Τζιαμίνγκ
6 Ιουλίου 2024
(Ο τίτλος και ο υπότιτλος στον αρχικό πρόλογο έχουν συμπληρωθεί και τελειοποιηθεί από τον εκδότη)
Συγγραφέας: Zhu Jiaming
Κείμενο: Zhu Jiaming Εικόνες: Zhu Meiquan Επιμέλεια: Li Nian Επιμέλεια: Li Nian
Παρακαλούμε αναφέρετε την πηγή κατά την επανεκτύπωση αυτού του άρθρου.