Nachricht

Zhu Jiamings neues Vorwort: KI und menschliche Intelligenz beginnen, in acht großen Trends 2024 in Shanghai „Intelligenz zu teilen“.

2024-08-19

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

„Die Ära des Dialogs: Der Weg zu einem starken Land durch Forging New Productivity“ von Zhu Jiaming, Tao Hu, Shen Yang usw., veröffentlicht von Peking University Press im August 2024, zum Preis von 78 Yuan
[Einleitung] Die Shanghai Book Fair ist in vollem Gange, mit Menschenmassen innerhalb und außerhalb der Ausstellungshalle, und Informationen und Stimmung auf allen Ebenen fließen und anstecken.
Das neue Buch „The Era of Dialogue: The Road to a Strong Country by Forging New Productivity“, herausgegeben von Peking University Press und zusammengestellt von Rednern des Wenhui Lecture Hall, wurde auf der Buchmesse vorgestellt und fand in der Chang'an Street statt Leseclub am 14. August. Liste der neuen Bücher. Das Buch ist in drei Hauptkapitel unterteilt: die „Entstehung“ der künstlichen Intelligenz, die integrierte Entwicklung virtueller und realer Welten und die Infrastruktur der digitalen Intelligenztechnologie. Der Schwerpunkt liegt auf künstlicher Intelligenz, großen Modellen, Chips und Gehirn-Computer-Schnittstellen , Web3, Satelliteninternet, digitale Ökologie und Meta-Das Universum, KI-Ethik und andere Themen.
Vierzehn Vorträge, 41 Experten, Wissenschaftler und Branchenelite, darunter Zhu Jiaming, Lin Baojun, Wang Jianyu, Shen Yang, Li Miao, Cai Hengjin, Lu Yong, Lin Longnian, Lin Yonghua, Tao Hu, Yang Guang, Wei Hui und Gäste der He Liang-Vorlesung, darunter Ji Weidong, Feng Xiang, Jiang Xiaoyuan, Yu Hai, He Jing, Fu Changzhen, Li Quanmin usw., gaben eine eingehende Analyse der technologischen Innovation und der technologischen Innovation in den Bereichen der Informationstechnologie der neuen Generation und der künstlichen Intelligenz Intelligenz, Luft- und Raumfahrt, Biomedizin, Quantentechnologie usw. Industrielle Entwicklung, die Erforschung der Grenzen, Trends und Herausforderungen der globalen Entwicklung künstlicher Intelligenz sowie Themen wie ethische Governance künstlicher Intelligenz werden den Lesern helfen, das Konzept und die Bedeutung neuer Produktivkräfte zu verstehen und ihre wichtige Rolle bei der Förderung der Entwicklung der chinesischen Modernisierung. Dieses Buch verkörpert den Dialog zwischen Wissenschaft und Technologie und den Geisteswissenschaften und die Verbindung zwischen technologischer Entwicklung und sozialem Wandel. Es ist sowohl auf dem neuesten Stand als auch kann neue Erkenntnisse gewinnen. Es hilft, das Konzept und die Bedeutung neuer Qualitätsproduktivität und ihre wichtige Rolle zu verstehen bei der Förderung der Entwicklung der chinesischen Modernisierung.
Besonders hervorzuheben ist, dass das Vorwort dieses Buches 17.000 Wörter umfasst und von einem der Autoren, dem Ökonomen Zhu Jiaming, persönlich verfasst wurde. Es konzentriert sich auf die Grenzen, Trends und Herausforderungen der Entwicklung künstlicher Intelligenz von 2022 bis 2024 und geht auch näher darauf ein Die neuesten Informationen in diesem Vorwort zu den Auswirkungen künstlicher Intelligenz auf die Makroökonomie stammen von Anfang Juli 2024. In diesem Abschnitt werden die Grenzen, Trends und Herausforderungen der KI-Entwicklung aus diesem Vorwort erläutert.
Während der Buchmesse können Leser bei Peking University Press in E1-07, Osthalle 1 einkaufen (40 % Rabatt) oder auf Online-Plattformen wie Dangdang, JD.com und Taobao bestellen.
„Das Zeitalter des Dialogs“ auf der Shanghai Book Fair, Peking University Press (Stand E1-07, Osthalle 1)
KI und menschliche Intelligenz haben begonnen, in die acht großen Trends der „Ko-Intelligenz“ einzudringen.
Künstliche Intelligenz ist ein wichtiger Teil der neuen Produktivität. Künstliche Intelligenz ist eine umfassende Technologie, die Denken, Technologie, Wirtschaft und Gesellschaft umfasst. Die Technologie der künstlichen Intelligenz unterscheidet sich von der Agrartechnologie, der Industrietechnologie und der Informationstechnologie in der Geschichte der Menschheit. Sie entstand aus einem Glauben, einem Konzept und einem Geist der intellektuellen Elite vom antiken Griechenland bis zur Neuzeit, das heißt, Intelligenz ist nicht nur etwas für den Menschen Die geschaffenen Maschinen können auch Intelligenz produzieren, da Intelligenz letztendlich berechenbar ist. Die Geburt der Turing-Maschine im Jahr 1936 ist zweifellos ein Meilenstein in der Geschichte der künstlichen Intelligenz. Seit mehr als 80 Jahren bedeutet künstliche Intelligenz für die menschliche Gesellschaft nicht nur eine Art Wissenschaft und Technologie, sondern auch disruptive Veränderungen im Denken, in der Wirtschaft und in der Gesellschaft. Nach kontinuierlicher Iteration und Weiterentwicklung hat die künstliche Intelligenz die historische Bedeutung der Wechselwirkung zwischen Langfristigkeit und Akzelerationismus bewiesen und wird dies auch weiterhin tun. In diesem Artikel werden die Grenzen, Trends und Herausforderungen der globalen Entwicklung künstlicher Intelligenz seit 2022 erörtert.
1. Großes Sprachmodell (oder großes Modell)
Großer Durchbruch im Juni: „Reinforcement Learning“-Fehler können gefunden und behoben werden
Die Entwicklungsgeschichte der Künstlichen Intelligenz lässt sich in verschiedene Phasen einteilen. Im November 2022 veröffentlichte OpenAI ChatGPT und die generative künstliche Intelligenz (Generative Artificial Intelligence, GenAI) begann zu florieren. Generative künstliche Intelligenz basiert auf maschineller Lerntechnologie, die menschliche neuronale Netze imitiert, um neue Inhalte durch Texte, Bilder, Musik, Videos usw. zu erstellen.
Der zentralisierte Vertreter von GenAI ist das Large Language Model (LLM). Das sogenannte große Sprachmodell ist ein Deep-Learning-Modell, das auf der Grundlage einer großen Menge an Textdaten trainiert wird und in der Lage ist, Text in natürlicher Sprache zu generieren oder die Bedeutung von Sprachtext zu verstehen. Man kann auch sagen, dass große Sprachmodelle auf Deep Learning basieren und mehrschichtige neuronale Netze verwenden, um komplexe Muster in Daten zu identifizieren, indem sie die Art und Weise simulieren, wie das menschliche Gehirn Informationen verarbeitet.
In dieser Phase ist der Kern der künstlichen Intelligenz das große Sprachmodell. Die großen Länder und großen Unternehmen der Welt haben die Entwicklung großer Sprachmodelle vorangetrieben, ein explosionsartiges Wachstum verzeichnet und eine ständig wachsende Gruppe großer Sprachmodelle gebildet. Die wichtigsten Variablen, die die Leistung großer Sprachmodelle beeinflussen, sind Trainingsdaten, Modellgröße (d. h. Anzahl der Parameter), Generierungsalgorithmen und Optimierungstechniken. Zu den Merkmalen großer Sprachmodelle gehören: (1) Große Parameter. Die Anzahl der Parameter für große Sprachmodelle kann oft Milliarden oder sogar Hunderte von Milliarden erreichen. (2) Sie verfügen über Funktionen zur Bilderkennung und prädiktiven Analyse. (3) Die Fähigkeit haben, Daten zu verstehen und zu verallgemeinern. Es kann eine Vielzahl komplexer Aufgaben erlernen und ausführen und eine genaue und effiziente maschinelle Übersetzung, Stimmungsanalyse und intelligente Fragen und Antworten in der Verarbeitung natürlicher Sprache (NLP) erreichen.
ChatGPT, Googles Gopher, LaMDA und Metas Llama sind globale Vertreter großer Sprachmodelle. Unter ihnen ist GPT-4, das 2023 von OpenAI veröffentlicht wurde, der allgemeine Name einer Reihe von Modellen, nicht eines einzelnen Modells. Im Mai 2024 zeigte das von OpenAI eingeführte GPT-4o-Modell hervorragende Fähigkeiten bei der Verarbeitung von Hunderten von Sprachen im Hinblick auf das Verständnis von Text, Sprache und Bildern und war in der Lage, Sprachgespräche in Echtzeit zu führen und menschliche Emotionen genau zu erfassen und auszudrücken . Im Juni desselben Jahres brachte Anthropic offiziell das Modell Claude 3.5 Sonnet auf den Markt, das Claude 3 Opus und GPT-4o in Bezug auf Codierungsfunktionen, visuelle Fähigkeiten und neue Interaktionsmöglichkeiten übertraf. Noch aufregender ist, dass Claude 3.5 Sonnet die innovative Funktion „Artefakte“ einführt, die es Benutzern ermöglicht, KI-generierte Inhalte in Echtzeit in einem dynamischen Arbeitsbereich zu bearbeiten und zu erstellen und so Konversations-KI in einen Kooperationspartner zu verwandeln, der nahtlos in Benutzer integriert wird ' Projekte und Arbeitsablauf. Insbesondere definiert Claude 3.5 Sonnet auch das Preis-Leistungs-Verhältnis von Smart-Modellen mit der doppelten Geschwindigkeit der Vorgängergeneration und einem Fünftel der Kosten neu.
Ebenfalls im Juni gelang ein Durchbruch im Bereich großer Sprachmodelle: OpenAI veröffentlichte CriticGPT auf Basis des GPT-4-Modells, das zur Erfassung von Fehlern in der ChatGPT-Codeausgabe verwendet wird. Mit anderen Worten: CriticGPT ist ein Modell, das GPT-4 verwendet, um GPT-4-Fehler zu finden. Es kann nicht nur Benutzerkommentare zu ChatGPT-Antwortergebnissen schreiben, sondern auch menschlichen Trainern helfen, menschliche Absichten besser zu verstehen und zu erfüllen, sie zu entdecken und zu korrigieren. Fehler beim Reinforcement Learning with Human Feedback (RLHF) stellen einen entscheidenden Schritt in Richtung des Ziels dar, die Ergebnisse fortschrittlicher KI-Systeme zu bewerten.
2.AI-Plattform
Es gibt neun große Plattformen auf der Welt, und der Trend geht in Richtung Vertikalisierung und Spezialisierung.
Da KI alle Aspekte der menschlichen Produktion und des menschlichen Lebens abdeckt, ist der Aufbau einer KI-Plattform zu einem allgemeinen Trend geworden. Die KI-Plattform bietet die weltweit führenden multimodalen Technologien für künstliche Intelligenz wie Sprache, Bild und NLP sowie ein offenes System und Ökosystem für künstliche Intelligenz im Dialog. Derzeit gibt es weltweit neun große KI-Plattformen, die von Google, TensorFlow, Microsoft Azure, OpenAI, NVIDIA, H2O.ai, Amazon Web Services (AWS), DataRobot und Fotor bereitgestellt werden. Unter anderem ist NVIDIA Omniverse eine offene Plattform, die für virtuelle Zusammenarbeit und realistische Echtzeitsimulation entwickelt wurde. Mithilfe eines leistungsstarken Ökosystems wie GPU und CUDAX AI-Software bietet es branchenführende Lösungen, einschließlich maschinellem Lernen und Deep Learning und Datenanalyse.
Der Entwicklungstrend von KI-Plattformen ist hauptsächlich Vertikalisierung und Spezialisierung. Beispielsweise ist die KI-Kunstplattform eine Plattform für die Bildverarbeitung und -erstellung mithilfe der Technologie der künstlichen Intelligenz und hilft Künstlern und Laien dabei, schnell interessante und ästhetisch wertvolle Gemälde in Form von Gemälden mit künstlicher Intelligenz zu erstellen, aus denen sie kreativ gestalten können Inspiration und künstlerische Erfahrung, Kunst schenken, der Welt mehr Innovation und Möglichkeiten bringen. Midjourney und Stable Diffusion sind KI-Kunstplattformen, deren Einfluss immer weiter zunimmt. Ein weiteres Beispiel: Suno v3.5 ist ein KI-Tool zur Musikgenerierung. Die Länge der erzeugten Musik wurde von ursprünglich 2 Minuten auf 4 Minuten geändert und die Musikstruktur wurde erheblich optimiert. Die KI-Plattform zur Musikgenerierung ist Experte für auditive Kunst, die sich nur schwer mit Worten beschreiben lässt, und demonstriert ihr kreatives Potenzial, das über das des Menschen hinausgeht. Suno kündigte an, außerdem eine neue Funktion einzuführen, die es Benutzern ermöglicht, Songs mit jeder Stimme zu komponieren. Diese neue Funktion kann verschiedene Geräusche des täglichen Lebens in Musik umwandeln und eröffnet so neue Möglichkeiten für die Musikerstellung.
3. AI-Stack
Zu den Grundpfeilern gehören: Daten, Berechnungen und Modelle
Aus Hardware-Sicht bilden GPU, CPU und TPU die Grundlage des KI-Stacks. Das Wichtigste im generativen KI-Stack ist die GPU. Der KI-Stack umfasst jedoch auch ein KI-Softwaresystem, und der letztendlich aufgebaute KI-Stack ist ein System und Ökosystem.
Eine eingehende Analyse zeigt, dass der KI-Stack ein strukturiertes Framework ist, das verschiedene Schichten und Komponenten enthält, die für die Entwicklung und Bereitstellung von KI-Systemen erforderlich sind. Zu den Schlüsselkomponenten des KI-Stacks gehören Datenmanagement, Rechenressourcen, Frameworks für maschinelles Lernen und Plattformen für maschinelle Lernoperationen (MLOps). Der generative KI-Stack besteht aus drei Ebenen: oben, Mitte und unten. Die oberste Schicht umfasst Wissen und Fachwissen in bestimmten Bereichen, die mittlere Schicht stellt Daten und Infrastruktur bereit, die zum Erstellen von KI-Modellen verwendet werden können, und die unterste Schicht sind Cloud-Computing-Ressourcen und -Dienste. Fortschritte auf jeder Ebene sind für die Weiterentwicklung der KI von entscheidender Bedeutung. Zu den Grundpfeilern des KI-Stacks gehören: Daten, Berechnungen und Modelle. Unter anderem erfordert generative KI große Mengen an Rechenressourcen und große Datensätze, die in Hochleistungsrechenzentren verarbeitet und gespeichert werden. Generative KI fördert die Umgestaltung des gesamten Stapels.
Im Allgemeinen können auf der Grundlage des KI-Stacks Anwendungen für künstliche Intelligenz mit Funktionen wie schneller Suche, schneller Übersetzung, intelligenter Erkennung und intelligenter Steuerung erstellt werden.
4.Physikalischer Weltsimulator
Die dritte ist die physische KI-Welt: jenseits der menschlichen Raum-Zeit-Wahrnehmung
Für den heutigen Menschen gibt es drei Welten: die reale Erfahrungswelt, die virtuelle Welt und die physische Welt jenseits der menschlichen Wahrnehmung von Zeit und Raum. Künstliche Intelligenz beeinflusst direkt die Beziehung zwischen Menschen und den oben genannten drei Welten. In der realen Erfahrungswelt haben die Parallelität und Interaktion von künstlicher Intelligenz und natürlicher Intelligenz die Art und Weise verändert, wie die reale Welt existiert. In der virtuellen Welt können künstliche Intelligenz und virtuelle Realitätstechnologie den Menschen in einen unwirklichen Zustand immersiver Erfahrung führen Das Metaversum ist ein Weg; in der physischen Welt, die über die menschliche Wahrnehmung von Zeit und Raum hinausgeht, kann künstliche Intelligenz dem Menschen helfen, die Beschränkungen der Sinne zu durchbrechen und das Universum mit Dutzenden von Milliarden Lichtjahren als Maßstab und mikroskopischen Szenen zu verstehen Nanometer als Maßeinheit. Im Bereich wissenschaftlicher Experimente ist die Technologie der künstlichen Intelligenz nicht mehr nur ein Werkzeug, sondern eine Voraussetzung.
Die grundlegende Bedeutung von Soras Auftritt Anfang 2024 besteht darin, dass es durch seine eigene Simulationsfunktion für die physische Welt eine physische Welt zeigt, die Menschen möglicherweise nicht wahrnehmen, eine physische Welt, die wahrscheinlich realer ist als das, was menschliche Augen sehen können. Sobald Menschen die von der KI-Physik-Engine geschaffene Welt wahrnehmen und sich in sie integrieren, werden sie vielfältigere physikalische Regeln erfahren.
Wenn Sora Aufgaben zur Videogenerierung auf der Grundlage der Unterstützung von Wahrnehmungs-, Gedächtnis- und Kontrollmodulen ausführt, können die generierten Videos bis zu einem gewissen Grad den physikalischen Gesetzen der realen Welt folgen, wodurch es besser in der Lage ist, Menschen, Tiere, Umgebungen zu simulieren. usw. in der realen Welt realisiert im Wesentlichen räumliche Konsistenz, zeitliche Konsistenz und kausale Konsistenz. Sora ist ein lesbares Weltmodell. Wie gut es in diesem Stadium abschneidet, ist nicht der Kern des Problems. Nach der Veröffentlichung von Open-Sora 1.1 wurden Qualität und Dauer der Videogenerierung erheblich verbessert. Die optimierte Causal Video VAE-Architektur verbessert die Leistung und Inferenzeffizienz von Sora erheblich.
Einer der wichtigen Beiträge von NVIDIA ist die Fertigstellung des digitalen Zwillings-Erdmodells Earth-2. Earth-2 kombiniert das generative KI-Modell CorrDiff und wird auf der Grundlage der numerischen WRF-Simulation trainiert, die Wetterinformationen mit der 12-fachen Auflösung (von 25 Kilometern auf 2 Kilometer erhöht) genau vorhersagen kann. Der nächste Schritt für Earth-2 besteht darin, die Vorhersagegenauigkeit von 2 Kilometern auf mehrere zehn Meter zu verbessern. Die Auflösung ist höher, die Laufgeschwindigkeit ist 1000-mal höher als bei der physikalischen Simulation und die Energieeffizienz ist 3000-mal höher, was bedeutet, dass sie in Echtzeit vorhergesagt werden kann.
Die Vision ist sehr klar: Menschen konstruieren Wahrnehmungs-/Gedächtnis-/Kontrollkomplexe mit der Fähigkeit, realistische und physikalisch korrekte „Modelle der Welt“ zu konstruieren. In diesem Sinne hat der Microsoft-Wissenschaftler Sébastien Bubeck das Konzept und die Forschungsrichtung der „KI-Physik“ vorgeschlagen. Jensen Huang, CEO von NVIDIA, schlug außerdem vor, dass die nächste KI-Welle physische KI sein wird. Daher zielt Nvidias digitaler Zwilling nicht nur auf die Erde, sondern auf die gesamte physische Welt.
5. Verkörperte Intelligenz und intelligente Roboter
Die ultimative Anwendung: Künstliche Intelligenz zum „Menschen“ werden lassen
Die Entwicklung der künstlichen Intelligenz wird unweigerlich zur Bildung eines Ökosystems der künstlichen Intelligenz führen. Verkörperte künstliche Intelligenz (EAI) oder intelligente Roboter sind zum Hauptorgan des Ökosystems der künstlichen Intelligenz geworden.
Verkörperte Intelligenz ist eine weitere Erweiterung der künstlichen Intelligenz in der physischen Welt. Es handelt sich um ein intelligentes System, das die physische Welt verstehen, argumentieren und mit ihr interagieren kann Aktion. Darüber hinaus werden intelligente Roboter lernen, indem sie menschliche Denkpfade simulieren und Verhaltensrückmeldungen geben, die von Menschen erwartet werden. Angetrieben durch multimodale KI können sie selbst lernen, die Welt wahrnehmen, menschliche Anweisungen verstehen und ausführen sowie personalisierte Aufgaben und Anforderungen an die Zusammenarbeit erfüllen. Kontinuierliche Weiterentwicklung. Das bedeutet, dass eine Vielzahl von Aufgaben ausgeführt werden, die in einer realen physischen Umgebung überprüft und gemessen werden können. Kurz gesagt ist das Merkmal verkörperter Intelligenz die Fähigkeit, die physische Welt aus der Perspektive des Protagonisten autonom wahrzunehmen.
Bei verschiedenen Formen intelligenter Roboter handelt es sich um physische Formen verkörperter Intelligenz. Ihre Gesamtarchitektur besteht aus einer Wahrnehmungsschicht, einer Interaktionsschicht und einer Bewegungsschicht. Teslas humanoider Roboter „Optimus Prime“ hat sich von der ersten zur zweiten Generation weiterentwickelt, das amerikanische humanoide Roboter-Startup Figure AI erhielt im Februar dieses Jahres eine riesige Investition und NVIDIA stellte 25 humanoide Roboter auf der Global Technology Conference (GTC) 2024 aus. Alle zeigen die rasante Entwicklung auf dem Gebiet der humanoiden Roboter.
Im März 2024 brachte NVIDIA das weltweit erste universelle Basismodell eines humanoiden Roboters auf den Markt – Projekt GR00T. Der modellgesteuerte Roboter ist in der Lage, natürliche Sprache zu verstehen und Handlungen nachzuahmen, indem er menschliches Verhalten beobachtet, und Benutzer können ihm beibringen, schnell zu lernen, verschiedene Fähigkeiten zu koordinieren, um sich an die reale Welt anzupassen und mit ihr zu interagieren. Das Aufkommen des Projekts GR00T deutet darauf hin, dass möglicherweise das wahre Zeitalter der Roboter bevorsteht. Dies ist auch die ultimative Anwendung von KI: Künstliche Intelligenz zu einem „Menschen“ zu machen.
Der Aufstieg der verkörperten Intelligenz markiert den Wandel von der traditionellen steuerungsbasierten Robotiktechnologie zu einem neuen Paradigma des Lernens und Betriebs. Die Explosion der Großmodelltechnologie und die Reduzierung der Hardwarekosten haben zur Entstehung von Unternehmen mit verkörperter Intelligenz geführt, deren Ziel es ist, intelligente Roboter zu entwickeln, die mit der physischen Welt interagieren können.
Im Mai 2024 findet in Yokohama, Japan, die International Conference on Robotics and Automation (IEEE ICRA) statt, eine der einflussreichsten internationalen akademischen Konferenzen im Bereich Robotik. Das diesjährige Konferenzthema „CONNECT+“ zeigt nicht nur die neuesten Fortschritte in der Robotertechnologie, sondern auch eine Revolution in den Bereichen „verkörperte Intelligenz“ und „Lernen“. Auf lange Sicht ist die verkörperte Intelligenz von großer Bedeutung für die Entwicklung der Branche der künstlichen Intelligenz und hat einen nicht zu vernachlässigenden Wert für die künstliche allgemeine Intelligenz (AGI).
6. Räumliche Intelligenz
Es ist mehr als nur eine maschinelle Version des menschlichen Auges, es zeigt die Welt aus einem unvorstellbaren Blickwinkel
Es gibt zwei Arten räumlicher Intelligenz: Die eine ist räumliche Intelligenz, die durch natürliche Evolution entstanden ist. Es hat in der Natur Millionen von Jahren gedauert, bis der Mensch räumliche Intelligenz entwickelt hat. Die Augen erfassen Licht und projizieren 2D-Bilder auf die Netzhaut, und das Gehirn wandelt diese Daten in 3D-Informationen um. Die andere ist räumliche Intelligenz auf Basis der Technologie der künstlichen Intelligenz, bei der Maschinen komplexe visuelle Überlegungen und Handlungen des Menschen simulieren und die 3D-Welt durch visuelle Informationen mit Hilfe mehrerer Sensoren direkt verstehen und bedienen.
Beim Vergleich der durch die natürliche Evolution entstandenen räumlichen Intelligenz und der auf der Technologie der künstlichen Intelligenz basierenden räumlichen Intelligenz ist der Unterschied erheblich: Die durch die natürliche Evolution entstandene räumliche Intelligenz ist in der räumlichen Dimension begrenzt und es ist schwierig oder sogar unmöglich, den 3D-Raum zu durchbrechen . Allerdings kann räumliche Intelligenz auf Basis der Technologie der künstlichen Intelligenz die räumliche Dimension durchbrechen. Ein solcher Raum sprengt geografische Grenzen und befindet sich in einem fließenden, grenzenlosen, freien und offenen Zustand. Darüber hinaus unterliegt ein solcher Raum nicht mehr den Zeitbeschränkungen von Newton, wodurch Aktualität und Zeitoptimierung erreicht werden. Beispielsweise haben Google-Forscher einen Algorithmus entwickelt, der Daten anhand nur einer Reihe von Fotos in 3D-Formen oder Szenen umwandeln kann.
In diesem Zusammenhang hat Li Feifei, Direktor des Human-Centered AI Research Institute an der Stanford University (Akademiker der National Academy of Engineering), die folgenden tiefgreifenden Gedanken: „Die Kombination von Sehschärfe mit der Tiefe enzyklopädischen Wissens kann eine Marke entstehen lassen.“ Es ist noch nicht bekannt, was die neuen Fähigkeiten sein werden, aber ich glaube, dass es mehr als nur eine maschinelle Version des menschlichen Auges sein wird. Es wird eine neue Art von Existenz sein, eine tiefere und verfeinerte Perspektive. „Das heißt, die auf künstlicher Intelligenz basierende räumliche Intelligenz wird die durch die natürliche Evolution entstandene räumliche Intelligenz durchbrechen und einen räumlichen Zustand offenbaren, auf den sich der Mensch nicht verlassen kann.“ vorstellen. Beispielsweise bezieht sich der durch die Quantenmechanik beschriebene Quantenraum auf einen Raum mit topologischen Eigenschaften, der aus einigen diskreten oder kontinuierlichen Zuständen besteht. Es ist für die räumliche Intelligenz, die der Mensch auf natürliche Weise entwickelt hat, unmöglich, den Quantenraum wahrzunehmen und zu erkennen, aber es ist möglich für räumliche Intelligenz, die durch Technologie der künstlichen Intelligenz unterstützt wird.
Kurz gesagt, räumliche Intelligenz, die auf großen Modellen künstlicher Intelligenz basiert, führt den Menschen in „eine völlig neue Existenz“, und verkörperte Intelligenz dürfte hier der „Ureinwohner“ sein.
7. Tiefgreifende Entwicklung der künstlichen Intelligenz
Das Mooresche Gesetz kann gebrochen werden, Metakognition führt zum Scheitern des Skalierungsgesetzes
Künstliche Intelligenz befindet sich in einem historischen Moment tiefgreifender Entwicklung. Das Mooresche Gesetz und das Skalierungsgesetz spielen nach und nach eine immer wichtigere Rolle.
Das Mooresche Gesetz ist eine von Intel-Mitbegründer Gordon Moore auf Erfahrungsbasis zusammengefasste Regel, die besagt, dass sich die Anzahl der Transistoren, die auf einem integrierten Schaltkreis untergebracht werden können, etwa alle 18 bis 24 Monate verdoppelt. Mit anderen Worten: Die Prozessorleistung verdoppelt sich etwa alle zwei Jahre. Das Problem ist, dass es zu einer Krise nach dem Mooreschen Gesetz kam, als die Chips auf 28 Nanometer (nm) anwuchsen. Wenn der Chip in den 1-Nanometer-Prozesschip eintritt, bedeutet dies, dass die Grenze des Mooreschen Gesetzes erreicht wird. Jetzt steht die gesamte Hardware-Grundlage der künstlichen Intelligenz mit Chips als Kern vor einer Mooreschen Gesetz-Krise oder einer Mooreschen Gesetz-Grenze. Im Juni 2024 kündigte Nvidia-CEO Jen-Hsun Huang auf der Taipei International Computer Show 2024 (Computex 2024) an, dass sich die Aktualisierungshäufigkeit seiner GPU-Architektur von alle zwei Jahre auf einmal im Jahr beschleunigen wird, das Wachstum der Rechenleistung jedoch nicht stagnierte, und seine KI Die Rechenleistung von Chips hat sich in den letzten acht Jahren erstaunlich vertausendfacht, was zeigt, dass es eine technologische Möglichkeit gibt, die Krise des Mooreschen Gesetzes und die Grenzen des Mooreschen Gesetzes zu durchbrechen.
Das Skalierungsgesetz umfasst hauptsächlich die Untersuchung kritischer Phänomene. Seine Kernidee besteht darin, dass sich die Leistung des Modells verbessert, wenn die Größe der Modellparameter, die Größe des Datensatzes und die Anzahl der für das Training verwendeten Gleitkommaberechnungen zunehmen . Für eine optimale Leistung müssen die oben genannten drei Faktoren gleichzeitig verstärkt werden. Wenn die Modellleistung nicht durch die beiden anderen Faktoren eingeschränkt wird, besteht eine Potenzgesetzbeziehung mit jedem einzelnen Faktor.
Speziell im Bereich der künstlichen Intelligenz kann die Leistungsvorhersage von GPT-4 bei bestimmten Problemen durch ein Modell vorhergesagt werden, das 1.000-mal kleiner als GPT-4 ist. Mit anderen Worten: GPT-4 hat noch nicht mit dem Training begonnen und seine Leistung bei diesem Problem ist bereits bekannt. Daher sind Skalierungsgesetze für das Training großer Modelle wichtig. Man kann sagen, dass das Skalierungsgesetz ein weiteres potenzielles Gesetz für die tiefgreifende Entwicklung der künstlichen Intelligenz ist.
Vor nicht allzu langer Zeit äußerte Bill Gates in einer Folge des Podcasts „The Next Big Idea“ eine tiefgreifende Meinung zum Gesetz der Skalierung: „Das Gesetz der Skalierung wird definitiv weiterhin gültig bleiben. Aber gleichzeitig wird es nach dem, was wir heute wissen, auch weiterhin gelten.“ ein Übergang von einfachen Algorithmen zu eher menschenähnlichen metakognitiven Handlungen sein, was eine größere Grenze darstellt, „weil Bewusstsein möglicherweise mit Metakognition zusammenhängt und Metakognition kein messbares Phänomen ist.“ Mit anderen Worten: Metakognition führt dazu, dass das Skalierungsgesetz versagt.
8. Kurz- und mittelfristige Trends
Die allgemeine KI-Stufe beschleunigt sich und die „Morgendämmerung“ der Super-KI ist angebrochen
Ausgehend vom Zeitpunkt des Jahres 2024 können wir allgemein die kurz- und mittelfristigen Trends der künstlichen Intelligenz erkennen:
(1) Die Phase der künstlichen Narrow Intelligence (ANI) geht zu Ende. Künstliche Intelligenz ist in diesem Stadium ein KI-System, das bestimmte Aufgaben ausführen kann, beispielsweise Bilderkennung oder Spracherkennung. Der Höhepunkt dieser Phase ist das Aufkommen großer Modelle, die generative künstliche Intelligenz und die Popularisierung intelligenter Maschinen unterstützen.
(2) Das Stadium der allgemeinen künstlichen Intelligenz beschleunigt sich.
(3) Der „Anbruch“ der Künstlichen Superintelligenz (ASI) zeichnet sich ab. Superkünstliche Intelligenz hat die Fähigkeit, den „menschlichen Geist“ zu übertreffen, die kollektive Intelligenz der gesamten Menschheit einzuholen und schnell zu übertreffen, und ist ein künstliches Intelligenzsystem, das leistungsfähiger ist als die menschliche Intelligenz.
Künstliche Intelligenz befindet sich bereits in einer historischen Phase, in der die Fantasie der Menschen jeden Tag aufs Neue erfrischt wird. In dieser Zeit werden sich die Subjekte und Referenzsysteme der Welt bisher verändern, das Wissenssystem wird rekonstruiert, menschliche Intelligenz und künstliche Intelligenz werden beginnen, in einen Zustand der „Ko-Intelligenz“ einzutreten, und traditionelle Wirtschaftsorganisationen, nationale Systeme und Rechtssysteme Es wird auch Veränderungen geben und die menschliche Zivilisation wird sich in Zukunft sogar neu organisieren.
Zhu Jiaming
6. Juli 2024
(Titel und Untertitel im Originalvorwort wurden vom Herausgeber ergänzt und verfeinert)
Autor: Zhu Jiaming
Text: Zhu Jiaming Bilder: Zhu Meiquan Herausgeber: Li Nian Herausgeber: Li Nian
Bitte geben Sie beim Nachdruck dieses Artikels die Quelle an.
Bericht/Feedback