Nachricht

Ein Besuch in Pekings neuer Produktivität. Raus aus dem Labor. Unsichtbares großes Modell, sichtbare Produktivität

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Im Jahr 2017 wurde künstliche Intelligenz erstmals in den Arbeitsbericht der chinesischen Regierung aufgenommen und zu einer nationalen Strategie. Im Jahr 2018 wurde das Beijing Zhiyuan Artificial Intelligence Research Institute (im Folgenden als „Zhiyuan“ bezeichnet) in einem kleinen Büro an der Spitze gegründet Innovationsraum. Zu diesem Zeitpunkt hatte das von OpenAI eingeführte GPT-Modell der ersten Generation noch nicht die Schlagzeilen der Medien erobert.

Im Jahr 2023 rüstete Zhiyuan das erste ultragroße intelligente Modell meines Landes „Wudao“ auf 3.0 auf und wurde nach Ansicht von Microsoft-Präsident Brad Smith zu einer der drei modernsten KI-Institutionen der Welt. Im Bereich Großmodelle ist Zhiyuan die einzige nicht-unternehmerische Forschungseinrichtung der Welt, die nicht von einem großen Hersteller unterstützt wird. Es ist auch die erste neue Forschungseinrichtung in China, die systematisch Forschung und Entwicklung im Bereich Großmodelltechnologie betreibt Quellenökologisches Bauen, Talentausbildung und Unternehmensaufbau.

„Gleichberechtigung in Wissenschaft und Technologie hat in der Vergangenheit immer zu großen industriellen Chancen geführt.“ Wang Zhongyuan, der neue Präsident von Zhiyuan, der sowohl über Unternehmenserfahrung als auch über einen Hintergrund in Forschungseinrichtungen verfügt, verfügt über ein tieferes Verständnis für technologieorientierte Industrien . Auch die Definition von Künstlicher Intelligenz im Land ist konkreter: Künstliche Intelligenz ist ein wichtiger Motor für die Entwicklung neuer Produktivkräfte.


Arbeiten Sie hart, um dem Sturm immer einen Schritt voraus zu sein

Ein- oder zweimal war Yang Zhilin, CEO von Dark Side of the Moon, auf der Zhiyuan-Konferenz 2024 in Peking mindestens dreimal von Teilnehmern umgeben. Als OpenAI-Gründer Sam Altman vor einem Jahr eine Videorede auf der Zhiyuan-Konferenz hielt, war die Unruhe ebenso offensichtlich. .

Von 2023 bis 2024 werden sich KI-Wissenschaftler, CEOs großer Technologieunternehmen und Gründer von Star-Start-ups an verschiedenen Orten versammeln, um über große Modelle zu predigen. Ob sie nun technische Experten sind oder nicht, jeder auf der Bühne hat mehr oder weniger davon gehört Viele von ihnen waren damals direkt an Zhiyuans großen Modellforschungsprojekten beteiligt. Wang Haifeng, CTO von Baidu, war einst Direktor von Zhiyuan, Tang Jie, Gründer von Zhipu AI, fungierte als Vizepräsident von Zhiyuan und Yang Zhilin war an der Forschung und Entwicklung von Wu Dao beteiligt.

Diese KI-Trendsetter haben sich erst jetzt mit Zhiyuan beschäftigt, und Zhiyuan hat sich nicht erst mit großen Modellen beschäftigt, als diese populär wurden.

Im Jahr 2019 begann Zhiyuan mit der Entwicklung großer Modelle. Im Jahr 2020 gründete das Unternehmen ein Wudao-Forschungsteam und startete die Forschung und Entwicklung großer Modelle. Im März 2021 wurde das große Modell Wu Dao 1.0 erstmals auf den Markt gebracht, und im Juni stellte Wu Dao 2.0 den Rekord für das damals „größte“ große Modell der Welt auf großes Modell GPT-3 damals 10-mal so viele Parameter.

Die wissenschaftliche Forschung widmet sich der Somatosensorik, dem Stellen von Fragen und dem Fällen von Urteilen. Das Urteil, dass „die Ära der großen Modelle der künstlichen Intelligenz naht“, gab Zhiyuan uneingeschränkten Mut. Sogar der chinesische Begriff „großes Modell“ wurde zuerst von Zhiyuan vorgeschlagen.

Was ist ein großes Modell? Huang Tiejun, Vorsitzender des Zhiyuan-Forschungsinstituts, ist der Ansicht, dass drei Bedingungen erfüllt sein müssen: groß angelegt, mit Parametern von mehr als zehn Milliarden, in der Lage, unerwartete neue Fähigkeiten hervorzubringen, die nicht auf spezielle Probleme oder Bereiche beschränkt sind; Viele verschiedene Aufgaben.

Im Jahr 2023 werden große Modelle in den Blickpunkt der Öffentlichkeit treten. Die Modelle der Wudao-Serie wurden auf Version 3.0 aktualisiert, die grundlegende große Modelle wie Sprache, Vision und Multimodalität abdeckt und vollständig Open Source ist. In der damaligen Diskussion über Basismodelle an der Stanford University wurde Intelligent Source neben Technologiegiganten wie Google, Microsoft und Facebook (heute Meta) eingestuft und entwickelte sich zur weltweit repräsentativen Institution für große Modellforschung.

„Die Entstehung der meisten Forschungsergebnisse in der Geschichte war zufällig und niemand konnte sie planen. Alle Bemühungen zielen darauf ab, die Wahrscheinlichkeit zu erhöhen – herausragende Forscher zusammenzubringen und ihnen ein Gemeinschaftsumfeld zu bieten, in dem sie Ideen kollidieren, Probleme entdecken usw Finden Sie Kooperationspartner. „Das von Zhang Hongjiang, Gründungsvorsitzender des Zhiyuan Research Institute, verfasste Vorwort zur Autobiografie des Turing-Preisträgers Yann LeCun ist eher der Grund, warum Zhiyuan an erster Stelle stand.

Machen Sie System-Engineering

Anfang 2018 erließ Peking die „Beijing Implementation Measures for Supporting the Construction of World-Class New R&D Institutions“, um eine sprunghafte Reform des Wissenschafts- und Technologiesystems durchzuführen. Im Dezember wurde Zhiyuan mit der Anleitung und Unterstützung des Ministeriums für Wissenschaft und Technologie sowie des Parteikomitees und der Regierung der Stadt Peking offiziell gegründet.

Bisher war der Prozess des wissenschaftlichen Forschungsmanagements komplex, mit langen Zyklen vom Projektvorschlag über die Freigabe des Leitfadens bis hin zur Beantragung und Prüfung der Finanzierung, was es schwierig machte, sich in einem hart umkämpften Umfeld an die sich ständig ändernden wissenschaftlichen Forschungsanforderungen anzupassen. Nach diesem System legt die Forschungseinrichtung Projektvorschläge im Oktober 2020 vor und eine groß angelegte Modellforschung kann frühestens 2022 offiziell gestartet werden. Das Zhiyuan-Modell benötigte von der Projektgründung bis zur Markteinführung großer Modelle weniger als fünf Monate.

Hierbei handelt es sich um eine neuartige Forschungs- und Entwicklungseinrichtung zwischen Universitäten und Unternehmen. Xin Zai verwendet weder Papiere als endgültigen Bewertungsindex noch Produkte als Bewertungsindex, sondern bringt Wissenschaftler aus verschiedenen Institutionen und Unternehmen wie der Tsinghua-Universität, der Peking-Universität und dem Facebook Artificial Intelligence Laboratory zusammen. Baidu usw. Große Dinge; das Neue besteht darin, große Probleme anzugehen, ein scharfes Auge auf wichtige wissenschaftliche Fragen zu haben und zukunftsorientierte Pläne zu schmieden.

„Das Universitätsmodell gibt es schon seit Jahrzehnten, und es ist schwierig, systematische Forschung und Entwicklung organisiert, groß angelegt und teamübergreifend durchzuführen. Unternehmen werden auch in Forschung und Entwicklung investieren, aber sie neigen eher zu Forschung und Entwicklung, die eng miteinander verknüpft ist.“ „Zhiyuan wird 3 bis 5 Jahre lang ein Forschungsprojekt durchführen, um Ergebnisse zu sehen“, sagte Wang Zhongyuan in einem exklusiven Interview mit einem Reporter von Beijing Business Daily.

Zhiyuans Vertrauen beruht derzeit noch auf der Entschlossenheit des Landes im Bereich der künstlichen Intelligenz. Im März 2024 stellte Li Qiang, Mitglied des Ständigen Ausschusses des Politbüros des Zentralkomitees der KP Chinas und Ministerpräsident des Staatsrates, bei einer Untersuchung in Peking klar: Künstliche Intelligenz ist ein wichtiger Motor für die Entwicklung neuer Produktivkräfte .

Neue Produktivität ist ein fortgeschrittener Produktivitätszustand, in dem Innovation eine führende Rolle spielt, sich vom traditionellen Wirtschaftswachstumsmodus und Produktivitätsentwicklungspfad löst, die Merkmale von Hochtechnologie, hoher Effizienz und hoher Qualität aufweist und dem neuen Entwicklungskonzept entspricht. Es entstand aus revolutionären technologischen Durchbrüchen, einer innovativen Zuordnung von Produktionsfaktoren und einer tiefgreifenden industriellen Transformation und Modernisierung. „Gleichberechtigung in Wissenschaft und Technologie hat in der Vergangenheit jedes Mal große industrielle Chancen geschaffen, und große Modelle können neue Gleichberechtigung in Wissenschaft und Technologie bringen“, ist Wang Zhongyuan fest davon überzeugt.

Beispielsweise sind große Modelle Träger von „Intelligenz“, die Welle, die sich auf KI konzentriert, sind Geheimdienstoperationen, die unterste Schicht sind technische Software- und Hardwaresysteme, die oberste Schicht sind KI-Anwendungen und große Modelle liegen in der Mitte der beiden. die Rolle des „Stamms“ spielen. Die Bedeutung des großen Modells besteht darin, „Intelligenz“ in öffentliche Dienste wie Wasser, Strom und Internet umzuwandeln und über Cloud Computing KI-Dienste für eine große Anzahl von Unternehmen oder Einzelpersonen bereitzustellen.

Dies ist ein systematisches Projekt. „Es erfordert eine konzentrierte Investition von Ressourcen und Arbeitskräften. Es kann nicht von vielen Menschen durchgeführt werden, sondern es muss ein technisches System geschaffen werden: „Die Entwicklung künstlicher Intelligenz ist.“ „Ein kompletter Satz technischer Systeme ist erforderlich, um die Produktion von hochwertigem Stahl und eine stabile Stromerzeugung zu relativ niedrigen Kosten sicherzustellen“, sagte Huang Tiejun.

Gehen Sie über die Branche hinaus

Das von Zhiyuan entwickelte technische System umfasst: einen großen Modellfamilien-Bucket, ein großes Modell-Betriebssystem, einen Datensatz, ein Schulungs-Framework, eine Bedienerbibliothek usw. Diese Erfolge sowie Chi Yuans Vision und Ziele hängen an der Wand im ersten Stock des Chi Yuan-Gebäudes.

Die Vision und Ziele sind in fünf Hauptabschnitte unterteilt, darunter Mechanismen und industrielle Entwicklung, die als Innovation zusammengefasst werden können. „Zhiyuan möchte die modernste Technologie für künstliche Intelligenz entwickeln, die Entwicklung künstlicher Intelligenz anführen und vorhersagen und über die Industrie hinausgehen.“ Wang Zhongyuan erklärte ausführlich: „Zhiyuan wird Dinge tun, die Universitäten nicht tun können und die Unternehmen nicht bereit sind.“ Forschung und Entwicklung, Forschungsprojekte, die 3 bis 5 Jahre oder sogar länger dauern, bis Ergebnisse sichtbar sind.

Seiner Ansicht nach wird es zwei Hauptrichtungen geben, wenn die technischen Fähigkeiten großer Modelle ein bestimmtes Niveau erreichen: „Eine Richtung besteht darin, sich in Produkte zu integrieren, Anwendungen zu fördern und einen kommerziellen Wert auszuüben. Auf der anderen Seite gibt es eine kleine Anzahl.“ von Institutionen, die sich weiterhin mit der Iteration und Optimierung der Top-Großmodelle befassen, ob Unternehmen oder Forschungseinrichtungen, sie sollten sich weiterhin mit Schlüsseltechnologien befassen.

Im Multimodalitätsbereich beispielsweise entscheiden sich die meisten inländischen Unternehmen für die DiT-Architektur für Forschung und Entwicklung. „Das liegt daran, dass DiT ein bewährter Weg ist. Zhiyuan hofft, verschiedene Informationsmodalitäten wie Text, Bilder, Videos und Stimmen in einem Modell für das Training zusammenzuführen. Wang Zhongyuan nutzte von Anfang an die Analogie des menschlichen Gehirns.“ „Diese Art von multimodalem Großmodell kann die Welt sehen, verstehen und begründen. In Zukunft können große Modelle in Kombination mit Hardware, also verkörperter Intelligenz, in die physische Welt eindringen, um den Menschen zu dienen.“

Unternehmen bleiben nah am Markt und suchen nach Aufwärtsszenarien, während sich Forschungs- und Entwicklungseinrichtungen auf Durchbrüche in der Kerntechnologie konzentrieren und Abwärtsunterstützung bieten. Wisdom Source gehört zum zweiten Typ, der weit von Anwendungen und Szenarien entfernt ist, aber Open Source als Grundlage verwendet die Branche.

„Künstliche Intelligenz ist nicht gleichbedeutend mit großen Modellen, sie ist nur ein Genre der künstlichen Intelligenz“, erklärte Wang Zhongyuan einem Reporter der Beijing Business Daily. Die heutige Intelligent Source setzt auch auf andere Technologien der künstlichen Intelligenz wie gehirnähnliche Forschung und digitales Herz, was bedeutet, dass der Fantasie der künstlichen Intelligenz in anderen Branchen keine Grenzen gesetzt sind.

Beijing Business Daily-Reporter Wei Wei