Nachricht

Aktuelles Interview mit DeepMind-Gründer: AGI wird innerhalb von zehn Jahren eintreffen und das medizinische Energieklima neu gestalten

2024-08-19

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Tao Le stammt aus dem Aofei-Tempel

Qubits |. Öffentliches Konto QbitAI

Wann wird AGI implementiert? GoogleDeepMind CEO Hassabis sagte im jüngsten Interview voraus:

zehn Jahre.

WennAGIEs würde mich nicht wundern, wenn es innerhalb des nächsten Jahrzehnts herauskäme.

In diesem Interview sprach Hassabis über die Entwicklungstrends der KI.

Es gibt einige Themen, die jeden interessieren, wie zum Beispiel:

KI mag kurzfristig überbewertet werden, ihr Potenzial und ihre Auswirkungen bleiben jedoch langfristig unterschätzt.

Als „Superteam“ von Google muss Google DeepMind ein Gleichgewicht zwischen kommerziellen Interessen und wissenschaftlicher Forschung finden.

Open Source ist wichtig für den technologischen Fortschritt, aber wenn Sie auf eine Technologie stoßen, die möglicherweise missbraucht wird, möchten Sie möglicherweise ein Jahr warten, bevor Sie sie als Open Source bereitstellen, um den Missbrauch zu bewerten und einzuschränken.

Spezifischere Inhalte finden Sie in der Textversion unten~

Das „Implementierungsproblem“ der frühen KI

Q: Zum heutigen Interview habe ich Hassabis eingeladen, den Mitbegründer von DeepMind und den aktuellen CEO von Google DeepMind.

Hassabis: Vielen Dank, ich freue mich sehr, an Ihrem Interview teilnehmen zu dürfen. Zuvor haben wir untersucht, wie Konzepte und Sprache in der realen Welt verwendet werden können, beispielsweise in simulierten Umgebungen oder als Roboter mit tatsächlicher Intelligenz, die möglicherweise erforderlich ist, um die Welt um uns herum zu verstehen.

Es muss jedoch anerkannt werden, dass diese Systeme noch nicht auf diesem idealen Niveau sind, viele Fehler machen und kein wirklich vollständiges Modell der Welt bilden. Dennoch haben sie allein durch das Erlernen der Sprache weit über unsere Erwartungen hinaus Fortschritte gemacht.

Q: Ja, wir haben letztes Mal viel darüber diskutiert, wie man Sprache in der realen Welt umsetzt. Aber können Sie kurz erklären, was „Landung“ bedeutet? Nur für den Fall, dass Freunde, die unser Interview zum ersten Mal sehen, es nicht verstehen.

Hassabis"Landung"Dieses Konzept,Entstanden aus klassischen KI-Systemen, die in den 1980er und 1990er Jahren in akademischen Einrichtungen wie dem MIT gebaut wurden.Bei den meisten dieser Systeme handelt es sich um riesige logische Systeme, die man sich als riesige Datenbanken vorstellen kann, die viele miteinander verbundene Wörter enthalten.

Das Problem besteht jedoch darin, dass Sie zwar Aussagen wie „Hunde haben vier Beine“ in der Datenbank finden, das System jedoch, wenn es mit einem Foto eines echten Hundes konfrontiert wird, diese Pixel nicht mit den Symbolen in der Datenbank verknüpfen kann. , das ist das sogenannte „Landeproblem“.

Mit anderen Worten: Das System verfügt über symbolische oder abstrakte Darstellungen, kann aber die konkrete Bedeutung dieser Darstellungen in der realen Welt nicht verstehen. Obwohl die Menschen seitdem versucht haben, dieses Problem zu lösen, ist es ihnen nie gelungen, Perfektion zu erreichen.

Anders als Systeme der Vergangenheit lernen heutige KI-Systeme direkt aus Daten und stellen von Anfang an Verbindungen zwischen den Daten und der realen Welt her.

Selbst wenn diese Systeme zunächst nur auf der Grundlage von Sprache lernen, sollten ihnen interessanterweise theoretisch viele Informationen fehlen, die für den „Start“ erforderlich sind, da sie nicht mit realen Simulatoren, Robotern oder anderen Eingabeformen verbunden sind, sondern nur Es ist Lernen im Sprachraum.

Überraschenderweise sind diese Systeme jedoch immer noch in der Lage, Erkenntnisse über die reale Welt zu gewinnen.

Q: Dies kann daran liegen, dass Menschen bei der Interaktion mit dem System dem System mitteilen, welche Antworten richtig und welche falsch sind. Durch diese Rückmeldung kann das System einen Teil der „Lande“-Informationen erhalten und so nach und nach eine Verbindung zur realen Welt herstellen.

Hassabis: Wenn das System in früheren Versionen aufgrund fehlender „Lande“-Informationen falsche Antworten gegeben hat, beispielsweise eine falsche Antwort auf eine Frage wie „Wie bellt ein Hund?“, würde das Feedback der Leute dies tatsächlich korrigieren.

Dieses Feedback basiert auf unserem eigenen „umgesetzten“ Wissen, also gewissermaßenDas System nimmt die Informationen aus diesem Feedback auf und lernt sie.

Kurzfristig gehyped, langfristig unterschätzt

Q: Darüber hinaus möchte ich Sie auch zum Hype um KI befragen. Denken Sie, dass unsere aktuelle Situation, die aktuelle Situation, unterbewertet oder überbewertet wird?

Hassabis: Ich denke, es ist eher Letzteres. Ich möchte sagen,Kurzfristig ist der Hype zu weit gegangen.

Ich denke, die Leute sagen, dass KI alles Mögliche kann, aber in Wirklichkeit ist sie nicht so mächtig, wie die Leute sagen. Es gibt viele Startups und VCs, die unrealistischen Ideen nachjagen, die noch nicht sehr ausgereift sind.

Aber andererseits denke ich, dass es auch jetzt noch unterbewertet ist oder ihm nicht genügend Aufmerksamkeit geschenkt wird. Besonders wenn wir uns der AGI- und Post-AGI-Phase nähern, habe ich immer noch das Gefühl, dass die Leute nicht ganz verstehen, was für eine große Veränderung das sein wird und welche Verantwortlichkeiten damit einhergehen.

Also,Ich denke, dass es kurzfristig überbewertet, aber langfristig unterbewertet ist.

Vom multimodalen Zwilling zum universellen KI-Agenten Astra

Q: Okay, jetzt möchte ich in diesem Interview eine wichtigere Frage stellen. Was ist Ihrer Meinung nach der Unterschied zwischen Gemini und großen Sprachmodellen, die von anderen Labors veröffentlicht wurden?

Hassabis: Wir haben uns von Anfang an das Ziel des Gemini-Projekts gesetzt, es in die Lage zu versetzen, mehrere Arten von Daten gleichzeitig zu verarbeiten. Wir hoffen, dass es nicht nur Text verstehen, sondern auch Töne, Videos, Bilder, Code usw., im Grunde alle Arten von Informationen, analysieren kann.

Wir sind der festen Überzeugung, dass Systeme nur dann die Welt wirklich verstehen und ein genaueres und umfassenderes Weltmodell erstellen können, wenn sie es Systemen ermöglichen, verschiedene Informationen in der realen Welt zu verstehen und zu verarbeiten.

Dies ist eigentlich eine Erweiterung des oben erwähnten „Lande“-Problems, aber dieses Mal verwenden wir die Sprache als Grundlage, um dies zu erreichen.

Q: Also ist „Umsetzung“ immer noch der Schlüssel zum gesamten Projekt?

Hassabis: Tatsächlich ist das entscheidend.

Wir haben auch ein ultimatives Ziel, nämlichSchaffen Sie einen Allround-Assistenten. Wir haben ein Tool namens entwickeltAstroAls Projektprototyp versteht Astro nicht nur Ihre Eingaben, sondern spürt auch den Kontext Ihrer Umgebung.

Stellen Sie sich vor, wie viel leistungsfähiger Ihr persönlicher Assistent oder digitaler Assistent wäre, wenn er den Kontext Ihrer Frage oder die Situation, in der Sie sich befinden, besser verstehen würde. Daher sind wir stets davon überzeugt, dass diese Art von System praktischer sein wird.

Dazu haben wir von Beginn des Projekts an multimodale Funktionalität in das System eingebaut. Zu dieser Zeit war dies das einzige Modell mit dieser Funktion, und jetzt versuchen andere Modelle, aufzuholen.

QProject Astro ist ein aufstrebender Allzweck-KI-Agent, der Video- und Audiodaten verarbeiten kann.Ich erinnere mich, dass Sie auf der Google I/O-Konferenz ein Beispiel dafür gezeigt haben, wie Astro Benutzern dabei hilft, sich daran zu erinnern, wo sich ihre Brille befindet. Ich interessiere mich für die Ursprünge dieser Technologie. Ist es nur eine Weiterentwicklung des alten Google Glass?

Hassabis: Google hat eine lange Geschichte in der Entwicklung brillenbasierter Geräte und war bereits etwa 2012 beteiligt. Daher verfügen sie in diesem Bereich über einen erheblichen First-Mover-Vorteil. Möglicherweise fehlte die nötige Technologie, damit der intelligente Assistent verstehen konnte, was er sah. Aber jetzt,Mit diesem digitalen Assistenten an Ihrer Seite kann er die Welt um Sie herum verstehen, es fühlt sich sehr natürlich an.

Q: Ich möchte die Ursprünge von Gemini zurückverfolgen, weil es aus zwei separaten Abteilungen innerhalb der Organisation stammt und von ihnen gemacht wurde?

Hassabis: Tatsächlich haben wir letztes Jahr Alphabet eingeführt(Google-Muttergesellschaft)Die beiden Forschungsabteilungen des OriginalsDeepMindUndGoogle Brain, zusammengelegt in einer neuen Abteilung, wie wir es nennen„Super-Abteilung“

Auf diese Weise bündeln wir alle Top-Talente des Unternehmens in einem Team und bündeln das beste Wissen aus allen Forschungsbereichen, insbesondere im Bereich Sprachmodelle.

Wir hatten einige frühere Projekte wie Trin Chilla und Gopher, die alle an der Entwicklung früher Sprachmodelle wie Palm und Lambda beteiligt waren. Jedes dieser Modelle hat seine eigenen Stärken und Schwächen, und wir haben sie in das Gemini-Projekt integriert, das das erste sehr wichtige Projekt nach der Fusion ist.

Darüber hinaus gibt es noch einen weiteren besonders wichtigen Punkt: WirIntegrieren Sie alle Computerressourcen. Auf diese Weise können wir große Trainingsläufe durchführen, bei denen tatsächlich die gesamte Rechenleistung zusammenkommt.Machen Sie Zwillinge leistungsfähiger und effizienter

Diese beiden Teams haben sich schon immer auf die Spitze der KI konzentriert. Sie haben bereits viel in der persönlichen Forschung zusammengearbeitet, sind sich aber strategisch möglicherweise nicht so nahe. Nun, das vereinte Team würde ich als das von Google bezeichnen„Maschinenraum“

Ich denke, die Arbeitsmethoden der beiden Teams sind eigentlich recht ähnlich, es gibt keine großen Unterschiede. Als nächstes werden wir unsere Vorteile in der Grundlagenforschung weiter stärken, beispielsweise über das nächste nachdenkenTransformatorWie die Architektur aussehen wird, wollen wir alle selbst herausfinden.

Apropos: Der vorherige Transformer wurde von Google Brain erstellt und wir haben ihn mit Deep Reinforcement Learning kombiniert, aber ich denke, dass weitere Innovationen erforderlich sind. Ich glaube, dass wir, genau wie in den letzten 10 Jahren, weiterhin einen Beitrag leisten werden, egal ob Brain oder DeepMind.

Googles „Maschinenraum“

Q: Sie haben gerade gesagt, dass Google DeepMind jetzt der „Maschinenraum“ von Google ist. Ich möchte wissen, ob Google jetzt stark auf Sie setzt?

Hassabis: Ich glaube schon. Ich denke, Google war sich immer der Bedeutung von KI bewusst. Pichai sagte, als er zum ersten Mal CEO wurde:Google ist ein „AI-first“-Unternehmen

Wir haben dieses Thema bei seinem Amtsantritt besprochen. Er sah das Potenzial der KI als den nächsten großen Paradigmenwechsel nach dem mobilen Internet, und ihre Auswirkungen waren noch tiefgreifender.

Aber ich denke, in den letzten ein oder zwei Jahren haben wir begonnen, wirklich zu verstehen, was das bedeutet, nicht nur aus Forschungsperspektive, sondern auch im Hinblick auf ein Produkt und alles andere. Es ist also eine sehr aufregende Zeit, aber ich denke, es ist die richtige Entscheidung für uns, alle Talente zusammenzubringen und alles zu geben.

Q: Bedeutet das für DeepMind, das nun zum „Maschinenraum“ von Google wird, aus einer anderen Perspektive, dass man mehr Balance zwischen der Berücksichtigung kommerzieller Interessen und reiner wissenschaftlicher Forschung finden muss?

Hassabis: Tatsächlich müssen wir jetzt stärker auf geschäftliche Interessen Rücksicht nehmen, was zu unserer Verantwortung geworden ist. Allerdings gibt es noch einige Punkte, die geklärt werden müssen. Wir werden unsere wissenschaftliche Forschungsarbeit weiter vorantreiben und unsere Investitionen in diesem Bereich steigen weiter.

Ich finde,Das ist etwas Einzigartiges, was wir bei Google DeepMind tunSelbst unsere Konkurrenten betrachten diese Ergebnisse als weitreichende Vorteile der KI.

„Open Source“ ist notwendig

Q: Okay, das bringt mich zu meiner nächsten Frage: Open Source. Wenn Technologie in die Hände der Massen gelangt, können, wie Sie sagten, einige ziemlich erstaunliche Dinge passieren. Ich weiß, dass DeepMind in der Vergangenheit viele Forschungsprojekte als Open Source bereitgestellt hat, aber das scheint sich jetzt geändert zu haben. Können Sie uns etwas über Ihre Ansichten zu Open Source sagen?

HassabisOpen Source ist notwendig und wir waren schon immer ein starker Befürworter von Open Source und Open Science.Wie Sie wissen, veröffentlichen wir fast jedes Forschungsprojekt, das wir durchführen, einschließlich Projekten wie Transformer undAlphaGoWir haben Projekte wie dieses in Top-Magazinen wie Nature und Science veröffentlicht.

AlphaFold ist ebenfalls Open Source, diese werden alle von uns hergestelltWählen Sie mit Bedacht. Sie haben Recht, dieser Ansatz funktioniert, weil Technologie und Wissenschaft durch den Austausch von Informationen am schnellsten voranschreiten können. In den meisten FällenOpen Source ist allgemein von Vorteil, und so funktioniert Wissenschaft

Es gibt jedoch Ausnahmen, und zwar wenn es um Dual-Purpose-Technologien wie AGI und leistungsstarke KI geht.

Das Problem besteht darin, dass Sie in der Lage sein möchten, alle harmlosen Anwendungsfälle zu ermöglichen, und dass echte Wissenschaftler und Techniker auf diesen Ideen aufbauen und sie kritisieren können, um einen schnellen Fortschritt in der Gesellschaft voranzutreiben. Aber gleichzeitig ist die Frage, wie man die böswilligen Akteure eindämmen kann, die diese Systeme missbrauchen könnten.

Das ist jetzt in Ordnung, denn ich glaube nicht, dass diese Systeme leistungsfähig genug sind, aber in zwei oder drei Jahren könnte es ernsthaften Schaden anrichten, insbesondere wenn man Systeme mit Agentenverhalten bekommt.

Wir haben unsere eigenen Open-Source-Gemini-Modelle namens Gemma, aber es handelt sich um kleinere Modelle und nicht um hochmoderne Modelle.

Ihre Fähigkeiten sind für Entwickler immer noch sehr nützlich, da sie auf Laptops ausgeführt werden können und über eine geringere Anzahl von Parametern verfügen. Ihre Fähigkeiten sind zum jetzigen Zeitpunkt gut bekannt, da es sich nicht um die neuesten Modelle handelt.

Am Ende werden wir wahrscheinlich über Open-Source-Modelle verfügen, diese werden jedoch etwa ein Jahr hinter den neuesten Spitzenmodellen zurückbleiben, sodass wir die Fähigkeiten dieser Modelle in öffentlichen Tests mit Benutzern wirklich bewerten können.

Ein Problem bei Open Source besteht darin, dass man sich nicht daran erinnern kann, wenn etwas schiefgeht. Wenn Angreifer anfangen, ein proprietäres Modell auf schädliche Weise zu nutzen, können Sie es herunterfahren oder im Extremfall sogar das gesamte System herunterfahren. Aber sobald Sie etwas als Quelle öffnen, können Sie es nicht mehr zurücknehmen. Es ist eine Einbahnstraße.

AGI wird innerhalb von zehn Jahren verfügbar sein

Q: Heutzutage werden verschiedene KI-Modelle von wissenschaftlichen Forschern entwickelt, aber ich möchte wissen, ob es noch Platz für Forschungs- und Entwicklungseinrichtungen geben wird, wenn wir in die Phase eintreten, in der KI die gesamte wissenschaftliche Forschung unterstützt.

Hassabis: Ich denke, es gibt noch Raum dafür. Wir befinden uns jetzt in der Phase vor der Entstehung einer universellen AGI. Ich denke, dies erfordert eine enge Zusammenarbeit zwischen Gesellschaft, Wissenschaft, Regierung und Industrielabors.

Ich bin fest davon überzeugt, dass wir letztendlich nur so dorthin gelangen. Wenn Sie fragen, was nach einer AGI passiert, ist es wahrscheinlich das, was Sie wirklich wissen wollen. AGI war schon immer etwas, das ich aufbauen wollte, weil wir damit einige der grundlegendsten Fragen über die Natur der Realität, die Physik, das Bewusstsein und mehr erforschen können.

Q: Der Informatiker Stuart Russell erzählte mir einmal, dass er ein wenig besorgt sei, dass wir, sobald wir AGI erreicht haben, alle wie die Aristokraten der Vergangenheit sein könnten und nur ein unbeschwertes und luxuriöses Leben ohne Ziele und ohne Denken genießen würden.

Hassabis: Ich denke, die Zukunft wird sehr interessant sein. Aber es geht auch um das „unterbewertete“ Thema, das ich zuvor erwähnt habe, nämlich den Unterschied zwischen kurzfristigem und langfristigem Hype. Wenn man es als Hype bezeichnen möchte, ist es sicherlich bis zu einem gewissen Grad unterbewertet.

Ich denke, dass die Veränderung in der Zukunft enorm sein wird. Ich glaube, irgendwann können wir es schaffenHeilen Sie viele Krankheiten, sogar alle Krankheiten, lösen Sie Energieprobleme und Klimaprobleme.

Q: Apropos, ich erinnere mich, dass Sie einmal gesagt haben, dass Sie hoffen, dass AGI die Geheimnisse des Universums erforschen kann. Glauben Sie, dass es einige Möglichkeiten gibt, die wir uns noch nicht vorgestellt haben, wie zum Beispiel Phänomene wie Wurmlöcher?

Hassabis:sicherlich,Ich glaube voll und ganz an diese Möglichkeit. Ich hoffe wirklich, dass Wurmlöcher Realität werden. Es scheint mir, dass wir immer noch viele Missverständnisse über die Physik und die Natur der Realität haben.

Offensichtlich verbergen sich unzählige ungelöste Rätsel in der Vereinigung von Quantenmechanik und Schwerkraft, Problemen im Standardmodell, der Stringtheorie usw. Ich habe ausführliche Diskussionen mit vielen Freunden aus der Physik-Community geführt und sie alle glauben, dass es im bestehenden theoretischen Rahmen viele Dinge gibt, die nicht perfekt zusammenpassen.

Ich persönlich bin kein großer Fan von Multiversum-Erklärungen, daher fände ich es erstaunlich, wenn wir neue Theorien entwickeln und diese mit Großgeräten im Weltraum testen könnten.

Der Grund, warum ich von der Planck-Skala von Zeit und Raum so fasziniert bin, liegt darin, dass sie die ultimative Auflösung der Realität darzustellen scheint, wie die kleinste Einheit, in die alles unterteilt werden kann.

Daher denke ich, dass wir auf dieser Ebene eingehende experimentelle Untersuchungen durchführen sollten, insbesondere wenn dies der Fall istMit AGI und reichlich vorhandenen Ressourcen können wir vielleicht solche experimentellen Geräte entwerfen oder bauen.

Q: Sie haben einmal gesagt, dass DeepMind ein 20-Jahres-Projekt ist. Wie weit sind wir jetzt gekommen? Kommen Sie immer noch wie geplant voran?

Hassabis: Ja, wir sind immer noch im Zeitplan, was unglaublich klingen mag, denn normalerweise fühlt es sich bei einem 20 Jahre alten Projekt immer so an, als würde es noch weitere 20 Jahre dauern, bis es fertig ist. Aber wir haben einen langen Weg zurückgelegt.

Unser Ziel ist es, dies bis 2030 zu erreichen. Daher wäre ich nicht überrascht, wenn wir dieses Ziel innerhalb des nächsten Jahrzehnts erreichen könnten.

  • Videoadresse: https://www.youtube.com/watch?v=pZybROKrj2Q *