Minhas informações de contato
Correspondênciaadmin@informação.bz
2024-08-19
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Tao Le originou-se do Templo Aofei
Qubits | Conta pública QbitAI
Quando a AGI será implementada? GoogleMente Profunda O CEO Hassabis previu na última entrevista:
dez anos.
seAGIEu não ficaria surpreso se isso aparecesse na próxima década.
Nesta entrevista, Hassabis falou sobre as tendências de desenvolvimento da IA.
Existem alguns tópicos que interessam a todos, como:
A IA pode ser exagerada a curto prazo, mas o seu potencial e impacto continuam subestimados a longo prazo.
Como “superequipe” do Google, o Google DeepMind precisa encontrar um equilíbrio entre interesses comerciais e pesquisa científica.
O código aberto é importante para o progresso tecnológico, mas quando você encontrar tecnologia que possa ser mal utilizada, talvez seja melhor esperar um ano antes de torná-la código aberto para avaliar e limitar o uso indevido.
Para conteúdo mais específico, consulte a versão em texto abaixo ~
Pq: Para a entrevista de hoje, convidei Hassabis, cofundador da DeepMind e atual CEO do Google DeepMind.
Hassabis: Obrigado, estou muito feliz em poder participar de sua entrevista. Anteriormente, vimos como os conceitos e a linguagem podem ser usados no mundo real, como em ambientes simulados ou como robôs que possuem inteligência real que pode ser necessária para compreender o mundo que nos rodeia.
Contudo, há que reconhecer que estes sistemas ainda não estão nesse nível ideal, cometendo muitos erros e não construindo realmente um modelo completo do mundo. Ainda assim, eles fizeram progressos muito além das nossas expectativas apenas através da aprendizagem de línguas.
Pq: Sim, discutimos muito da última vez sobre como implementar a linguagem no mundo real. Mas você pode explicar brevemente o que significa “pouso”? Caso os amigos que estão assistindo nossa entrevista pela primeira vez não entendam.
Hassabis:"pousar"Este conceito,Originado de sistemas clássicos de IA construídos em instituições acadêmicas como o MIT nas décadas de 1980 e 1990.A maioria desses sistemas são sistemas lógicos enormes, que podem ser imaginados como bancos de dados gigantescos contendo muitas palavras inter-relacionadas.
O problema, porém, é que embora você possa encontrar afirmações como “Cães têm quatro patas” no banco de dados, quando o sistema se depara com a foto de um cachorro real, ele não consegue associar esses pixels aos símbolos do banco de dados. , este é o chamado "problema de pouso".
Em outras palavras, o sistema possui representações simbólicas ou abstratas, mas não consegue compreender o significado concreto dessas representações no mundo real. Desde então, embora as pessoas tenham tentado resolver este problema, nunca conseguiram alcançar a perfeição.
Ao contrário dos sistemas do passado, os sistemas de IA atuais aprendem diretamente a partir dos dados e estabelecem ligações entre os dados e o mundo real desde o início.
Curiosamente, mesmo que estes sistemas aprendam inicialmente apenas com base na linguagem, eles deveriam, teoricamente, carecer de muitas informações necessárias para "decolar", porque não estão conectados a simuladores do mundo real, robôs ou outras formas de entrada, mas apenas É aprender no espaço da linguagem.
Surpreendentemente, porém, estes sistemas ainda são capazes de inferir algum conhecimento sobre o mundo real.
Pq: Isto pode ocorrer porque, à medida que as pessoas interagem com o sistema, elas informam ao sistema quais respostas estão corretas e quais estão incorretas. Através do feedback desta forma, o sistema pode receber parte das informações de “aterrissagem”, estabelecendo gradativamente uma conexão com o mundo real.
Hassabis: Na verdade, se o sistema em versões anteriores desse respostas incorretas devido à falta de informações de "aterrissagem", como responder incorretamente a uma pergunta como "Como um cachorro late?", o feedback das pessoas corrigiria isso.
Este feedback é baseado no nosso próprio conhecimento "implementado", portanto, até certo ponto,O sistema absorve e aprende as informações desse feedback.
Pq: Além disso, também quero perguntar sobre o entusiasmo da IA. Você acha que nossa situação atual, a situação atual, é subestimada ou superestimada?
Hassabis: Acho que é mais o último. Eu quero dizer,No curto prazo, o hype foi longe demais.
Acho que as pessoas dizem que a IA pode fazer todo tipo de coisas, mas na realidade ela não é tão poderosa quanto dizem. Existem muitas startups e VCs perseguindo ideias irrealistas que não são muito maduras.
Mas, por outro lado, acho que mesmo agora ainda está subvalorizado ou não recebe atenção suficiente. Especialmente à medida que chegamos aos estágios AGI e pós-AGI, ainda sinto que as pessoas não entendem completamente a grande mudança que isso representará e as responsabilidades que a acompanham.
então,Acho que no curto prazo está definitivamente exagerado, mas no longo prazo ainda está subvalorizado.
Pq: Ok, agora quero fazer uma pergunta mais importante nesta entrevista: qual você acha que é a diferença entre o Gemini e os grandes modelos de linguagem lançados por outros laboratórios?
Hassabis: Estabelecemos uma meta desde o início do projeto Gemini, que é capacitá-lo a lidar com vários tipos de dados ao mesmo tempo. Esperamos que ele consiga não apenas compreender texto, mas também analisar sons, vídeos, imagens, códigos, etc., basicamente todas as formas de informação.
Acreditamos firmemente que somente permitindo que os sistemas compreendam e processem diversas informações no mundo real poderão realmente compreender o mundo e construir um modelo mundial mais preciso e abrangente.
Na verdade, esta é uma extensão do problema de “aterrissagem” que mencionamos acima, mas desta vez estamos usando a linguagem como base para conseguir isso.
Pq: Então a “implementação” ainda é a chave de todo o projeto?
Hassabis: Na verdade, isso é crucial.
Temos também um objectivo final, que éCrie um assistente versátil. Desenvolvemos uma ferramenta chamadaAstroProtótipo do projeto, o Astro não apenas entende sua opinião, mas também sente o contexto do seu ambiente.
Imagine o quão mais poderoso seria o seu assistente pessoal ou assistente digital se tivesse uma compreensão mais profunda do contexto da sua pergunta ou da situação em que você se encontra. Por isso, acreditamos sempre firmemente que este tipo de sistema será mais prático.
Para fazer isso, construímos funcionalidade multimodal no sistema desde o início do projeto. Na época, esse era o único modelo com esse recurso e agora outros modelos estão tentando alcançá-lo.
Pq:O Projeto Astro é um agente emergente de IA de uso geral, capaz de processar dados de vídeo e áudio.Lembro que na conferência Google I/O você mostrou um exemplo de como o Astro ajuda os usuários a lembrar onde estão seus óculos. Estou interessado nas origens desta tecnologia. Será apenas uma evolução avançada do antigo Google Glass?
Hassabis: O Google tem uma longa história no desenvolvimento de dispositivos baseados em óculos, tendo estado envolvido já por volta de 2012. Portanto, eles têm uma vantagem significativa de serem pioneiros nesta área. Pode ser que faltasse a tecnologia necessária para que o assistente inteligente entendesse o que estava vendo. Mas agora,Com este assistente digital ao seu lado, ele poderá entender o mundo ao seu redor, parece muito natural.
Pq: Quero rastrear as origens do Gemini porque ele se originou de dois departamentos distintos dentro da organização e foi feito por eles?
Hassabis: Na verdade, no ano passado colocamos o Alphabet(Empresa controladora do Google)Os dois departamentos de pesquisa do originalMente ProfundaeGoogle Cérebro, fundido em um novo departamento, chamamos isso"Super Departamento"。
Dessa forma, todos os maiores talentos da empresa estão reunidos em um só time, e combinamos o melhor conhecimento de todas as áreas de pesquisa, principalmente em modelos de linguagem.
Tivemos alguns projetos anteriores, como Trin Chilla e Gopher, que participaram do desenvolvimento dos primeiros modelos de linguagem, como Palm e Lambda. Cada um destes modelos tem os seus próprios pontos fortes e fracos e integrámo-los no projecto Gemini, que é o primeiro projecto muito importante após a fusão.
Além disso, há outro ponto particularmente importante, que é o de queIntegre todos os recursos de computação juntos. Dessa forma, podemos realizar treinamentos em larga escala, o que na verdade reúne todo o poder da computação,Torne o Gemini mais poderoso e eficiente。
Essas duas equipes sempre estiveram focadas na vanguarda da IA. Elas já colaboraram muito em pesquisas pessoais antes, mas podem não estar tão próximas estrategicamente. Agora, a equipe combinada, eu a descreveria como a do Google"Sala de Máquinas"。
Acho que os métodos de trabalho das duas equipes são bastante semelhantes, sem muita diferença. A seguir, continuaremos a reforçar as nossas vantagens na investigação básica, como pensar no próximoTransformadorComo será a arquitetura, todos nós queremos descobrir por nós mesmos.
Falando nisso, o Transformer anterior foi criado pelo Google Brain e o combinamos com o Deep Reinforcement Learning, mas acho que é necessária mais inovação. Acredito que, assim como nos últimos 10 anos, seja Brain ou DeepMind, continuaremos contribuindo.
Pq: Você acabou de dizer que o Google DeepMind é agora a "sala de máquinas" do Google. Esta é uma grande mudança. Quero saber se o Google está apostando fortemente em você agora?
Hassabis: Eu penso que sim. Acho que o Google sempre foi claro sobre a importância da IA. Pichai disse quando se tornou CEO,Google é uma empresa “AI-first”。
Discutimos este tema quando ele assumiu o cargo. Ele viu o potencial da IA como a próxima grande mudança de paradigma depois da Internet móvel, e o seu impacto foi ainda mais profundo do que estes.
Mas acho que nos últimos dois anos começamos a realmente entender o que isso significa, não apenas do ponto de vista da pesquisa, mas também do produto e de tudo mais. Então, é um momento muito emocionante, mas acho que é a escolha certa reunirmos todos os talentos e dar tudo de nós.
Pq: De outra perspectiva, para a DeepMind, que agora está se tornando a "sala de máquinas" do Google, isso significa que você precisa encontrar mais equilíbrio entre considerar os interesses comerciais e a pesquisa científica pura?
Hassabis: Na verdade, precisamos agora de considerar mais os interesses comerciais, o que se tornou parte das nossas responsabilidades. No entanto, ainda existem alguns pontos que precisam de ser esclarecidos. Continuaremos a avançar no nosso trabalho de investigação científica e o nosso investimento nesta área continua a aumentar.
Eu penso,Isso é algo único que fazemos no Google DeepMind, até os nossos concorrentes veem estes resultados como benefícios generalizados da IA.
Pq: Ok, isso me leva à próxima pergunta: código aberto. Quando a tecnologia chega às mãos das massas, como você disse, algumas coisas incríveis podem acontecer. Eu sei que a DeepMind abriu o código de muitos projetos de pesquisa no passado, mas isso parece ter mudado agora. Você pode falar sobre sua opinião sobre código aberto?
Hassabis:O código aberto é necessário e sempre fomos fortes defensores do código aberto e da ciência aberta.Como você sabe, publicamos quase todos os projetos de pesquisa que realizamos, incluindo projetos como Transformer eAlphaGoPublicamos projetos como este em revistas importantes como Nature e Science.
AlphaFold também é de código aberto, tudo isso é feito por nósEscolha sabiamente. Você está certo, esta abordagem funciona porque a tecnologia e a ciência podem avançar na velocidade mais rápida através do compartilhamento de informações. Na maioria dos casos,O código aberto é universalmente benéfico e é assim que a ciência funciona。
Porém, há exceções, e isso ocorre quando se trata de tecnologias de dupla finalidade, como AGI e IA poderosa.
O problema é que você deseja permitir todos os casos de uso benignos e deseja que cientistas e tecnólogos reais sejam capazes de desenvolver e criticar essas ideias para impulsionar o rápido progresso na sociedade. Mas, ao mesmo tempo, como limitar os maus atores que podem abusar desses sistemas, essa é a questão.
Tudo bem agora, porque não acho que esses sistemas sejam poderosos o suficiente, mas em dois ou três anos, especialmente quando você começar a ter sistemas com comportamento de agente, isso poderá causar sérios danos.
Temos nossos próprios modelos Gemini de código aberto, chamados Gemma, mas são modelos menores e não modelos de última geração.
Seus recursos ainda são muito úteis para desenvolvedores porque podem ser executados em laptops e porque possuem um número menor de parâmetros. As suas capacidades são bem compreendidas nesta fase, uma vez que não são os modelos de última geração.
Provavelmente o que acabaremos fazendo é ter modelos de código aberto, mas eles estarão cerca de um ano atrás dos modelos de ponta mais recentes, para que possamos realmente avaliar as capacidades desses modelos em testes públicos com usuários.
Um problema com o código aberto é que, se algo der errado, você não conseguirá se lembrar. Com um modelo proprietário, se bandidos começarem a usá-lo de maneira inadequada, você poderá desligá-lo ou até mesmo desligar todo o sistema em casos extremos. Mas uma vez que você abre algo, você não pode voltar atrás. É uma porta de mão única.
Pq: Hoje em dia, vários modelos de IA são desenvolvidos por investigadores científicos, mas quero saber, se entrarmos na fase em que a IA apoia toda a investigação científica, ainda haverá espaço para a existência de instituições de I&D?
Hassabis: Acho que ainda há espaço. Estamos agora na fase anterior ao surgimento da AGI geral. Acho que isso requer uma cooperação estreita entre a sociedade, a academia, o governo e os laboratórios industriais.
Acredito verdadeiramente que esta é a única forma de chegarmos lá. Se você está perguntando sobre o que acontece depois do AGI, provavelmente é isso que você realmente quer saber. AGI sempre foi algo que aspiro construir porque podemos usá-lo para explorar algumas das questões mais fundamentais sobre a natureza da realidade, física, consciência e muito mais.
Pq: O cientista da computação Stuart Russell uma vez me disse que estava um pouco preocupado com o fato de que, uma vez alcançado o AGI, seríamos todos como os aristocratas do passado, apenas desfrutando de uma vida despreocupada e luxuosa, sem quaisquer objetivos e sem pensar.
Hassabis: Acho que o futuro será muito interessante. Mas também entra na questão “subvalorizada” que mencionei anteriormente, que é a diferença entre o hype de curto prazo e o de longo prazo. Se você quiser chamar isso de hype, certamente é subvalorizado até certo ponto.
Acho que a mudança no futuro será enorme. Acredito que eventualmente poderemosCurar muitas doenças, até mesmo todas as doenças, resolver problemas energéticos e climáticos.
Pq: Falando nisso, lembro que uma vez você disse que espera que o AGI possa explorar os mistérios do universo. Você acha que existem algumas possibilidades que ainda não imaginamos, como fenômenos como buracos de minhoca?
Hassabis:certamente,Acredito plenamente nesta possibilidade. Eu realmente espero que os buracos de minhoca se tornem realidade. Parece-me que ainda temos muitos mal-entendidos sobre a física e a natureza da realidade.
Obviamente, existem inúmeros mistérios não resolvidos escondidos na unificação da mecânica quântica e da gravidade, problemas no Modelo Padrão, teoria das cordas, etc. Tive discussões aprofundadas com muitos amigos da comunidade física, e todos eles acreditam que há muitas coisas na estrutura teórica existente que não se encaixam perfeitamente.
Pessoalmente, não sou um grande fã de explicações sobre o multiverso, então acho que seria incrível se pudéssemos apresentar novas teorias e testá-las com equipamentos de grande escala no espaço.
A razão pela qual estou tão fascinado pela escala de tempo e espaço de Planck é que ela parece representar a resolução última da realidade, como a menor unidade em que tudo pode ser dividido.
Portanto, penso que deveríamos conduzir uma exploração experimental aprofundada a este nível, especialmente quando tivermosCom AGI e recursos abundantes, talvez possamos projetar ou construir esse equipamento experimental.
Pq: Você disse uma vez que DeepMind é um projeto de 20 anos. Você ainda está progredindo conforme planejado?
Hassabis: Sim, ainda estamos dentro do cronograma, o que pode parecer incrível porque normalmente um projeto de 20 anos sempre parece que levará mais 20 anos para ser concluído. Mas percorremos um longo caminho.
Nosso objetivo é fazer isso até 2030, então não ficaria surpreso se conseguirmos chegar lá na próxima década.
Endereço do vídeo: https://www.youtube.com/watch?v=pZybROKrj2Q *