oracle ellison: o limite para modelos de ponta pode chegar a 100 bilhões de dólares americanos nos próximos 10 anos, e é difícil para todo o treinamento em ia passar para o estágio de inferência

oracle ellison: o limite para modelos de ponta pode chegar a 100 bilhões de dólares americanos nos próximos 10 anos, e será difícil para todo o treinamento em ia passar para o estágio de inferência

2024-09-17

cofundador e presidente da oracle, larry ellison

“a corrida (pelo poder da computação) continuará para sempre para construir uma rede neural melhor. o custo de treinar um modelo de ia é astronômico. quando falo sobre a construção de data centers de gigawatts ou multi-gigawatts, esse será “o preço inicial de um. modelo de ia verdadeiramente de ponta, se alguém quiser competir neste campo, é de cerca de us$ 100 bilhões”, disse larry ellison, cofundador e presidente da gigante global de bancos de dados oracle, em uma teleconferência de resultados no início de setembro. conhecendo issonos próximos 4 a 5 anos, qualquer empresa que queira participar nesta competição de modelos em grande escala terá um limite de modelo de ponta de até 100 bilhões de dólares americanos, e esta corrida armamentista ao poder da computação continuará para sempre.

ellison, 80 anos, é pioneiro na oracle. há 47 anos, ele, bob miner e ed oates estabeleceram o laboratório de desenvolvimento de software (sdl) e foram contratados pela cia para desenvolver um programa de banco de dados com o codinome "oracle". a empresa mais tarde mudou seu nome para oracle corporation e concluiu com sucesso seu ipo em 1986.

em setembro de 2014, ellison anunciou sua renúncia ao cargo de ceo da oracle e foi nomeado presidente executivo e diretor de tecnologia do conselho de administração da oracle. em abril de 2024, ellison foi incluída na lista das 100 pessoas mais influentes do mundo em 2024 pela revista time.

recentemente, uma “história verdadeira” sobre ellison atraiu a atenção. ele admitiu na reunião de investidores que teve que implorar ao ceo da nvidia, jensen huang, para fornecer à empresa a gpu mais recente, o que é considerado uma confirmação importante da atual escassez de poder de computação de ia.

"jantei com elon musk e jen-hsun huang no nobu em palo alto. posso descrever aquele jantar como musk e eu implorando a jen-hsun huang por gpus. por favor, aceite nosso dinheiro; não, cobre mais. você não está conseguindo basta; precisamos que você cobre mais, por favor”, disse ellison na teleconferência.

a julgar pelos resultados, o dinheiro foi bem gasto.a oracle anunciou recentemente que construirá um supercluster zettascale ai composto por 131.072 gpus nvidia gb200 nvl72 blackwell.ele pode fornecer 2,4 zettaflops de desempenho de ia, que é mais poderoso do que o cluster de computação xai de musk, que atualmente possui 100.000 placas gráficas nvidia h100 gpu.

ao mesmo tempo, os planos de ia da oracle também requerem grandes quantidades de electricidade, e a empresa obteve permissão para construir três reactores nucleares modulares para satisfazer as necessidades energéticas das suas instalações. no entanto, construir um reator nuclear para implantar em um data center pode levar anos, então a oracle pode usar grandes geradores móveis para aumentar o fornecimento de energia local, se necessário.

em 9 de setembro deste ano, a oracle anunciou seu primeiro negócio do trimestre fiscal para o ano fiscal de 2025, a partir de agosto deste ano, a receita da oracle superou as expectativas em 7% ano a ano, para us$ 13,3 bilhões. entre eles, a receita de infraestrutura em nuvem (oci) de alto perfil também foi mais forte do que wall street esperava, crescendo 45% ano a ano, para us$ 2,2 bilhões. a oracle forneceu orientação de receita para o segundo trimestre com uma faixa de crescimento de 8% a 10%, com valor médio superior ao crescimento de 8,72% esperado pelos analistas.

ellison disse na teleconferência de resultados que haverá muitos modelos profissionais no futuro. por exemplo, ele próprio está envolvido em modelos semelhantes - usando computadores para examinar slides de biópsia ou tomografia computadorizada para encontrar câncer e usando exames de sangue para encontrar câncer. "estes tendem a ser modelos muito especializados. eles não usam necessariamente groks, chatgpt, llama e gemini básicos, eles tendem a ser modelos altamente especializados... veremos cada vez mais aplicações como esta."

no entanto, ellison enfatizou aos analistas que se olharmos para os próximos cinco ou mesmo 10 anos, ainda não entramos na fase em que treinamos todos os modelos necessários e nos voltamos para a inferência.

“esta é uma batalha contínua pela supremacia tecnológica, e essa batalha será travada nos próximos cinco anos, provavelmente mais de 10 anos, por um punhado de empresas e por um país. nenhum sinal de desaceleração ou mudança de direção", enfatizou ellison, "mas é isso que está acontecendo."

o analista do morgan stanley, keith weiss, escreveu posteriormente que o desempenho do preço das ações da oracle excedeu em muito o de seus pares da indústria de software até agora neste ano. ele atribuiu o forte desempenho ao fato de a oracle ser vista pelos investidores como uma grande beneficiária da escassez de hardware de ia, o que impulsionou seus negócios de oci.

desde o início do ano, o preço das ações da oracle disparou 63,68%, uma taxa de crescimento superior à do s&p 500 e do nasdaq composite index.

afetado pelas boas notícias da oracle, o patrimônio líquido de ellison aumentou acentuadamente. em 17 de setembro, horário de pequim,dados em tempo real do ranking global de bilionários da forbes mostram que o patrimônio líquido pessoal de ellison aumentou para us$ 206,5 bilhões, ficando em segundo lugar, acima do fundador da amazon, bezos, do deus das ações buffett, do fundador da meta, zuckerberg, etc., perdendo apenas para o ceo da tesla, elon musk.curiosamente, ellison também é diretor independente no conselho de administração da tesla.

em 14 de setembro, a oracle revelou na sua reunião anual de analistas financeiros que espera que a receita da empresa atinja pelo menos 66 mil milhões de dólares no ano fiscal de 2026, aumentando a sua estimativa e superando as expectativas dos analistas.espera-se que a receita da oracle atinja pelo menos us$ 104 bilhões até o ano fiscal de 2029, o equivalente a um crescimento de receita de quase 58% em três anos.

o seguinte é parte da transcrição de perguntas e respostas da conferência de resultados do primeiro trimestre da oracle:

analista:obrigado. quero fazer uma pergunta sobre margens de lucro. você continua apresentando números fortes de receita de serviços em nuvem, especialmente os números oci, e quando você dá a eles (concorrentes) orientação sobre o que você precisa fazer para atingi-los, parece muito difícil para eles fazerem isso, para dizer o mínimo.

larry ellison:vamos começar pelos funcionários e depois passar para o autonomous database (oracle autonomous database). ganhamos uma eficiência tremenda e, neste momento, estamos migrando o fusion e, na próxima semana, para o autonomous database. decidimos que tudo precisa evoluir para a autonomia, por dois motivos, na verdade. a primeira razão é que quando você tem um banco de dados totalmente autônomo, não existe dba e o administrador do banco de dados é um robô. não há mão de obra associada ao gerenciamento do oracle autonomous database.

agora, isso é obviamente uma economia de custos. mas o mais importante é que sem poder humano não há erro humano. temos uma enorme vantagem de segurança sobre nossos concorrentes. nenhum erro será cometido. não há mão de obra, é tudo automatizado. o potencial também é muito elástico quando você automatiza tudo totalmente. não entrarei em detalhes sobre o que isso significa, mas significa que seu trabalho repentinamente requer 500 microprocessadores para ser executado. você ganhou $ 500 em 3 minutos, você precisa disso. então você os coloca de volta na piscina. portanto, isso é muito diferente de como outros bancos de dados funcionam e como eles podem chamar. as próprias nuvens podem ser elásticas em alguns lugares, mas seus bancos de dados muitas vezes não o são. autonomia significa que usamos menos hardware, somos mais rápidos, mais eficientes, totalmente automatizados, sem mão de obra e mais seguros. a margem de lucro do negócio baseado em banco de dados autônomo é muito superior à do negócio tradicional oracle.

acho que essas margens são incrivelmente altas, no mesmo nível das margens do saas, que também é um mercado incrivelmente difícil porque o sass funciona principalmente em um banco de dados autônomo. usamos hardware de forma muito eficiente. raramente usamos mão de obra porque a mão de obra é um risco à segurança. quando as pessoas fazem isso manualmente, os riscos de segurança reduzem nossa capacidade de escalar. cada data center oracle, do maior ao menor, é idêntico em recursos e funcionalidades. eles variam apenas com os seguintes fatores.

isso significa que temos um conjunto de software automatizado que faz tudo isso automaticamente.ninguém mais faz isso. ninguém tem esse nível de automação, esse nível de autonomia. isso nos permite obter lucros maiores nos negócios de banco de dados, negócios de saas e outros negócios de nuvem. nossa nuvem é mais automatizada. nossos custos trabalhistas são baixos. nossa rede é mais eficiente. são redes de domínio que funcionam muito mais rápido. se você executá-lo duas vezes mais rápido, nossos custos cairão pela metade e nossa rede será muito mais rápida que outras nuvens. então achamos que nosso potencial, à medida que aumentamos, nosso potencial para entregar margens melhores do que as que fazemos atualmente, isso é muito real.

eu acredito que sim. por exemplo, acho que você encontrará diferentes perspectivas de diferentes engenheiros à medida que migrarmos o fusion para o autonomous database. acredito que a economia de custos – nosso custo – nossa economia de custos de nuvem será de cerca de 50%. é nisso que acredito. pode ser 40% agora, pode ser 35%, mas teremos economias de custos significativas em comparação com agora, e isso abrange toda a base de clientes do fusion. portanto, este é apenas um exemplo de como podemos usar redes mais rápidas, bancos de dados mais rápidos e mais automação para tornar nossos produtos mais seguros. sempre enfatizo que a segurança é realmente o objetivo principal. mas, como efeito secundário, também acabamos por gastar menos dinheiro para operar estes centros de dados.

analista:sou mark murphy, do jpmorgan chase. larry, como você vê a transição do mercado da fase de treinamento de ia para a fase de inferência de ia. há algum debate de que podemos ter um desequilíbrio ou uma bolha no início da curva porque o treinamento é computacionalmente intensivo, e então talvez acabe na fase de inferência em algum momento para recalibrar, e a fase de inferência pode ser menos intensa ou você acha que há potencial para um alto crescimento em ambas as fases?

ellison:muita gente pensa: mando meus filhos para a faculdade e pronto. o treinamento deles acabou. tenho quatro anos de formação e depois posso colocar as crianças para trabalhar e elas vão raciocinar. isso não está certo. a corrida nunca acaba para construir redes neurais melhores. o custo deste treinamento tornou-se astronomicamente alto. quando falo sobre a construção de data centers em escala de gigawatts ou multi-gigawatts, quero dizer esses modelos de ia, esses modelos de ponta serão - para qualquer um que queira competir neste espaço, a entrada para um mercado verdadeiramente de ponta. modelo o preço é de cerca de us$ 100 bilhões.

deixe-me repetir que, nos próximos 4 a 5 anos, serão cerca de us$ 100 bilhões para quem quiser jogar este jogo.isso é muito dinheiro e não existe nada mais fácil. portanto, eles não terão muitos deles. este não é o lugar para listar quem pode realmente construir esses modelos de ponta.

mas, além disso, haverá muitos modelos muito especializados. posso contar algumas das coisas nas quais estive pessoalmente envolvido, como usar computadores para ver lâminas de biópsia ou tomografias computadorizadas para encontrar câncer, e exames de sangue para encontrar câncer. estes tendem a ser modelos muito especializados. eles não usam necessariamente grok, chatgpt, llama e gemini básicos, eles tendem a ser modelos altamente especializados. treinar o reconhecimento de imagem em alguns dados, quero dizer, como milhões de lâminas de biópsia, outros dados de treinamento não são muito úteis.

então isso continua e veremos cada vez mais aplicações como esta. então, se a sua visão é para os próximos 5 anos, talvez até para os próximos 10 anos, eu não me preocuparia com isso, treinamos todos os modelos que precisamos agora, tudo o que precisamos fazer é inferir.

penso que esta é uma batalha contínua pela superioridade tecnológica que será travada por um punhado de empresas, e talvez por um país, durante pelo menos os próximos cinco anos, mas provavelmente cerca de 10. então esse negócio só vai crescer. não há desaceleração ou transformação chegando.

digo algumas coisas que podem parecer muito estranhas. ele tem dito coisas estranhas, você pode dizer. então por que ele está dizendo isso? isto deve ser muito estranho. estamos projetando um data center com mais de 1 gigawatt de potência, mas encontramos a localização e as instalações de energia. procuramos e eles tinham permissão para construir três reatores nucleares. são pequenos reatores nucleares modulares projetados para alimentar data centers. é uma loucura como as coisas estão ficando malucas, mas é isso que está acontecendo.

analista:sou raimo lenschow, do barclays. do lado do banco de dados, o acordo que você acabou de anunciar hoje ou o acordo que você já fez com a aws. agora que temos todos os acordos de hiperescala, como você vê a migração das cargas de trabalho de banco de dados atualmente em execução no local ou em clientes na nuvem para a nuvem pública? quero dizer, o que devemos pensar sobre esse impulso? obrigado.

ellison:bem, duas coisas. a nuvem pública é muito interessante e muito importante.

quero dizer, a oracle teve muito sucesso no negócio de bancos de dados há muito tempo porque um de nossos mantras era a portabilidade. funcionamos em um mainframe ibm. corremos em pcs microsoft. estamos rodando em máquinas hewlett packard. se você se lembra, equipamentos digitais, máquinas e computadores de todos os tipos, rodamos em todos os lugares. isso é importante para que nossos clientes possam rodar o oracle database em qualquer ambiente. ficou claro que precisávamos encontrar uma maneira de realmente disponibilizar a melhor versão do nosso banco de dados, o exadata, versão exascale do banco de dados, nas nuvens de outras pessoas.

o que podemos fazer é basicamente tornar o oci pequeno o suficiente para que possamos incorporar um data center oci no microsoft azure, ou incorporar um data center oci no google ou aws, ou podemos colocá-lo em qualquer lugar que possa ser um local completamente autônomo onde possamos usar clusters exadata e exascale. na verdade, podemos fazer isso. não foi tecnicamente fácil, mas conseguimos.

ao fazer isso e reduzir nossos data centers oracle, mencionei antes que todos os nossos data centers são iguais, exceto pelo tamanho.o maior data center no momento tem 800 gigawatts, perto de 800 megawatts, desculpe, estamos perto de 1 gigawatt. o menor data center tem cerca de 150 quilowatts, vamos descer para 50 quilowatts. o que isso significa é que teremos muitas empresas, médias e grandes empresas que decidirão ter um oracle private cloud. quero dizer, ainda não há diferença entre a nossa nuvem privada e a nossa nuvem pública. eles são iguais. eles são exatamente iguais. muitas pessoas possuem oracle private cloud, e muitas empresas industriais, como a vodafone, possuem seis oracle private clouds para executar suas cargas de trabalho. mas eles se tornaram tão baratos que qualquer um pode decidir: ok, quero migrar para a nuvem. quero aproveitar todos os benefícios da nuvem, mas quero ter certeza de que sou o único na nuvem. não quero vizinhos, ou só quero vizinhos aprovados.não quero que ninguém se mude com cartão de crédito. estou apenas paranóico com relação à segurança porque tenho que cumprir as regulamentações governamentais.

portanto, achamos claro que usar bancos de dados oracle na aws, microsoft e google é muito importante. o safra está certo, quero dizer, isso vai acelerar absolutamente o crescimento do banco de dados na nuvem pública. mas esperamos que as nuvens privadas superem significativamente as nuvens públicas à medida que as empresas decidem colocar o oracle cloud atrás de firewalls em data centers sem vizinhos. e, como já temos nosso próprio data center, nosso data center é muito automatizado, escalável e funcional e somos muito organizados. então, na verdade, temos agora 162 data centers. espero que teremos 1.000 ou 2.000 ou mais data centers, data centers oracle em todo o mundo, muitos dos quais serão dedicados a bancos individuais, empresas de telecomunicações ou empresas de tecnologia, ou o que quer que seja, nuvem nacional, soberana, todas essas outras coisas . então pensamos: é difícil para mim prever o que será maior, a nuvem privada ou a nuvem pública? eu não faço ideia.

mas a boa notícia é que, de qualquer forma, vamos vencer.

analista:olá, sou mark moerdler, de bernstein. muito obrigado e parabéns pelo trimestre. este trimestre e este guia são ambos muito impressionantes. vemos muito foco no treinamento de modelos, mas menos em aplicações e inferências em outros lugares. você tem ampla experiência no mercado e na indústria. você integrou a ia tradicional em todos os produtos e recursos da oracle. mas onde você vê o valor monetizável da genai em termos de aplicações? quanto tempo você acha que levará para que a ia generativa se torne um fluxo de receita significativo, não apenas para a oracle, mas para o software em geral, no lado dos aplicativos e não no lado do treinamento? obrigado

ellison:deixe-me começar pelos cuidados de saúde, ajudamos os médicos a diagnosticar diferentes doenças. quando alguém faz um ultrassom, vejo enfermeiras, técnicos e médicos medindo o crânio do bebê, medindo a medula espinhal do bebê, para ver – é ridículo. os computadores deveriam fazer tudo isso. se houver um cordão umbilical enrolado no feto, o computador deverá detectar tudo isso e tudo deverá ser registrado agora. os médicos podem obter ajuda de computadores para fazer tudo isso. verificando placas e artérias coronárias, tudo deve ser feito desta forma.

fizemos isso para que quando o médico atende um paciente - quando ele está se preparando para atender um paciente, preparamos um resumo para o médico. usamos inteligência artificial para examinar registros eletrônicos de saúde e ver os resultados de testes de laboratório mais recentes de algumas horas atrás. e informe ao médico se o quadro está estável ou progredindo, ou qualquer informação que o médico precise saber antes da consulta.este resumo é criado por inteligência artificial e é um resumo legível por humanos. a ia então escuta a consulta entre o médico e o paciente. isto foi entregue. isso já existe. eles atendem – eles ouvem as consultas médico-paciente. se um médico prescreve uma receita, a ia verifica se a receita está correta e a insere. a inteligência artificial atualiza registros eletrônicos de saúde. a ia transcreve e distribui as ordens do médico, tudo ouvindo a conversa. o médico então tem um rascunho no final da conversa que pode revisar e aprovar rapidamente.as prescrições são então dispensadas, as ordens médicas são atendidas e os registros eletrônicos de saúde são atualizados. já estamos fazendo todas essas coisas. mas eu poderia continuar. na área da saúde, precisamos de muitas coisas, desde a leitura de raios x até interfaces de usuário.

nossa interface de usuário é muito diferente da interface de usuário da epic. certa vez, levei meu filho para stanford e foram necessárias três pessoas, em três posições diferentes, para encontrar seu raio-x. é assim que você encontra o raio x de larry ellison. você diz, oracle, por favor, mostre-me o último raio-x de larry ellison. esta é uma interface de voz. você apenas pergunta a eles. como você faz login? bem, você olha para o computador e ele reconhece seu rosto. ele reconhece sua voz, sabe que você é médico e tem permissão para visualizá-la, e toda autorização é feita através de inteligência artificial.

tudo isso é inteligência artificial, e sei que as pessoas pensam que é uma coisa separada, e ouvi muitas pessoas dizerem que agora temos agentes de ia que serão cobrados separadamente. mas acho que nossos aplicativos serão principalmente aplicativos de ia, e como você cobra por tudo isso separadamente? eu realmente não sei. enquanto os ouvia, fiquei confuso. eu não entendo o que eles estão falando. eu gostaria de saber uma coisa e vou deixar por isso mesmo.

analista:sou derrick wood, do td cowen. também quero parabenizá-los pelo tremendo progresso que vocês fizeram em termos de crescimento nos últimos trimestres. você pode nos explicar sua perspectiva sobre a disponibilidade de fornecimento e sua capacidade de configurar a infraestrutura do data center de maneira eficiente para passar da contratação ao consumo e converter o backlog em receita? eu fico tipo, o que você está fazendo de diferente hoje do que fazia há um ano e você pode tentar me ajudar a fornecer esses pontos de aceleração?

ellison:nossas nuvens privadas são exatamente iguais às nuvens públicas, exceto que podem ter apenas um locatário e estar localizadas em um prédio de sua propriedade. fora isso, eles são exatamente iguais. nós possuímos o hardware. gerenciamos o hardware para você. acontece que está em um prédio de sua propriedade e só você pode entrar. portanto, é muito diferente do que todos os nossos concorrentes estão fazendo e é totalmente automatizado.

portanto, estamos preparados para gerenciar milhares de data centers. a propósito, eu compararia isso com o starlink do elon musk, acho que ele tem quase 7.000 satélites no céu neste momento, 6.800. como você gerencia - esses satélites estão em constante manobra. eles não são satélites geoestacionários. eles são satélites de órbita baixa da terra. então eles continuam voando e mudando de posição. como você gerencia 7.000 naves espaciais voadoras? bem, deixe-me dizer, o computador tem que ser totalmente automatizado ou não funcionará.

eu diria que não é possível ter milhares ou mesmo centenas de data centers, mas certamente é possível ter milhares de data centers, a menos que sejam totalmente automatizados. e a única maneira de automatizar isso é torná-los todos iguais. você não pode automatizar 25 coisas diferentes. então esse é um aspecto.

outra coisa que gostaria de salientar, e acho que uma das coisas interessantes sobre a oracle é que algumas das pessoas mais experientes da nossa equipe de gestão são especialistas em edifícios, usinas de energia e sistemas de transmissão de energia. porque é isso que significa construir esses data centers. você não pode simplesmente construir um data center. você também deve considerar a energia e seu transporte desde o local onde é gerada até o data center.

é claro que a maneira mais eficiente de fazer isso é construir usinas de energia próximas aos data centers. dessa forma, você pode transmitir dados pela distância mais curta. na verdade, temos pessoas muito experientes que vêm do setor de serviços públicos e, por mais estranho que pareça, eles são especialistas nisso e nos ajudam a construir esses grandes projetos.

mais uma vez, vou ouvir elon musk. um dos trabalhos mais difíceis que teve durante a construção da tesla foi construir a fábrica de austin, onde teve que construir o maior edifício já construído pelo homem.quer saber sobre os maiores edifícios já construídos? certamente não o pentágono. nem é o edifício do ônibus espacial da nasa. o maior edifício é a fábrica da tesla.então você tem que ser um empreiteiro dessa planta. você tem que ser capaz de construir essas coisas e depois usar robôs para construir seus carros.

então você tem que construir o prédio, ligá-lo, configurar todos os sistemas de automação, que é a parte mais difícil de construir uma nuvem ou um sistema de automação predial, configurar todos os sistemas de automação para que funcionem de forma eficiente, confiável e econômica. efetivamente. dito isto, temos aqui algumas pessoas muito interessantes, com uma base de experiência muito diferente da que tínhamos há cinco anos.

notícias

oracle ellison: o limite para modelos de ponta pode chegar a 100 bilhões de dólares americanos nos próximos 10 anos, e será difícil para todo o treinamento em ia passar para o estágio de inferência

introdução

minhas informações de contato