notizia

oracle ellison: la soglia per i modelli all'avanguardia potrebbe raggiungere i 100 miliardi di dollari nei prossimi 10 anni e sarà difficile che tutta la formazione sull'intelligenza artificiale passi alla fase di inferenza

2024-09-17

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

il cofondatore e presidente di oracle larry ellison

"la corsa (per la potenza di calcolo) continuerà all'infinito per costruire una rete neurale migliore. il costo dell'addestramento di un modello di intelligenza artificiale è astronomico. quando parlo di costruzione di data center gigawatt o multi-gigawatt, quello sarà "il prezzo di ingresso per un un modello di intelligenza artificiale veramente all'avanguardia, se qualcuno vuole competere in questo campo, costa circa 100 miliardi di dollari," ha detto larry ellison, co-fondatore e presidente del gigante globale dei database oracle, in una conferenza sugli utili all'inizio di settembre. incontrarlonei prossimi 4 o 5 anni, qualsiasi azienda che voglia partecipare a questa competizione di modelli su larga scala avrà una soglia di modello all’avanguardia pari a 100 miliardi di dollari usa, e questa corsa agli armamenti per la potenza di calcolo continuerà per sempre.

ellison, 80 anni, è un pioniere di oracle. 47 anni fa, lui, bob miner e ed oates fondarono il software development laboratory (sdl) e furono incaricati dalla cia di sviluppare un programma di database con nome in codice "oracle". la società in seguito cambiò il suo nome in oracle corporation e completò con successo il suo ipo nel 1986.

nel settembre 2014, ellison ha annunciato le sue dimissioni dalla carica di ceo di oracle ed è stato nominato presidente esecutivo e chief technology officer del consiglio di amministrazione di oracle. nell'aprile 2024, ellison è stata inclusa nella lista delle 100 persone più influenti al mondo nel 2024 dalla rivista time.

recentemente, una "storia vera" su ellison ha attirato l'attenzione. durante l'incontro con gli investitori ha ammesso di aver dovuto chiedere al ceo di nvidia jensen huang di fornire all'azienda l'ultima gpu, il che è considerato un'importante conferma dell'attuale carenza di potenza di calcolo dell'intelligenza artificiale.

"ho cenato con elon musk e jen-hsun huang al nobu di palo alto. posso descrivere quella cena come se musk e io supplicassimo jen-hsun huang per le gpu. per favore prendi i nostri soldi; no, fai pagare di più. non otterrai abbastanza; abbiamo bisogno che tu faccia pagare di più, per favore", ha detto ellison durante la teleconferenza. "ha funzionato."

a giudicare dai risultati i soldi sono stati ben spesi.oracle ha recentemente annunciato che costruirà un super cluster ai zettascale composto da 131.072 gpu nvidia gb200 nvl72 blackwell.può fornire 2,4 zettaflops di prestazioni ai, che è più potente del cluster di elaborazione xai di musk, che attualmente dispone di 100.000 schede grafiche gpu nvidia h100.

allo stesso tempo, anche i piani di intelligenza artificiale di oracle richiedono grandi quantità di elettricità e la società ha ottenuto il permesso di costruire tre reattori nucleari modulari per soddisfare il fabbisogno energetico delle sue strutture. tuttavia, la costruzione di un reattore nucleare da installare in un data center potrebbe richiedere anni, quindi oracle potrebbe utilizzare grandi generatori mobili per aumentare le forniture elettriche locali, se necessario.

il 9 settembre di quest'anno, oracle ha annunciato la sua attività nel primo trimestre fiscale per l'anno fiscale 2025, a partire dall'agosto di quest'anno. i ricavi di oracle hanno superato le aspettative del 7% su base annua raggiungendo i 13,3 miliardi di dollari. tra questi, anche i ricavi delle infrastrutture cloud di alto profilo (oci) sono stati più forti di quanto previsto da wall street, crescendo del 45% su base annua a 2,2 miliardi di dollari. oracle ha fornito una guidance sui ricavi del secondo trimestre con un intervallo di crescita compreso tra l'8% e il 10%, con un valore medio superiore alla crescita dell'8,72% prevista dagli analisti.

ellison ha detto alla conferenza degli utili che ci saranno molti modelli professionali in futuro. ad esempio, lui stesso è coinvolto in modelli simili che utilizzano computer per esaminare vetrini bioptici o scansioni tc per trovare il cancro e utilizzare esami del sangue per trovare il cancro. "questi tendono ad essere modelli molto specializzati. non usano necessariamente groks, chatgpt, llama e gemini di base, tendono ad essere modelli altamente specializzati... vedremo sempre più applicazioni come questa."

tuttavia, ellison ha sottolineato agli analisti che se guardiamo ai prossimi cinque o anche dieci anni, non siamo ancora entrati nella fase in cui abbiamo addestrato tutti i modelli richiesti e siamo passati all’inferenza.

"questa è una battaglia continua per la supremazia tecnologica, e quella battaglia sarà combattuta nei prossimi cinque anni, probabilmente più di dieci anni, da una manciata di aziende e da un paese. quindi questo business sta diventando sempre più grande." nessun segno di rallentamento o di inversione di tendenza", ha sottolineato ellison, "ma è quello che sta succedendo".

l'analista di morgan stanley keith weiss ha successivamente scritto che la performance del prezzo delle azioni di oracle ha superato di gran lunga quella dei suoi concorrenti del settore software finora quest'anno. ha attribuito la forte performance al fatto che oracle è stata vista dagli investitori come uno dei principali beneficiari della scarsità di hardware ai, cosa che ha potenziato il suo business oci.

dall'inizio dell'anno, il prezzo delle azioni oracle è salito del 63,68%, un tasso di crescita superiore a quello dell's&p 500 e del nasdaq composite index.

colpito dalle buone notizie di oracle, il patrimonio netto di ellison è aumentato notevolmente. dal 17 settembre, ora di pechino,i dati in tempo reale delle classifiche globali dei miliardari di forbes mostrano che il patrimonio netto personale di ellison è aumentato a 206,5 miliardi di dollari, classificandosi al secondo posto, superiore al fondatore di amazon bezos, al dio delle azioni buffett, al fondatore di meta zuckerberg, ecc. secondo solo al ceo di tesla elon musk.è interessante notare che ellison è anche un amministratore indipendente nel consiglio di amministrazione di tesla.

il 14 settembre, oracle ha rivelato durante la riunione annuale degli analisti finanziari che prevede che i ricavi dell'azienda raggiungeranno almeno 66 miliardi di dollari nell'anno fiscale 2026, aumentando la sua stima e superando le aspettative degli analisti.si prevede che i ricavi di oracle raggiungeranno almeno 104 miliardi di dollari entro l’anno fiscale 2029, equivalente a una crescita dei ricavi di quasi il 58% in tre anni.

quanto segue è parte della trascrizione di domande e risposte della conferenza sugli utili del primo trimestre di oracle:

analista:grazie. vorrei porre una domanda sui margini di profitto. continui a pubblicare ottimi numeri sulle entrate dei servizi cloud, in particolare i numeri oci, e quando fornisci loro (ai concorrenti) indicazioni su cosa devi fare per colpirli, sembra davvero difficile per loro farlo, per usare un eufemismo.

larry ellison:partiamo dai dipendenti per poi passare all'autonomous database (oracle autonomous database). abbiamo ottenuto enormi efficienze e mentre parliamo, trasferiremo fusion e la prossima settimana su autonomous database. abbiamo deciso che tutto deve spostarsi in autonomia, per due motivi, in realtà. il primo motivo è che quando si dispone di un database completamente autonomo, non esiste un dba e l'amministratore del database è un robot. non è prevista manodopera associata alla gestione di oracle autonomous database.

ora, questo è ovviamente un risparmio sui costi. ma, cosa ancora più importante, senza il potere umano non esiste errore umano. abbiamo un enorme vantaggio in termini di sicurezza rispetto ai nostri concorrenti. non verranno commessi errori. non c'è manodopera, è tutto automatizzato. il potenziale è anche molto elastico quando si automatizza completamente tutto. non entrerò nei dettagli su cosa significhi, ma significa che il tuo lavoro richiede improvvisamente 500 microprocessori per essere eseguito. hai ricevuto $ 500 in 3 minuti, ne hai bisogno. poi li rimetti in piscina. quindi questo è molto diverso da come funzionano gli altri database e da come potrebbero chiamarli. i cloud stessi possono essere elastici in alcuni punti, ma i loro database spesso non lo sono. autonomia significa che utilizziamo meno hardware, siamo più veloci, più efficienti, completamente automatizzati, senza manodopera e più sicuri. il margine di profitto dell'azienda basata su database autonomo è molto più elevato di quello dell'attività oracle tradizionale.

penso che questi margini siano incredibilmente alti, alla pari con i margini per saas, che è anche un mercato incredibilmente difficile perché sass funziona principalmente su un database autonomo. utilizziamo l'hardware in modo molto efficiente. usiamo raramente la manodopera perché la manodopera rappresenta un rischio per la sicurezza. quando le persone lo fanno effettivamente manualmente, i rischi per la sicurezza riducono la nostra capacità di scalare. ogni data center oracle, dal più grande al più piccolo, è identico in caratteristiche e funzionalità. variano solo con i seguenti fattori.

ciò significa che disponiamo di una suite di software automatizzato che fa tutto questo automaticamente.nessun altro lo fa. nessuno ha quel livello di automazione, quel livello di autonomia. ci consente di ottenere profitti più elevati nel business dei database, nel business saas e in altre attività cloud. il nostro cloud è più automatizzato. il nostro costo del lavoro è basso. la nostra rete è più efficiente. sono reti di dominio che funzionano molto più velocemente. se lo esegui due volte più velocemente, i nostri costi si dimezzano e la nostra rete è molto più veloce di altri cloud. quindi riteniamo che il nostro potenziale, man mano che cresciamo, il nostro potenziale per offrire margini migliori di quelli attuali, sia molto reale.

credo di sì. ad esempio, penso che troverai prospettive diverse da diversi ingegneri quando sposteremo fusion su autonomous database. penso che il risparmio sui costi, i nostri costi, il risparmio sui costi del cloud sarà di circa il 50%. questo è ciò in cui credo. potrebbe essere il 40% ora, potrebbe essere il 35%, ma avremo notevoli risparmi sui costi rispetto ad ora e ciò si estende all'intera base clienti fusion. quindi questo è solo un esempio di come possiamo utilizzare reti più veloci, database più veloci e maggiore automazione per rendere i nostri prodotti più sicuri. sottolineo sempre che la sicurezza è davvero l'obiettivo principale. ma come effetto secondario, finiamo anche per spendere meno soldi per gestire questi data center.

analista:sono mark murphy di jpmorgan chase. larry, come vedi la transizione del mercato dalla fase di addestramento dell'ia alla fase di inferenza dell'ia? si discute sul fatto che potremmo avere uno squilibrio o una bolla nella parte anteriore della curva perché l'addestramento è ad alta intensità di calcolo, e poi forse a un certo punto finirà nella fase di inferenza per ricalibrarsi, e la fase di inferenza potrebbe essere meno intensa o pensi che ci sia un potenziale di crescita elevata in entrambe le fasi?

ellison:molte persone pensano: mando i miei figli al college e basta. la loro formazione è finita. ho quattro anni di allenamento e poi posso mettere i ragazzi a lavorare e loro faranno ragionamenti. questo non è giusto. la corsa per costruire reti neurali migliori non è mai finita. il costo di questa formazione è diventato astronomicamente alto. quando parlo di costruire data center su scala gigawatt o multi-gigawatt, intendo questi modelli di intelligenza artificiale, questi modelli all'avanguardia saranno, per chiunque voglia competere in questo spazio, l'ingresso in un mondo davvero all'avanguardia. modello il prezzo è di circa 100 miliardi di dollari.

lasciatemi ripetere che, nei prossimi 4 o 5 anni, saranno circa 100 miliardi di dollari per chiunque voglia giocare a questo gioco.sono un sacco di soldi e non potrebbe essere più facile. quindi non ne avranno molti. non è questa la sede per elencare chi può effettivamente costruire questi modelli all’avanguardia.

ma oltre a ciò, ci saranno molti modelli molto specializzati. posso dirvi alcune delle cose in cui sono stato personalmente coinvolto, come usare i computer per guardare i vetrini della biopsia o le scansioni tc per trovare il cancro, e gli esami del sangue per trovare il cancro. questi tendono ad essere modelli molto specializzati. non utilizzano necessariamente grok, chatgpt, llama e gemini di base, tendono ad essere modelli altamente specializzati. l'addestramento al riconoscimento delle immagini su alcuni dati, voglio dire, come milioni di vetrini bioptici, altri dati di addestramento non sono molto utili.

quindi continua così e vedremo sempre più applicazioni come questa. quindi, se la tua visione è per i prossimi 5 anni, forse anche per i prossimi 10 anni, non mi preoccuperei, abbiamo addestrato tutti i modelli di cui abbiamo bisogno ora, tutto ciò che dobbiamo fare è dedurre.

penso che questa sia una battaglia continua per la superiorità tecnologica che sarà combattuta da una manciata di aziende, e forse da un paese, per almeno i prossimi cinque anni, ma probabilmente più di 10. quindi questo business diventerà ancora più grande. non è previsto alcun rallentamento o trasformazione.

dico alcune cose che possono sembrare davvero strane. ha detto cose strane, potresti dire. allora perché sta dicendo questo? deve essere molto strano. stiamo progettando un data center con oltre 1 gigawatt di potenza, ma troviamo la posizione e le strutture elettriche. abbiamo guardato e avevano il permesso di costruire tre reattori nucleari. si tratta di piccoli reattori nucleari modulari progettati per alimentare i data center. è pazzesco quanto le cose stiano diventando pazze, ma è quello che sta succedendo.

analista:sono raimo lenschow della barclays. per quanto riguarda il database, l'accordo che hai appena annunciato oggi o l'accordo che hai già concluso con aws. ora che abbiamo tutte le offerte iperscalabili, come vedi la migrazione dai carichi di lavoro dei database attualmente in esecuzione in locale o sui clienti cloud al cloud pubblico? voglio dire, cosa dovremmo pensare di questo slancio? grazie.

ellison:bene, due cose. il cloud pubblico è molto interessante e molto importante.

voglio dire, oracle ha avuto molto successo nel settore dei database molto tempo fa perché uno dei nostri mantra era la portabilità. lavoriamo su un mainframe ibm. utilizziamo pc microsoft. lavoriamo su macchine hewlett packard. se ricordate, apparecchiature digitali, macchine e computer di ogni tipo, corriamo ovunque. questo è importante affinché i nostri clienti possano eseguire oracle database in qualsiasi ambiente. è diventato chiaro che dovevamo trovare un modo per rendere effettivamente disponibile la migliore versione del nostro database, la versione exadata, exascale, nei cloud di altre persone.

ciò che possiamo fare è fondamentalmente rendere oci abbastanza piccolo da poter incorporare un data center oci in microsoft azure, o incorporare un data center oci in google o aws, oppure possiamo metterlo ovunque che possa essere un luogo completamente autonomo in cui possiamo utilizzare cluster exadata ed exascale. possiamo effettivamente farlo. non è stato tecnicamente facile, ma ce l’abbiamo fatta.

facendo ciò e riducendo i nostri data center oracle, ho menzionato prima che tutti i nostri data center sono uguali tranne che per le dimensioni.il data center più grande in questo momento è di 800 gigawatt, vicino a 800 megawatt, scusate, siamo più vicini a 1 gigawatt. il data center più piccolo è di circa 150 kilowatt, scenderemo a 50 kilowatt. ciò significa che avremo molte aziende, medie e grandi aziende, che decideranno di avere un oracle private cloud. voglio dire, non c'è ancora alcuna differenza tra il nostro cloud privato e il nostro cloud pubblico. sono gli stessi. sono esattamente gli stessi. molte persone dispongono di oracle private cloud e molte aziende industriali come vodafone dispongono di sei oracle private cloud per eseguire i propri carichi di lavoro. ma sono diventati così economici che chiunque può decidere, okay, voglio passare al cloud. desidero usufruire di tutti i vantaggi del cloud, ma voglio assicurarmi di essere l'unico nel cloud. non voglio vicini o voglio solo vicini approvati.non voglio che nessuno si trasferisca con una carta di credito. sono solo paranoico riguardo alla sicurezza perché devo rispettare le normative governative.

quindi riteniamo che sia chiaro che utilizzare i database oracle su aws, microsoft e google sia molto importante. safra ha ragione, voglio dire, questo accelererà assolutamente la crescita del database nel cloud pubblico. ma prevediamo che i cloud privati ​​supereranno in modo significativo i cloud pubblici poiché le aziende decideranno di mettere oracle cloud dietro i firewall nei data center senza vicini. e poiché disponiamo già del nostro data center, il nostro data center è molto automatizzato, scalabile e funzionale e siamo molto organizzati. quindi, in realtà, ora abbiamo 162 data center. mi aspetto che avremo 1.000 o 2.000 o più data center, data center oracle in tutto il mondo, molti dei quali saranno dedicati a singole banche, società di telecomunicazioni o società tecnologiche, o cosa avete, cloud nazionale, sovrano, e tutte queste altre cose . quindi pensiamo che sia difficile per me prevedere quale sarà il cloud più grande, il cloud privato o quello pubblico? non ne ho idea.

ma la buona notizia è che, in ogni caso, vinceremo.

analista:ciao, sono mark moerdler di bernstein. grazie mille e congratulazioni per il trimestre. questo trimestre e questa guida sono entrambi davvero impressionanti. vediamo molta attenzione all'addestramento del modello, ma meno alle applicazioni e all'inferenza altrove. hai una vasta esperienza nel mercato e nel settore. hai integrato l'intelligenza artificiale tradizionale in tutti i prodotti e le funzionalità oracle. ma dove vedi il valore monetizzabile di genai in termini di applicazioni? quanto tempo pensi che ci vorrà affinché l’intelligenza artificiale generativa diventi un flusso di entrate significativo, non solo per oracle ma per il software in generale, dal lato delle applicazioni anziché da quello della formazione? grazie

ellison:cominciamo con l’assistenza sanitaria, aiutiamo i medici a diagnosticare diverse malattie. quando qualcuno va a fare un'ecografia, vedo infermieri, tecnici e medici che misurano il cranio del bambino, misurano il midollo spinale del bambino, per vedere - è ridicolo. i computer dovrebbero fare tutto questo. se c'è un cordone ombelicale avvolto attorno al feto, il computer dovrebbe rilevarlo e registrarlo ora. i medici possono ottenere aiuto dai computer per fare tutto questo. controllando la placca e le arterie coronarie, tutto dovrebbe essere fatto in questo modo.

abbiamo fatto in modo che quando il medico visita un paziente, quando si prepara a vederlo, prepariamo un riepilogo per il medico. usiamo l’intelligenza artificiale per esaminare le cartelle cliniche elettroniche per vedere gli ultimi risultati dei test di laboratorio di poche ore fa. e comunica al medico se la condizione è stabile o in progressione o qualsiasi informazione che il medico deve sapere prima della consultazione.questo riepilogo è creato dall'intelligenza artificiale ed è un riepilogo leggibile dall'uomo. l’ia ascolta quindi la consultazione tra il medico e il paziente. questo è stato consegnato. questo esiste già. consegnano: ascoltano le consultazioni medico-paziente. se un medico scrive una prescrizione, l’ia controlla che la prescrizione sia accurata e la inserisce. l’intelligenza artificiale aggiorna le cartelle cliniche elettroniche. l'intelligenza artificiale trascrive e distribuisce gli ordini del medico, il tutto ascoltando la conversazione. al termine della conversazione il medico dispone quindi di una bozza che può rivedere e approvare rapidamente.vengono quindi dispensate le prescrizioni, eseguite le prescrizioni mediche e aggiornate le cartelle cliniche elettroniche. stiamo già facendo tutte queste cose. ma potrei continuare. nel settore sanitario abbiamo bisogno di molte cose, dalla lettura dei raggi x alle interfacce utente.

la nostra interfaccia utente è molto diversa dall'interfaccia utente di epic. una volta ho portato mio figlio a stanford e ci sono volute tre persone, tre posizioni diverse, per trovare la sua radiografia. ecco come trovi la radiografia di larry ellison. oracolo, per favore, mostrami l'ultima radiografia di larry ellison. questa è un'interfaccia vocale. basta chiedere loro. come accedi? bene, guardi il computer e riconosce il tuo viso. riconosce la tua voce, sa che sei un medico e hai il permesso di visualizzarla, e tutta l'autorizzazione avviene tramite l'intelligenza artificiale.

questa è tutta intelligenza artificiale, e so che la gente pensa che sia una cosa separata, e ho sentito molte persone dire che ora abbiamo agenti ia che verranno addebitati separatamente. ma penso che le nostre applicazioni saranno principalmente applicazioni di intelligenza artificiale e come si fa a far pagare tutto separatamente? non lo so davvero. mentre li ascoltavo ero confuso. non capisco di cosa stanno parlando. vorrei sapere una cosa e mi fermo qui.

analista:sono derrick wood del td cowen. voglio anche congratularmi con te per gli enormi progressi che hai fatto in termini di crescita negli ultimi trimestri. puoi illustrarci il tuo punto di vista sulla disponibilità delle forniture e sulla tua capacità di configurare l'infrastruttura del data center in modo efficiente per passare dalla contrattazione al consumo e convertire il ritardo in entrate? mi chiedo, cosa stai facendo di diverso oggi rispetto a un anno fa e puoi provare ad aiutarmi a fornire quei punti temporali di accelerazione?

ellison:i nostri cloud privati ​​sono esattamente uguali ai cloud pubblici, con la differenza che potrebbero avere un solo tenant e potrebbero trovarsi in un edificio di tua proprietà. a parte questo, sono esattamente gli stessi. possediamo l'hardware. gestiamo l'hardware per te. capita di essere in un edificio di tua proprietà e solo tu puoi entrare. quindi è molto diverso da quello che fanno tutti i nostri concorrenti ed è completamente automatizzato.

pertanto, siamo pronti a gestire migliaia di data center. a proposito, lo paragonerei allo starlink di elon musk, penso che abbia quasi 7.000 satelliti nel cielo in questo momento, 6.800. come riuscite? questi satelliti sono in costante manovra. non sono satelliti geostazionari. sono satelliti in orbita terrestre bassa. quindi continuano a volare e a cambiare posizione. come gestisci 7.000 veicoli spaziali volanti? bene, lascia che te lo dica, il computer deve essere completamente automatizzato altrimenti non funzionerà.

direi che non si possono avere migliaia o addirittura centinaia di data center, ma certamente si possono avere migliaia di data center a meno che non siano completamente automatizzati. e l’unico modo per automatizzarlo è renderli tutti uguali. non puoi automatizzare 25 cose diverse. quindi questo è un aspetto.

un'altra cosa che vorrei sottolineare, e penso che una delle cose interessanti di oracle, è che alcune delle persone più senior del nostro team di gestione sono esperti in edifici, centrali elettriche e sistemi di trasmissione di energia. perché questo è costruire questi data center. non puoi semplicemente costruire un data center. bisogna considerare anche l'energia e il suo trasporto dal luogo in cui viene generata al data center.

naturalmente, il modo più efficiente per farlo è costruire centrali elettriche accanto ai data center. in questo modo è possibile trasmettere i dati sulla distanza più breve. in realtà abbiamo persone molto anziane che provengono dal settore dei servizi di pubblica utilità e, per quanto strano possa sembrare, sono esperti in questo e ci aiutano a costruire questi enormi progetti.

ancora una volta, ascolterò elon musk. uno dei lavori più difficili che ha svolto durante la costruzione della tesla è stato la costruzione della fabbrica di austin, dove ha dovuto costruire l'edificio più grande mai costruito dall'uomo.vuoi conoscere gli edifici più grandi mai costruiti? certamente non il pentagono. né è l’edificio dello space shuttle della nasa. l'edificio più grande è la fabbrica tesla.quindi devi essere un appaltatore per quell'impianto. devi essere in grado di costruire queste cose e poi usare i robot per costruire le tue auto.

quindi devi costruire l'edificio, accendere la corrente, configurare tutti i sistemi di automazione, che è la parte più difficile della costruzione di un cloud o di un sistema di automazione degli edifici, configurare tutti i sistemi di automazione in modo che funzionino in modo efficiente, affidabile e conveniente. in modo efficace. detto questo, qui abbiamo delle persone molto interessanti con una base di esperienze molto diversa rispetto a cinque anni fa.