notizia

"La funzione più potente e il basso costo"! OpenAI rilascia GPT-4o mini per partecipare alla competizione dei modelli piccoli

2024-07-19

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

OpenAI ha lanciato "GPT-4o mini" giovedì, ora della costa orientale degli Stati Uniti, entrando nella competizione dei modelli AI "piccoli ma raffinati". Ha definito questo nuovo modello "il modello più potente ed economico" e prevede di integrare immagini, video e audio in futuro.

Più economico del 60% rispetto a GPT-3.5 Turbo e le prestazioni della chat sono migliori rispetto ai prodotti concorrenti

La società ha affermato che GPT-4o mini è disponibile per gli utenti gratuiti di ChatGPT, per gli abbonati a ChatGPT Plus e Teams a partire da giovedì e sarà disponibile per gli utenti aziendali di ChatGPT la prossima settimana. GPT-4o mini sostituirà il vecchio modello GPT-3.5 Turbo in ChatGPT. OpenAI ha affermato che GPT-4o mini costa 15 centesimi per milione di token di input e 60 centesimi per milione di token di output, rendendolo più economico di oltre il 60% rispetto a GPT-3.5 Turbo.

La società ha inoltre affermato che il nuovo modello attualmente supera il modello GPT-4 nelle preferenze della chat e ha ottenuto un punteggio dell’82% nel massiccio test MMLU (Multi-task Language Understanding). Secondo i resoconti dei media, MMLU è un punto di riferimento per l'intelligenza testuale e il ragionamento utilizzato per valutare le capacità del modello linguistico. Un punteggio MMLU più alto indica una migliore comprensione e uso del linguaggio in una varietà di domini, migliorandone l’applicazione nel mondo reale.

Secondo i dati OpenAI, il modello mini GPT-4o ha ottenuto l'82%, un valore superiore rispetto agli altri due concorrenti a basso costo, Gemini Flash di Google ha ottenuto il 77,9% e Claude Haiku di Anthropic il 73,8%.

Tra i modelli più grandi, GPT-3.5 ha ottenuto il 70% in questo test, GPT-4o l'88,7% e Google afferma che il suo Gemini Ultra ha ottenuto il punteggio più alto di sempre, pari al 90%.

L’analisi suggerisce che i modelli linguistici più piccoli richiedono meno potenza di calcolo per essere eseguiti, rendendoli un’opzione più conveniente per le aziende con risorse limitate per implementare l’intelligenza artificiale generativa.

Inoltre, questo nuovo modello leggero supporterà anche funzionalità testuali e visive nell’API e OpenAI afferma che presto gestirà tutti gli input e output multimodali come video e audio. Con queste funzionalità, potrebbe potenzialmente agire come un assistente virtuale più potente, in grado di comprendere il tuo itinerario di viaggio e formulare raccomandazioni. Tuttavia, questo modello attualmente può essere utilizzato principalmente solo per compiti semplici.

La concorrenza per i modelli di intelligenza artificiale “piccoli ma raffinati” è feroce e OpenAI finalmente entra in gioco

Secondo i resoconti dei media, la valutazione di OpenAI, sostenuta da Microsoft, ha superato gli 80 miliardi di dollari. Anche se occupa ancora una posizione di leadership nel mercato dell'intelligenza artificiale generativa, l'azienda si trova ad affrontare una crescente pressione competitiva. OpenAI deve anche trovare modi per fare soldi, poiché l’azienda spende molti soldi in processori e infrastrutture per costruire e addestrare i suoi modelli.

Tuttavia, molte aziende non possono permettersi modelli più grandi e costosi, quindi i modelli leggeri ed economici potrebbero essere più popolari. Fino ad allora, molti sviluppatori avrebbero scelto Claude 3 Haiku o Gemini 1.5 Flash piuttosto che pagare gli elevati costi computazionali necessari per eseguire i modelli più potenti. Ad esempio, un modello più piccolo può essere più adatto per automatizzare attività di base a volume elevato, mentre un modello più grande può gestire lavori più complessi. Alcuni sviluppatori potrebbero voler utilizzare entrambi i modelli in un'unica applicazione.

Olivier Godement, responsabile del prodotto API di OpenAI, ha spiegato in un'intervista ai media perché l'azienda non è riuscita a lanciare prima modelli di intelligenza artificiale "piccoli e raffinati". Ha affermato che questa era puramente una questione di "priorità" perché OpenAI si concentrava sulla creazione di modelli più grandi e migliori i modelli, come GPT-4, richiedono notevoli risorse umane e computazionali. Nel corso del tempo, OpenAI ha notato che gli sviluppatori diventavano sempre più desiderosi di utilizzare modelli più piccoli, quindi l'azienda ha deciso che era giunto il momento di investire risorse nello sviluppo di GPT-4o Mini.

"La nostra missione è creare la tecnologia più all'avanguardia e creare le applicazioni più potenti e utili, e speriamo sicuramente di continuare a creare modelli all'avanguardia e promuovere il progresso tecnologico", ha affermato Olivier Godement, responsabile del prodotto API di OpenAI, in un'intervista a i media. "Ma vogliamo anche avere il miglior piccolo modello e penso che sarà molto popolare."

"Penso che GPT-4o Mini incarni davvero la missione di OpenAI di rendere l'intelligenza artificiale più accessibile. Se vogliamo che l'intelligenza artificiale porti benefici in ogni angolo del mondo, in ogni settore e in ogni applicazione, dobbiamo rendere l'intelligenza artificiale più accessibile, Direttore Olivier, dei prodotti della piattaforma API di OpenAI Godement ha detto ai media.

GPT-4o mini aiuta i dipendenti a concentrarsi

Godement ha detto che alcuni sviluppatori hanno testato il modello la scorsa settimana.

OpenAI ha chiesto alla startup fintech Ramp di testare il modello, utilizzando GPT-4o Mini per creare uno strumento che estragga i dati di spesa dalle ricevute. Pertanto gli utenti possono caricare le foto delle loro ricevute e il modello organizzerà i dati per loro. Anche il client di posta Superhuman ha testato GPT-4o Mini e lo ha utilizzato per creare una funzionalità che suggerisce automaticamente le risposte alle email.

Inizialmente, GPT-4o mini sarà in grado di elaborare e generare testo e immagini. Una volta completata la versione finale, OpenAI afferma che sarà in grado di gestire altri tipi di contenuti.

OpenAI ha anche affermato che GPT-4o mini è il primo modello di intelligenza artificiale dell'azienda a utilizzare la sua nuova politica di sicurezza "gerarchia delle istruzioni". Lo scopo di questo approccio è fare in modo che i sistemi di intelligenza artificiale diano priorità a determinate istruzioni, come quelle provenienti dalle aziende, per rendere più difficile per le persone far sì che lo strumento faccia qualcosa che non dovrebbe fare.

L'analisi ritiene che il mini modello GPT-4o faccia parte dell'impegno di OpenAI verso la "multimodalità", ovvero fornire un'ampia gamma di media generati dall'intelligenza artificiale (come testo, immagini, audio e video) in un unico strumento: ChatGPT.

L’anno scorso, il COO di OpenAI Brad Lightcap ha dichiarato ai media:

"Il mondo è multimodale. Se pensi al modo in cui noi come esseri umani elaboriamo e interagiamo con il mondo, vediamo cose, sentiamo cose, parliamo: il mondo non è solo testo. Quindi, per noi, ci sono solo testo e codice come Una singola modalità, una singola interfaccia, sembra sempre incompleta perché la potenza di questi modelli e ciò che possono fare è molto di più”.