notizia

alibaba cloud taglia ancora i prezzi, perché le grandi modelle non hanno ancora fretta di “regolare i conti”?

2024-09-19

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

"gratis" e "riduzione dei prezzi"... il 19 settembre, alla conferenza yunqi del 2024, alibaba cloud ha rilasciato una serie di prodotti e ha annunciato una nuova tornata di riduzioni dei prezzi "alibaba cloud lavorerà duramente per continuare a ridurre i costi". lo hanno detto wu yongming, ceo di alibaba group, presidente e ceo di alibaba cloud intelligence group.
dietro questo, per i fornitori di cloud, il settore è ancora nelle fasi iniziali della rivoluzione agi e “l’ondata di riduzione dei prezzi” dei modelli di grandi dimensioni non mostra segni di fine.
"nell'ultimo periodo, il costo dell'inferenza del modello è diminuito in modo esponenziale, superando di gran lunga la legge di moore. nell'ultimo anno, il prezzo delle chiamate dell'api tongyi qianwen su alibaba cloud bailian è diminuito del 97% e il costo delle chiamate per un milione di token è sceso ai 5 centesimi più bassi", ha rivelato wu yongming nel suo discorso della mattina del 19 settembre.
nel pomeriggio dello stesso giorno, il costo minimo delle chiamate di alibaba cloud qwen-turbo per un milione di token è stato nuovamente aggiornato a 30 centesimi. zhou jingren, chief technology officer di alibaba cloud intelligence group, ha annunciato il prezzo di qwen-turbo sono diminuiti dell'85%, i prezzi di qwen-plus e qwen -max sono stati ridotti rispettivamente dell'80% e del 50% e alibaba cloud ha avviato una nuova serie di riduzioni dei prezzi.
allo stesso tempo, alibaba cloud ha anche rilasciato una nuova generazione del modello open source qwen2.5. anche il suo modello di linguaggio visivo qwen2-vl-72b è ufficialmente open source. può riconoscere immagini con diverse risoluzioni e proporzioni e comprendere video più lunghi 20 minuti. anche il modello di punta di alibaba cloud tongyi, qwen-max, ha ricevuto un aggiornamento completo. zhou jingren ha affermato che le sue prestazioni sono vicine a gpt-4o. i modelli in background del sito web ufficiale tongyi e dell'app tongyi sono stati convertiti in qwen-max, "continua fornire servizi gratuiti a tutti gli utenti." fornire servizi". inoltre, zhou jingren ha anche annunciato un aggiornamento completo di tongyi wanxiang e ha rilasciato un nuovo modello di generazione video. questo strumento di produzione video ai è completamente gratuito e "l'app è aperta per un uso illimitato ogni giorno".
dietro la serie di azioni di alibaba cloud, un fenomeno è che pagare denaro per attirare traffico e attrarre nuovi clienti è ancora la norma nel grande settore dei modelli.
"l'open source e la riduzione dei prezzi si basano tutti sulla stessa logica, come sviluppare l'ecosistema", ha detto zhou jingren in un'intervista ai giornalisti. ha affermato che dallo scorso anno alibaba cloud si è impegnata fermamente nell'open source. nell'ultimo anno, alibaba cloud ha visto la costruzione ecologica di modelli funzionare oltre le aspettative e i modelli di grandi dimensioni non sono più superiori. a metà settembre 2024, i download cumulativi del modello open source tongyi qianwen hanno superato i 40 milioni.
zhou jingren ha affermato che ogni riduzione dei prezzi di alibaba cloud è passata attraverso discussioni interne molto serie. oltre ai costi, i fornitori di cloud devono valutare lo sviluppo dell’intero settore, il feedback degli sviluppatori e degli utenti aziendali e ottenere ulteriori riduzioni dei costi futuri attraverso economie di scala, progresso tecnologico e pianificazione delle risorse. in una prospettiva di sviluppo a lungo termine, le capacità dei modelli di grandi dimensioni devono essere accessibili a tutti, stimolando così una maggiore innovazione a livello industriale. wu yongming ha anche affermato nel suo discorso che il costo dell'inferenza del modello è una questione chiave che influenza l'esplosione delle applicazioni.
"si dice che l'intelligenza artificiale odierna equivalga a internet intorno al 1996, cioè nell'era bbs, le tariffe di accesso a internet erano molto costose a quel tempo. successivamente, con lo sviluppo di internet, compreso lo sviluppo di internet mobile, gli operatori hanno investito vigorosamente nella costruzione di infrastrutture e le tariffe del traffico sono diminuite. "giù." zhang qi, vicepresidente di alibaba cloud, ha affermato che alibaba cloud sta costruendo freneticamente infrastrutture ai solo abbassando le tariffe si potrà discutere dell'esplosione delle future applicazioni l'obiettivo a lungo termine è ciò che alibaba cloud considera di più. la domanda è: "piuttosto che dire che dobbiamo calcolare un conto oggi e quanti soldi possiamo guadagnare immediatamente".
poiché la riduzione del prezzo dei modelli di grandi dimensioni erode il profitto lordo o addirittura il profitto lordo negativo, qual è il risultato finale della riduzione del prezzo dei modelli di grandi dimensioni? a questo proposito, zhou jingren ha affermato che la riduzione dei prezzi di alibaba cloud avviene principalmente attraverso l'ottimizzazione della tecnologia. non solo la rapida iterazione del modello stesso, ma anche l'efficienza di inferenza del modello e l'ottimizzazione strutturale vengono eseguite simultaneamente per promuovere un'ulteriore riduzione del modello. costi di inferenza. alibaba cloud dobbiamo trasferire i dividendi della tecnologia ai clienti aziendali per promuovere lo sviluppo dell'intero settore.
"ci rendiamo anche conto che l'applicazione dei modelli odierni, comprese le varie innovazioni nei modelli, è ancora nelle sue fasi iniziali. in questo momento, se mettiamo il ragionamento del modello in una fase costosa, un gran numero di sviluppatori non sarà in grado per renderlo efficace, utilizzarlo in lotti o su larga scala influenzerà anche l’attenzione di tutti (sulla riforma dell’agi) in una certa misura”, ha detto zhou jingren.
(questo articolo proviene da china business news)
segnalazione/feedback