berita

alibaba cloud kembali memangkas harga, mengapa model besar masih tidak terburu-buru untuk "menyelesaikan rekening"?

2024-09-19

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

"gratis" dan "pengurangan harga"... pada tanggal 19 september, di konferensi yunqi 2024, alibaba cloud merilis sejumlah produk dan mengumumkan babak baru pengurangan harga. "alibaba cloud akan bekerja keras untuk terus mengurangi biaya." ceo alibaba group, ketua dan ceo alibaba cloud intelligence group wu yongming mengatakan demikian.
di balik hal ini, bagi vendor cloud, industri ini masih dalam tahap awal revolusi agi, dan "gelombang penurunan harga" model-model besar tidak menunjukkan tanda-tanda akan berakhir.
“pada periode lalu, biaya inferensi model telah turun secara eksponensial, jauh melebihi hukum moore. pada tahun lalu, harga panggilan api tongyi qianwen di alibaba cloud bailian telah turun sebesar 97%, dan biaya panggilan untuk satu juta token telah turun ke level terendah 5 sen." wu yongming mengungkapkan dalam pidatonya pada pagi hari tanggal 19 september.
pada sore hari di hari yang sama, biaya panggilan minimum alibaba cloud qwen-turbo untuk satu juta token sekali lagi diperbarui menjadi 30 sen. zhou jingren, chief technology officer alibaba cloud intelligence group, mengumumkan harga qwen-turbo turun sebesar 85%, harga qwen-plus dan qwen -max masing-masing dipotong sebesar 80% dan 50%, dan alibaba cloud memulai babak baru pemotongan harga.
pada saat yang sama, alibaba cloud juga merilis model open source generasi baru qwen2.5. model bahasa visualnya qwen2-vl-72b juga secara resmi open source. ia dapat mengenali gambar dengan resolusi dan rasio aspek berbeda serta memahami video lebih lama 20 menit. model andalan alibaba cloud tongyi, qwen-max, juga telah menerima peningkatan menyeluruh. zhou jingren mengatakan bahwa kinerjanya mendekati gpt-4o. model latar belakang situs resmi tongyi dan tongyi app telah dialihkan ke qwen-max, "lanjutnya untuk memberikan layanan gratis kepada semua pengguna." memberikan layanan". selain itu, zhou jingren juga mengumumkan peningkatan menyeluruh pada tongyi wanxiang dan merilis model pembuatan video baru. alat produksi video ai ini sepenuhnya gratis dan "aplikasi terbuka untuk penggunaan tanpa batas setiap hari."
di balik serangkaian tindakan alibaba cloud, salah satu fenomenanya adalah membayar uang untuk menarik lalu lintas dan menarik pelanggan baru masih menjadi hal yang lumrah dalam industri model besar.
"open source dan pengurangan harga semuanya didasarkan pada logika yang sama, bagaimana mengembangkan ekosistem." kata zhou jingren dalam sebuah wawancara dengan wartawan. dia mengatakan bahwa sejak tahun lalu, alibaba cloud telah berkomitmen kuat terhadap open source. pada tahun lalu, alibaba cloud telah melihat konstruksi ekologis dari model-model tersebut bekerja melebihi ekspektasi, dan model-model besar tidak lagi unggul. pada pertengahan september 2024, unduhan kumulatif model sumber terbuka tongyi qianwen telah melampaui 40 juta.
zhou jingren mengatakan setiap penurunan harga alibaba cloud telah melalui diskusi internal yang sangat serius. selain biaya, vendor cloud harus mempertimbangkan perkembangan seluruh industri, masukan dari pengembang, dan pengguna perusahaan, dan mencapai pengurangan biaya lebih lanjut di masa depan melalui skala ekonomi, kemajuan teknologi, dan penjadwalan sumber daya. dari perspektif pembangunan jangka panjang, kemampuan model-model besar harus terjangkau oleh semua orang, sehingga merangsang lebih banyak inovasi di tingkat industri. wu yongming juga mengatakan dalam pidatonya bahwa biaya inferensi model adalah masalah utama yang mempengaruhi ledakan aplikasi.
“ada pepatah yang mengatakan bahwa ai saat ini setara dengan internet sekitar tahun 1996, yaitu pada era bbs, tarif akses internet saat itu sangat mahal. nanti dengan berkembangnya internet, termasuk berkembangnya internet seluler, operator dengan penuh semangat berinvestasi dalam pembangunan infrastruktur, dan tingkat lalu lintas turun. zhang qi, wakil presiden alibaba cloud, mengatakan bahwa alibaba cloud juga dengan panik membangun infrastruktur ai. hanya dengan menurunkan tarif kita dapat membahas ledakan aplikasi di masa depan tujuan jangka panjang adalah hal yang lebih dipertimbangkan oleh alibaba cloud. pertanyaannya adalah, "daripada mengatakan bahwa kita harus menghitung akun hari ini dan berapa banyak uang yang dapat kita peroleh dengan segera."
ketika penurunan harga model besar mengikis laba kotor atau bahkan laba kotor negatif, apa inti dari penurunan harga model besar? dalam hal ini, zhou jingren mengatakan bahwa penurunan harga alibaba cloud terutama melalui optimalisasi teknologi. tidak hanya iterasi cepat dari model itu sendiri, tetapi efisiensi inferensi model dan optimalisasi struktural juga dilakukan secara bersamaan untuk mendorong pengurangan model lebih lanjut. biaya inferensi. alibaba cloud kita harus mentransfer dividen teknologi kepada pelanggan korporat untuk mendorong perkembangan seluruh industri.
“kami juga menyadari bahwa penerapan model saat ini, termasuk berbagai inovasi model, masih dalam tahap awal. saat ini, jika kita menempatkan penalaran model pada tahap yang mahal, sejumlah besar pengembang tidak akan mampu. secara efektif, menggunakannya dalam jumlah banyak atau dalam skala besar juga akan mempengaruhi perhatian semua orang (terhadap reformasi agi) sampai batas tertentu,” kata zhou jingren.
(artikel ini berasal dari china business news)
laporan/umpan balik