berita

DeepSeek "Price Butcher" meluncurkan perang harga model besar lainnya kali ini.

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Reporter Berita Jiemian |

Antarmuka Editor Berita |

DeepSeek, model besar “tukang daging harga”, sekali lagi meluncurkan potongan harga yang besar.

Baru-baru ini, perusahaan mengumumkan bahwa biaya masukan API akan disesuaikan menjadi 0,1 yuan/juta token dan biaya keluaran akan menjadi 2 yuan/juta token. Artinya, harga API model besar akan diturunkan beberapa kali lipat.

Menyelidiki alasan penurunan harga, DeepSeek menjelaskan bahwa dalam skenario penggunaan API model besar, sebagian besar masukan pengguna diulang. Misalnya, kata-kata cepat pengguna sering kali memiliki beberapa bagian yang dikutip berulang kali, atau dalam beberapa putaran dialog, konten dari putaran sebelumnya harus dimasukkan berulang kali di setiap putaran.

Menanggapi masalah di atas, DeepSeek memungkinkan solusi menggunakan teknologi caching hard disk kontekstual untuk menyimpan konten dalam cache yang diharapkan dapat digunakan kembali di masa mendatang dalam susunan hard disk terdistribusi. Jika ada duplikat pada input, bagian duplikat tersebut hanya perlu dibaca dari cache tanpa perhitungan. Hal ini pula yang menjadi alasan penurunan harga model besar kali ini.

DeepSeek menunjukkan bahwa teknologi caching hard disk kontekstual tidak hanya dapat mengurangi latensi layanan, namun juga secara signifikan mengurangi biaya penggunaan akhir.

DeepSeek juga merupakan produsen model besar pertama di dunia yang menggunakan caching hard disk dalam skala besar dalam layanan API. Hal ini terutama disebabkan oleh struktur MLA yang diusulkan oleh DeepSeekV2 - sekaligus meningkatkan efek model, ini sangat memampatkan ukuran konteks KVCache, yang sangat mengurangi bandwidth transmisi dan kapasitas penyimpanan yang diperlukan untuk penyimpanan, sehingga dapat di-cache dengan biaya rendah hard disk.

Selain itu, layanan DeepSeekAPI dirancang dengan kapasitas harian sebesar 1 triliun, dan tidak ada batasan saat ini atau konkurensi bagi pengguna.

Ini bukan pertama kalinya perusahaan memangkas harga. Sejak Mei tahun ini, pengganggu DeepSeek telah memimpin peluncuran perang harga API.

Pada awal tanggal 25 April, DeepSeek memberi harga API sebesar 1 yuan/juta token masukan dan 2 yuan/juta token keluaran. Pada tanggal 6 Mei, DeepSeek merilis open sourceKementerian Lingkungan HidupModel ini memiliki parameter yang lebih rendah dan kemampuan yang lebih kuat. API dikurangi menjadi 1 yuan/juta token masukan dan 2 yuan/juta token keluaranGPT Seperseratus dari 4 Turbo.

Pemotongan harga ini dengan cepat memicu tanggapan dari seluruh industri, dengan Zhipu AI, Huoshan Engine, Baidu, Tencent, Alibaba Cloud, dll. mengumumkan pemotongan harga satu demi satu.

Diantaranya, Alibaba Cloud mengumumkan bahwa model inti Qwen-Long dari Tongyi Qianwen telah turun sebesar 97%, dan harga setelah pengurangan hanya 0,0005 yuan/ribu token. Baidu dan Tencent berturut-turut mengumumkan bahwa beberapa model besar gratis.

Dan di luar negeri,Buka AISetelah GPT 4o dirilis, diumumkan bahwa GPT 4o dapat digunakan secara gratis dan harga panggilan API akan dikurangi setengahnya.

Perlu dicatat bahwa pada acara Volcano Engine pada tanggal 15 Mei, Tan Dai, presiden Volcano Engine, mengumumkan bahwa harga model universal bean bag pro-32k hanya 0,0008 yuan/ribu token spesifikasi yang sama di pasaran umumnya 0,12 yuan/ Ribuan token 150 kali lipat harga model bean bag. Penetapan harga model bean bag 99,3% lebih murah dibandingkan industri, sehingga mendorong harga model besar memasuki "era centi".

Tan Dai menunjukkan bahwa pengurangan biaya adalah salah satu faktor kunci dalam mempromosikan model besar untuk maju ke "tahap penciptaan nilai". Harga model besar akan membantu perusahaan mempercepat inovasi bisnis dengan biaya lebih rendah.

Pada saat itu, orang dalam Volcano Engine mengatakan kepada Jiemian News: "Alasan sebenarnya dari penurunan harga model besar Doubao adalah karena penerapan model besar di sisi perusahaan belum dikembangkan, dan skenario yang ada terlalu sedikit." menunjukkan bahwa meskipun industri sedang mendiskusikan penggunaan model besar AI untuk merekonstruksi bisnis, namun dalam pekerjaan dan kehidupan sehari-hari, penerapan kemampuan model besar jarang terlihat. “Penurunan harga pada dasarnya menurunkan ambang batas penggunaan.”

Dari sudut pandang penurunan, penurunan harga input umumnya lebih tinggi dibandingkan penurunan harga output. Sebagian besar produk dengan harga lebih murah adalah versi model ringan, yang hanya cocok untuk penggunaan jangka pendek oleh perusahaan kecil dan menengah dan pengembang individu dengan frekuensi rendah, sejumlah kecil penalaran, dan tugas sederhana.

Secara keseluruhan, model-model besar masih dalam tahap budidaya pasar. Saat ini, penurunan harga API lebih merupakan strategi akuisisi pelanggan bagi produsen model besar untuk memungkinkan lebih banyak perusahaan mengakses skenario bisnis mereka sendiri, mempromosikan penerapan model besar di berbagai industri, dan lebih mempercepat komersialisasi. Inisiatif ini membantu menarik pengembang dan mitra, dengan cepat membangun ekosistem, dan juga memberikan ruang yang lebih luas untuk aplikasi inovatif di berbagai bidang.

Mengurangi harga atau menjadikannya gratis berarti memungkinkan lebih banyak perusahaan dan pengembang dengan cepat menggunakan model besar. Bagaimanapun, mengizinkan lebih banyak orang untuk berpartisipasi merupakan prasyarat untuk pengembangan industri.

Namun, jelas sulit untuk menyelesaikan siklus tertutup komersialisasi model besar hanya dengan mengandalkan bisnis API. “Tidak ada perusahaan model besar yang bertahan dengan menjual API.” Seorang FA (konsultan keuangan) yang sebelumnya menaruh perhatian pada industri model besar mengatakan kepada Jiemian News.

Fu Sheng, ketua dan CEO Cheetah Mobile, juga percaya bahwa pemotongan harga yang besar pada dasarnya menyatakan bahwa startup berskala besar harus menemukan model bisnis baru. Perusahaan yang mengalami penurunan paling parah adalah perusahaan besar dengan layanan cloud, yang menggunakan model besar untuk mengakuisisi pelanggan cloud. "Wolnya berasal dari babi, jadi Anda mampu menanggung pengurangan tersebut." ekosistem dan harus mencari model bisnis lain.

Berbeda dengan pemotongan harga putaran pertama, dalam menghadapi perang harga yang diprakarsai oleh DeepSeek, banyak perusahaan model besar yang belum menindaklanjutinya, dan hanya sedikit yang memberikan komentar yang relevan. Namun, penurunan harga lainnya menunjukkan bahwa era inklusif model besar akan segera tiba, dan ekosistem aplikasi vertikal diperkirakan akan terus berkembang.