berita

Apa persaingan sumber terbuka dan tertutup untuk model besar?

2024-08-14

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina




Perselisihan tidak dapat menyangkal nilai pasar satu sama lain. Kedua kebutuhan pasar tersebut akan hidup berdampingan dalam jangka waktu yang lama.



Teks |. Wu Junyu Xu Wenpu

Editor|Xie Lilong

Sejak tahun ini, para wirausahawan, investor, dan wirausahawan di industri AI (kecerdasan buatan) di Tiongkok dan Amerika Serikat secara bersamaan memulai perdebatan: apakah model besar harus berupa sumber terbuka atau sumber tertutup.
Di Tiongkok, tokoh yang menjadi pusat kontroversi adalah pendiri Baidu, Robin Li. Pada bulan April tahun ini, dia secara terbuka menyatakan, "Semua orang dulu menggunakan open source dan menganggap open source itu murah. Faktanya, dalam skenario model skala besar, open source adalah yang paling mahal. Model open source akan semakin terbelakang." Penentangan terhadap pandangan ini tidak ada habisnya. Penentangnya termasuk CTO (Chief Technology Officer) Alibaba Cloud Zhou Jingren,Intelijen BaichuanCEO Wang Xiaochuan dan CEO Cheetah Mobile Fu Sheng. Pada bulan Mei tahun ini, Zhou Jingren berkata terus terang dalam sebuah wawancara media, "Tidak ada keraguan bahwa open source berkontribusi terhadap teknologi dan ekologi global. Hal ini telah dibuktikan berkali-kali di seluruh dunia, dan tidak perlu membahasnya lagi."
Di Amerika, perdebatan semakin memanas. Pendiri Tesla, Musk, pernah menggugat startup AIBuka AI. Musk adalah salah satu pendiri dan investor utama OpenAI pada tahun 2015. Dia yakin OpenAI, yang dipimpin oleh CEO saat ini Altman, telah melanggar komitmennya untuk "beroperasi sebagai organisasi nirlaba dan menjadikan AI open source dan open source." Dua investor terkenal di Silicon Valley, Andreessen, pendiri a16z, dan Kosla, pendiri Kleiner Perkins Caufield & Byers, sering kali melakukan konfrontasi di media sosial. Yang pertama percaya bahwa model sumber tertutup akan mengarah pada monopoli raksasa dan melemahkan penelitian akademis. Yang terakhir percaya bahwa model besar adalah senjata ekonomi dan tidak boleh bersifat open source.


Open source adalah model pengembangan perangkat lunak - kode sumber dirilis secara gratis dan bertahan dari sumbangan komunitas. Pengembang dapat dengan bebas mengunduh, memodifikasi, dan mendistribusikan perangkat lunak, melaporkan bug perangkat lunak (kerusakan atau kesalahan perangkat lunak), dan memberikan saran pengoptimalan. Inovasi kolektif ini akan mempercepat iterasi perangkat lunak.Model sumber terbuka mengacu pada model yang bebas digunakan dan telah mempublikasikan rincian teknis seperti parameter model; model sumber tertutup mengacu pada model yang memerlukan pembayaran dan tidak mempublikasikan rincian teknis.Pahami saja, open source berarti gratis, tetapi Anda harus membeli dan memasak makanan sendiri; sumber tertutup berarti membayar, yang setara dengan pergi ke restoran untuk makan, dan Anda bisa mendapatkan layanan yang lebih baik.
Haruskah model besar menjadi open source atau close source? Kepentingan komersial, opini teknis, dan faktor lainnya tercampur aduk, sehingga banyak fakta yang tertukar - namun ada beberapa fakta tertentu di balik perdebatan ini.
Pertama, strategi bisnis yang berbeda memungkinkan perusahaan untuk memilih jalur teknis yang berbeda.Perusahaan seperti Baidu dan OpenAI yang berharap untuk segera mengkomersialkan bisnis model besar telah memilih sumber tertutup yang diandalkan oleh Alibaba Cloud, Meta, dan perusahaan lainkomputasi awanAtau perusahaan dengan bisnis periklanan yang menguntungkan, memilih sumber terbuka untuk memperbesar keuntungannya.
Kedua, permintaan pasar akan open source dan close source akan hidup berdampingan untuk waktu yang lama, dan tidak mungkin untuk menilai mana yang lebih baik.Model sumber terbuka dan sumber tertutup memiliki skenario penerapannya masing-masing, dan model mana yang dipilih terkait dengan permintaan pasar. Hal ini tidak berubah sesuai keinginan produsen model.
Ketiga, terdapat perbedaan mendasar antara model sumber terbuka dan perangkat lunak sumber terbuka.Perangkat lunak sumber terbuka menerbitkan kode sumber dan sebagian besar rincian teknis. Model sumber terbuka lebih seperti kotak hitam teknis gratis - parameter model terbuka, tetapi kode sumber, data pelatihan, proses pelatihan, dan detail teknis lainnya jarang terbuka.

Selain itu, pertarungan antara sumber terbuka dan sumber tertutup di industri AI Tiongkok lebih berkaitan dengan persaingan komersial.Open source tidak mengenal batas, konsep ini telah diakui secara umum. Namun, dalam konteks persaingan yang semakin ketat antara Tiongkok dan Amerika Serikat dalam industri AI, penolakan industri AS terhadap open source semakin keras.

Siapa yang open source dan siapa yang close source?
Pengembangan model besar masih dalam tahap awal dan masih memerlukan trial and error.Sumber terbuka dan sumber tertutup tidak berbeda. Ketika perusahaan menghadapi pertanyaan pilihan ganda tentang sumber terbuka dan sumber tertutup, mereka mengambil tiga jalur berbeda.

Hal yang paling ekstrim adalah hanya melakukan model open source. Hanya ada sedikit perusahaan yang mengambil jalur ini, dan Meta adalah salah satu dari sedikit perusahaan tersebut. Keuntungannya adalah akan menarik lebih banyak pengguna. Masalahnya adalah tidak ada model keuntungan dan hanya perusahaan besar yang mampu membelinya.
Llama 3 milik Meta adalah model open source dengan pengguna terbanyak di dunia. Bisnis utama Meta adalah media sosial (seperti Facebook, Instagram), dengan laba bersih pada tahun 2023 mencapai US$39 miliar. Meta memiliki keinginan untuk mengeksplorasi bisnis baru, namun tidak ada tekanan untuk menghasilkan uang melalui model. Oleh karena itu, mereka hanya dapat melakukan model open source dan tidak mempertimbangkan masalah profitabilitas untuk saat ini.
Jalur tengahnya adalah open source dan close source secara paralel, yang sangat fleksibel. Perusahaan tidak hanya dapat memperoleh pengguna melalui sumber terbuka, tetapi juga memperoleh pendapatan melalui sumber tertutup. Hal ini tidak hanya memberikan ruang bagi pengembang untuk memilih, tetapi juga memungkinkan perusahaan itu sendiri memiliki ruang untuk melakukan kesalahan.
Perusahaan yang memilih jalur ini antara lain Microsoft, Google, Alibaba Cloud, Tencent Cloud, serta startup AI seperti Mistral Al, Zhipu AI, dan Baichuan Intelligence. Praktik umum dalam memparalelkan sumber terbuka dan sumber tertutup adalah dengan menggunakan model sumber terbuka gratis untuk menarik pengguna dan memandu pengguna untuk menggunakan model sumber tertutup yang berukuran lebih besar dan memiliki kinerja lebih kuat. Misalnya, model komersial utama Microsoft adalah seri GPT-4 OpenAI, tetapi model kecil Phi-3 Mini juga menjadi sumber terbuka; Alibaba Cloud telah menjadikan lebih dari sepuluh model sumber terbuka dengan parameter mulai dari 500 juta hingga 110 miliar, dan juga menyediakan sumber daya terbuka. landasan sumber tertutup. Model besar, model industri; Google telah menjadikan rangkaian model kecil Gemma sebagai sumber terbuka, dan juga menyediakan rangkaian model dasar besar Gemini yang bersifat sumber tertutup; kinerja pada generasi sebelumnya dan memandu pengguna membayar untuk menggunakan model dengan kinerja lebih kuat pada generasi ini.
Masalah dengan open source dan close source adalah komersialisasi terkadang melibatkan upaya yang bersaing. Beberapa pelanggan telah menggunakan model sumber terbuka gratis dan tidak lagi menggunakan model sumber tertutup berbayar. Akibatnya, produsen model akan kehilangan sebagian pendapatannya.
Seorang teknisi dari penyedia layanan perangkat lunak AI Tiongkok mengatakan kepada Caijing pada bulan Juli tahun ini bahwa mereka baru-baru ini menggunakan model sumber terbuka Tongyi Qianwen (Qwen2) milik Alibaba Cloud untuk pelatihan sekunder dan penyesuaian guna melayani biro pariwisata kota setempat. Pesanan ini melebihi 10 juta yuan, dan mereka adalah penerima manfaatnya, tetapi Alibaba Cloud tidak memiliki pendapatan. "Caijing" menanyakan tentang perjanjian lisensi Qwen2 di Github (platform hosting kode terbesar di dunia). Perjanjian tersebut menyatakan "Tidak diperlukan permintaan penggunaan komersial." Dengan kata lain, tidak perlu membayar untuk penggunaan komersial setelah Qwen2 dilatih dan disempurnakan.
Nilai jangka panjang dari open source adalah membuat model pasar kue lebih besar. Seseorang dari Alibaba Cloud memberi tahu Caijing bahwa adalah hal yang wajar bagi pengguna untuk memodifikasi model sumber terbuka untuk penggunaan komersial, dan Anda harus siap menghadapi hal ini saat melakukan sumber terbuka. Meskipun Alibaba Cloud belum menguasai keseluruhannya, hal ini telah membuat industri kue menjadi lebih besar. Dalam jangka panjang, hal ini pada akhirnya akan memberikan manfaat. Reaksi kimia hanya akan terjadi jika model besar digunakan secara luas oleh pelanggan yang berbeda seperti pemerintah, perusahaan besar dan menengah, serta pengembang. Industri teladan yang besar perlu membangun ekologi dan membentuk roda gila pertumbuhan. Tren ini terlihat di ModelScope, komunitas open source AI milik Alibaba Cloud. Pada bulan Juli tahun ini, komunitas Moda memiliki lebih dari 5,6 juta pengembang, lebih dari 5.500 model berkualitas tinggi, dan ribuan kumpulan data, menjadikannya komunitas model sumber terbuka terbesar di Tiongkok.
Pandangan yang lebih optimis adalah bahwa open source dan close source bahkan dapat membentuk hubungan hulu dan hilir. Open source berada di hulu teknologi, bertanggung jawab atas partisipasi komunitas, iterasi teknologi, menarik pelanggan, dan memastikan bahwa teknologi berada di depan teknologi sejenisnya. Sumber tertutup berada di hilir dan bertanggung jawab atas realisasi komersial.
Lanzhou Technology adalah perusahaan startup model besar di Tiongkok. Li Jingmei, partner dan co-CEO Lanzhou Technology, mengatakan kepada Caijing bahwa open source adalah strategi teknis dan strategi bisnis. Hal ini dapat berdampak pada komunitas pengembang serta jiwa tim teknis pelanggan potensial. Sumber terbuka dan sumber tertutup tidak bertentangan. Siklus umpan balik pelanggan untuk model sumber tertutup relatif panjang, namun komunitas pengembang model sumber terbuka akan memberikan umpan balik dengan cepat. Hal ini dapat membantu perusahaan melakukan iterasi produk dengan cepat.
Seorang perencana strategis AI di sebuah perusahaan teknologi terkemuka Tiongkok percaya bahwa bagi vendor cloud terkemuka seperti Alibaba Cloud, sumber terbuka dan sumber tertutup secara paralel lebih baik daripada hanya sumber tertutup. Pendapatan Alibaba Cloud terutama berasal dari empat komponen utama cloud publik (komputasi, penyimpanan, jaringan, database). Model sumber terbuka gratis akan mendorong konsumsi data bisnis pelanggan, sehingga mendorong penjualan produk cloud dasar yang disebutkan di atas.
Hanya membuat model sumber tertutup yang merupakan pendekatan yang sederhana, langsung dan logis. Perusahaan besar yang mengambil jalur ini percaya bahwa jika model besar ingin dikomersialkan, model tersebut harus bersifat sumber tertutup, jika tidak, lingkaran komersial tidak dapat ditutup.
Startup AI OpenAI (model seri GPT-4), Amazon (berinvestasi di startup AI Anthropic, yang mencakup model seri Claude 3.5), Huawei (model Pangu), Baidu (model Wenxin) dan perusahaan lain telah memilih jalan ini. Perusahaan yang menggunakan model besar sering kali membayar per panggilan API (antarmuka pemrograman aplikasi), seperti membayar air, listrik, dan gas berdasarkan penggunaan. Model bisnis model sumber tertutup secara teori adalah yang paling sehat. Tingkat pertumbuhan pendapatan Microsoft Azure, Amazon AWS, dan Google Cloud telah meningkat sekitar 5 poin persentase pada tahun lalu, dan tingkat keuntungan mereka juga sedikit meningkat. Hal ini diduga akibat tarikan model yang besar.
Namun di Tiongkok, sulit bagi model sumber tertutup untuk benar-benar menguntungkan dalam jangka pendek. Pada bulan Mei tahun ini, pasar model Tiongkok memulai perang harga. Tujuan penurunan harga adalah untuk merangsang permintaan pelanggan dan memperluas ukuran pasar. Layanan cloud ByteDance, Volcano Engine, Alibaba Cloud, Tencent Cloud, dan Baidu Smart Cloud berturut-turut telah mengurangi harga panggilan model besar hingga lebih dari 90%. Margin laba kotor panggilan model besar turun dari lebih dari 60% menjadi kurang dari 0%.
Seseorang yang bertanggung jawab atas bisnis model besar dari vendor cloud Tiongkok percaya bahwa panggilan model besar telah memasuki "era laba kotor negatif". Semakin banyak Anda menggunakannya, semakin besar kerugian Anda. Bedanya, perusahaan besar seperti Alibaba, ByteDance, dan Baidu mampu menanggung kerugian, namun perusahaan kecil dan menengah serta startup tidak bisa.

Dia dan seorang eksekutif startup model besar mengungkapkan pandangan serupa - perusahaan yang berbeda memiliki gen yang berbeda dan model strategi bisnis yang berbeda. Cloud adalah bisnis inti Alibaba Cloud, dan tujuan akhir model sumber terbuka adalah menjual lebih banyak cloud. Volcano Engine didukung oleh ByteDance, dan bisnis periklanan perusahaan induk dapat ditransfusikan. Pangsa pasar komputasi awan Volcano Engine jauh lebih rendah dibandingkan Alibaba Cloud. "Mereka bertelanjang kaki dan tidak takut memakai sepatu," dan berharap dapat merebut lebih banyak pangsa pasar melalui perang harga. AI adalah bisnis inti Baidu. Baidu berharap dapat menghasilkan uang dari model-model besar, sehingga menekankan nilai model sumber tertutup.

Apa argumennya? Apa konsensusnya?
Ada beberapa fokus dalam perdebatan sumber terbuka dan sumber tertutup di Tiongkok untuk model besar - pertama, apakah ada perbedaan antara model sumber terbuka dan perangkat lunak sumber terbuka? Kedua, mana yang lebih kuat, model open source atau model close source? Ketiga, mana yang lebih mahal, model open source atau model close source?
Perdebatan pertama adalah, apakah ada perbedaan antara model open source dan perangkat lunak open source? Jawabannya adalah, ada perbedaan besar. Sebagian besar model open source tidak sepenuhnya open source. Mereka lebih seperti kotak hitam yang bebas digunakan, bukan kotak transparan seperti perangkat lunak sumber terbuka.
Perangkat lunak sumber terbuka akan menerbitkan kode sumbernya, dan pengembang dapat menguasai sebagian besar detail teknis perangkat lunak melalui kode sumber. Logika inti dari perangkat lunak sumber terbuka gratis adalah bahwa pengembang dari seluruh lapisan masyarakat dapat membantu produsen perangkat lunak menemukan bug produk dan memberikan saran pengoptimalan. Pembangunan sosial tidak hanya dapat mengurangi biaya penelitian dan pengembangan perangkat lunak, namun juga mempercepat iterasi perangkat lunak. Sistem operasi seluler Android dan perangkat lunak database MySQL keduanya mencapai kesuksesan dengan cara ini.
Kompleksitas model sumber terbuka jauh melebihi perangkat lunak sumber terbuka. Proyek sumber terbuka mencakup kode sumber, bobot parameter, struktur model, data pelatihan, proses pelatihan, dll. Dua peneliti dari Universitas Radboud di Belanda, Lisenfeld dan Dingemans, menerbitkan sebuah makalah pada bulan Maret tahun ini yang membandingkan tingkat open source dalam model open source. Makalah ini menunjukkan bahwa model open source yang paling berkinerja biasanya hanya bobot parameter open source. Salah satu penjelasannya adalah untuk memastikan performa model terdepan, produsen model tidak dapat mengungkapkan semua "resep". Ambil contoh model sumber terbuka paling kuat di dunia, Llama3, yang hanya memiliki sebagian bobot parameter dan struktur modelnya yang bersifat open source. Kode sumber, data pelatihan, dan proses pelatihannya belum bersumber terbuka.


Tidak ada keraguan mengenai nilai konsep open source bagi ekologi industri.Xin Zhou, manajer umum Baidu Smart Cloud AI dan platform model besar, mengatakan kepada Caijing pada bulan Juli tahun ini bahwa model sumber terbuka akan membuat aplikasi model dan model industri lebih kaya. Namun dia keberatan untuk menggabungkan model open source dengan perangkat lunak open source.Karena terdapat perbedaan mendasar antara keduanya - model open source tidak dapat mengandalkan partisipasi pengembang sosial untuk meningkatkan kinerja produk dan mengurangi biaya penelitian dan pengembangan seperti perangkat lunak open source. Model dasar hanya dapat ditingkatkan melalui pelatihan produsen model itu sendiri. Penyempurnaan dan optimalisasi inferensi model sumber terbuka tidak sebaik model komersial. Model ini memiliki persyaratan teknis yang tinggi untuk pengembang dan biaya penggunaan sebenarnya tidak rendah.
Perdebatan kedua, mana yang lebih kuat, model open source atau model close source? Faktanya adalah model sumber tertutup umumnya memiliki kinerja lebih baik daripada model sumber terbuka, namun kesenjangan kinerja antara model sumber terbuka dan sumber tertutup semakin menyempit.


Pusat Penelitian Model Fundamental (CRFM) di Universitas Stanford telah lama melakukan pemeringkatan pengujian model besar secara global. Pada tanggal 24 Juli, peringkat tes pemahaman bahasa multi-tugas (MMLU) skala besar yang dirilis menunjukkan bahwa di antara sepuluh model kinerja teratas, hanya Llama3.1 yang merupakan model sumber terbuka, termasuk Claude3.5 (diinvestasikan oleh Amazon), GPT -4o (diinvestasikan oleh Microsoft), dan Gemini1.5 Pro (dikembangkan sendiri oleh Google) dan lainnya adalah model sumber tertutup.
Li Jingmei percaya bahwa model sumber tertutup dari perusahaan yang sama harus memiliki kinerja yang lebih baik dibandingkan model sumber terbuka. Namun, dalam perbandingan horizontal di industri, model sumber tertutup belum tentu lebih baik dibandingkan model sumber terbuka. Karena model besar diiterasi setiap 6 hingga 12 bulan, beberapa model sumber terbuka mungkin berkembang lebih cepat.


Pemeringkatan yang dilakukan oleh organisasi peninjau menggambarkan tren ini. Organisasi LMSYS (Large Model System Research Organization) diprakarsai oleh University of California, Berkeley. Organisasi ini juga akan mengevaluasi dan memberi peringkat kinerja model global untuk waktu yang lama. Llama3.1 dari Meta dan Qwen2 dari Alibaba Cloud meningkat pesat dalam peringkat dalam evaluasi ini. Llama3.1 bahkan melampaui sebagian besar model sumber tertutup.
Seseorang yang bertanggung jawab atas bisnis model besar dari vendor cloud Tiongkok menganalisis bahwa ada dua alasan mengapa kesenjangan kinerja antara model sumber terbuka dan model sumber tertutup semakin menyempit. Pada tahun lalu, model dasar besar umumnya memasuki periode kemacetan peningkatan kinerja. Model open source menarik banyak pengembang. Meskipun mereka tidak dapat secara langsung meningkatkan kinerja model melalui umpan balik kode, mereka meningkatkan tingkat penelitian model secara keseluruhan, yang secara tidak langsung membantu model sumber terbuka meningkatkan kinerja model.
Perdebatan ketiga, model open source atau model close source, mana yang lebih mahal? Kesimpulannya, kinerja adalah faktor penentu. Biaya penggunaan model berhubungan langsung dengan performa model. Semakin tinggi kinerjanya, semakin rendah biaya penggunaan jangka panjangnya karena semakin sedikit panggilan yang diperlukan untuk menyelesaikan tugas.
Model open source gratis dan sering kali memberikan kesan lebih murah dan berbiaya rendah. Xin Zhou menjelaskan bahwa aplikasi model besar adalah solusi komprehensif yang mencakup "teknologi + layanan", dan perusahaan perlu menghitung "buku besar". Selain menyediakan model dan rantai alat yang lengkap, produsen model sumber tertutup juga memberikan pelatihan dan layanan teknis untuk membantu perusahaan memulai dengan cepat. Model sumber terbuka tampaknya gratis, tetapi untuk mencapai efek yang sama seperti sumber tertutup, diperlukan banyak investasi lanjutan dalam hal tenaga kerja, uang, dan waktu, dan biaya keseluruhannya lebih tinggi.

Dalam jangka panjang, faktor penentu biaya penerapan model sumber terbuka dan sumber tertutup adalah biaya inferensi. Model sumber tertutup dengan besaran parameter yang sama biasanya berperforma lebih baik daripada model sumber terbuka dan memiliki biaya komprehensif yang lebih rendah. Xin Zhou menghitung bahwa jika sebuah perusahaan menerapkan model sumber terbuka secara gratis, penerapan model sumber tertutup memerlukan biaya 500.000 yuan. Pada tahap investasi awal, model open source lebih murah. Pada tahap penggunaan selanjutnya, jika kinerja komprehensif model sumber tertutup 20% lebih baik dibandingkan model sumber terbuka, model sumber tertutup dapat menghemat puluhan ribu yuan per hari di beberapa perusahaan bervolume besar. . Pada akhirnya, biaya penggunaan jangka panjang harus jauh lebih rendah dibandingkan model open source.

Siapa yang menggunakan model open source? Siapa yang menggunakan model sumber tertutup?
Apakah model sumber terbuka lebih baik atau model sumber tertutup? Masalah ini tidak diputuskan oleh produsen model di sisi penawaran, namun oleh pelanggan perusahaan di sisi permintaan.
Di ruang publik, perang kata-kata di kalangan korporat terus berlanjut. Namun, banyak tenaga teknis dari vendor cloud mengatakan kepada Caijing bahwa argumen ini tidak dapat menyangkal nilai pasar satu sama lain. Kedua kebutuhan ini akan hidup berdampingan dalam jangka waktu yang lama. Dilihat dari sudut pandang lain, perang kata-kata mempermudah upaya bersama untuk meningkatkan visibilitas pasar.
Faktanya, sebagian besar pelanggan perusahaan tidak peduli apakah modelnya harus open source. Xin Zhou menyimpulkan bahwa setelah berkomunikasi dengan banyak pelanggan perusahaan besar, dia menemukan bahwa apakah kepala departemen TI harus menggunakan suatu model bergantung pada banyak faktor. Urutan prioritas biasanya: efek, kinerja, harga, dan keamanan. Open source atau close source bukanlah faktor penentu.
Dalam "kotak peralatan" sebagian besar perusahaan, model sumber terbuka dan model sumber tertutup saling melengkapi. Penerapan model besar oleh perusahaan besar biasanya dibagi menjadi beberapa tahap.
Pada tahap awal, departemen TI akan memilah kinerja dan karakteristik model open source dan close source yang ada di pasaran. Model yang berbeda memiliki keunggulan yang berbeda. Beberapa model memiliki kemampuan pengucapan bahasa yang kuat, dan beberapa model memiliki kemampuan statistik data yang kuat. Pengujian POC (bukti konsep) model open source tahap awal gratis untuk memverifikasi efek bisnis.
Dalam jangka menengah, kami akan memulai dengan proyek tahap pertama dalam skenario bisnis dengan tingkat kesulitan rendah dan hasil cepat, seperti pemasaran, layanan pelanggan, dan basis pengetahuan. Anda tidak hanya perlu membeli model sumber tertutup, tetapi Anda juga perlu melatih dan menyempurnakan model sumber terbuka Anda sendiri. Biarkan model internal dan eksternal "berlomba" satu sama lain, membandingkan efek dan biaya model yang berbeda, dan beralih penggunaan kapan saja.
Pada tahap selanjutnya, berdasarkan hasil implementasi, kami akan secara bertahap merencanakan proyek tahap kedua dan ketiga dalam skenario bisnis yang sulit dan lambat membuahkan hasil. Pada saat ini, seringkali diperlukan pengeluaran puluhan juta yuan untuk membangun serangkaian model dasar besar yang independen dan dapat dikontrol atau model industri besar.
Model sumber terbuka ini gratis, tetapi tidak dapat langsung digunakan, memerlukan waktu dan tenaga, dan tidak ada yang bertanggung jawab atas detailnya. Model sumber tertutup dapat secara langsung memperoleh produk matang dan memberikan layanan penuh sebelum, selama, dan setelah penjualan. Sederhananya, model open source seperti membeli makanan dan memasak sendiri, sedangkan model close source seperti mengeluarkan uang untuk makan di restoran.
Sudut pandang Xin Zhou adalah bahwa model sumber terbuka cocok untuk penelitian akademis, untuk beberapa perusahaan kecil dan menengah dengan anggaran TI yang sangat terbatas, dan untuk beberapa perusahaan besar untuk proyek penelitian mandiri internal yang independen dan terkendali, namun tidak demikian. cocok untuk proyek komersial eksternal skala besar. Dalam beberapa proyek komersial serius yang menelan biaya jutaan atau puluhan juta dolar, model sumber tertutup masih menjadi pilihan terbaik.
Model open source bukanlah makan siang gratis. Ada banyak biaya tersembunyi bagi perusahaan besar yang menggunakan model open source. Misalnya, pembelian daya komputasi, adaptasi perangkat lunak, dll. Seorang direktur teknis dari penyedia layanan pemasaran cerdas luar negeri Tiongkok mengatakan kepada Caijing pada bulan Juli tahun ini bahwa perusahaannya sangat bergantung pada layanan cloud dan menghabiskan lebih dari 80 juta yuan untuk penelitian dan pengembangan setiap tahun. Dalam dua tahun terakhir, perusahaan telah menggunakan lebih dari sepuluh model sumber tertutup secara bersamaan, tetapi tidak ada model sumber terbuka di antara model tersebut. Dalam pandangannya, model open source membutuhkan waktu dan tenaga untuk mengerjakannya. Kebanyakan model open source tidak dapat langsung digunakan, tidak ada yang mengetahui detailnya, dan hanya dapat dianggap sebagai "mainan". Dia cenderung mengelola lebih dari selusin model sumber tertutup dan menggantinya kapan saja berdasarkan harga dan kinerja. Ini adalah cara yang paling hemat biaya.
Seorang direktur TI di sebuah bank komersial saham gabungan besar percaya bahwa bukan masalah besar jika model sumber terbuka tidak dapat digunakan secara langsung. Dia mengatakan kepada Caijing pada bulan Desember 2023 bahwa timnya juga menggunakan Alibaba (model sumber terbuka Tongyi), Meta (model sumber terbuka Llama), Baidu (seri Wenxin), dan Zhipu (seri GLM) untuk pengembangan mandiri. Model open source cocok untuk proyek kecil seperti itu, karena memungkinkan pengujian POC gratis dan dapat dimodifikasi sesuai kebutuhan. Tim TI-nya beranggotakan puluhan orang, serta perusahaan layanan TI yang dialihdayakan, dengan tenaga kerja yang cukup untuk menangani masalah ini. Namun dia juga yakin bahwa dalam proyek skala besar senilai satu juta atau sepuluh juta yuan, model sumber tertutup lebih cocok. Karena model sumber tertutup stabil dan dapat diandalkan, Anda juga dapat menemukan perusahaan model yang bertanggung jawab untuk menanganinya.

Dibutuhkan biaya puluhan juta yuan untuk sepenuhnya melatih serangkaian model industri menggunakan model sumber terbuka, dan juga memerlukan pembelian chip AI untuk membangun ruang komputer yang dibuat sendiri. Teknisi penyedia layanan perangkat lunak AI yang disebutkan di atas menyimpulkan bahwa model sumber terbuka cocok untuk beberapa badan usaha milik negara pusat yang memiliki persyaratan tinggi dalam keamanan data, otonomi dan kontrol, serta tidak terlalu sensitif terhadap biaya. Mereka akan menggunakan model sumber terbuka untuk melatih model industri mereka sendiri. Karena "model sumber terbuka + cloud pribadi" memenuhi tuntutan keamanan data dan pengendalian independen dari banyak perusahaan pusat dan milik negara.

Bagaimana masa depannya?
Perdebatan antara model besar sumber terbuka dan tertutup di pasar Tiongkok adalah murni masalah komersial. Namun, di pasar internasional, perselisihan antara model besar sumber terbuka dan tertutup melibatkan lebih banyak faktor seperti antimonopoli dan kepentingan nasional.
Setelah perang harga pada bulan Mei tahun ini, model-model besar Tiongkok telah memasuki "era laba kotor negatif". Baik model sumber terbuka maupun sumber tertutup menghadapi masalah - model besar tidak dapat menghasilkan keuntungan langsung.
"Persaingan besar di pasar model besar telah dimulai." Seseorang yang bertanggung jawab atas bisnis model besar dari vendor cloud Tiongkok menganalisis bahwa laba kotor negatif untuk panggilan model besar berarti semakin banyak panggilan yang dilakukan dalam jangka pendek, semakin banyak panggilan yang dilakukan dalam jangka pendek. semakin besar kerugian bagi vendor cloud. Vendor cloud Tiongkok bertaruh bahwa setelah harga panggilan model besar diturunkan sebesar 90%, jumlah panggilan model besar akan meningkat secara eksponensial dalam satu hingga dua tahun ke depan. Dalam jangka panjang, biaya daya komputasi vendor cloud akan berkurang seiring dengan meningkatnya permintaan pelanggan, dan pada akhirnya mereka masih dapat memperoleh keuntungan positif. Sekalipun taruhan ini tidak benar, sekelompok produsen model akan mati dalam perang harga, dan produsen yang bertahan akan mengambil alih.
Banyak orang dalam industri menyatakan pandangan yang sama kepada Caijing. Putaran eliminasi ini akan berlangsung selama 1 hingga 2 tahun, dan hanya 3 hingga 5 perusahaan model dasar yang dapat terus bertahan.
Seorang Xiaopeng, anggota komite eksekutif Baihui Informatisasi Tiongkok dan direktur Pusat Penelitian Teknologi Cerdas Alibaba Cloud, mengatakan kepada Caijing pada bulan Juli tahun ini bahwa tidak ada perang ratusan model di Tiongkok, atau bahkan perang sepuluh model. Model besar memerlukan investasi berkelanjutan, memiliki kapasitas 10.000 atau bahkan 100.000 kartu, dan memerlukan pengembalian komersial. Banyak perusahaan tidak mempunyai kemampuan seperti itu. Di masa depan, hanya akan ada tiga atau lima produsen model dasar di pasar Tiongkok.
Siapa yang diuntungkan dari perang harga? Siapa yang akan tertawa terakhir? Para perencana strategis AI dari perusahaan teknologi terkemuka Tiongkok yang disebutkan di atas percaya bahwa dalam putaran perang harga ini, Volcano Engine dari Alibaba Cloud dan ByteDance memiliki kekuatan paling besar. Alibaba Cloud dapat menghasilkan uang dari cloud, dan Volcano Engine memiliki bisnis periklanan Bytedance. Dalam perang harga, Baidu tidak sebaik Alibaba dan ByteDance. Namun, model besar Wenxin Baidu memiliki teknologi yang kuat dan akan memiliki sekelompok pelanggan yang bersedia membayar untuk teknologi tersebut. Hal ini akan membantu Baidu bertahan dari perang harga. Lebih lanjut ia menjelaskan bahwa model startup besar di pasar Tiongkok ini akan menghadapi ujian berat dalam satu hingga dua tahun ke depan. Startup model besar dapat memilih untuk menjadi perusahaan pengembangan model berbasis proyek atau beralih ke model industri vertikal.
Persaingan keseluruhan di pasar model besar Tiongkok jauh lebih penting daripada persaingan lokal antara model sumber terbuka dan sumber tertutup. Arah persaingan global akan secara langsung menentukan hasil persaingan lokal.
Salah satu personel Alibaba Cloud mengatakan secara blak-blakan bahwa model open source dan close source memiliki keunggulannya masing-masing, dan Alibaba Cloud berharap dapat menjadikan AI lebih inklusif. Terlepas dari open source atau close source, tujuan intinya adalah memberikan lebih banyak pilihan kepada pengembang. Alibaba Cloud telah memilih untuk berjalan dengan dua kaki: sumber terbuka dan sumber tertutup. Ia memiliki model sumber terbuka modal penuh dan model sumber tertutup. Orang lain yang bertanggung jawab atas bisnis model besar vendor cloud Tiongkok percaya bahwa open source tidak memiliki model bisnis. Di pasar model Tiongkok, hanya perusahaan terkemuka atau sejumlah kecil startup yang dapat mengumpulkan dana secara berkelanjutan yang dapat menerapkan open source. Pada akhirnya, mungkin hanya tersisa 1-2 model open source di pasar Cina.
Produsen model melatih model generasi baru hampir setiap 6-12 bulan. Di pasar model Tiongkok, ketika tekanan untuk menghasilkan keuntungan meningkat, model open source mungkin menjadi semakin "strategis" - perusahaan akan cenderung menggunakan model open source dengan teknologi terbelakang dan parameter yang lebih kecil pada generasi sebelumnya, dan memandu pengguna untuk membayar ke menggunakan pembaruan dan parameter teknologi.
Persaingan antara model open source dan close source tidak akan berakhir dalam waktu dekat. Beberapa perusahaan bahkan dapat menjalankan open source dan close source secara bersamaan.Dalam industri TI, hal ini bukannya tanpa preseden. Sudah lebih dari 60 tahun sejak database lahir, dan sudah lebih dari 50 tahun sejak database open source pertama lahir. Pasar basis data saat ini aktif dengan berbagai basis data sumber tertutup dan sumber terbuka, dan merek basis data baru terus bermunculan tanpa henti. Raksasa basis data Oracle bahkan memiliki basis data RDBMS sumber tertutup dan basis data MySQL sumber terbuka.
Banyak teknisi vendor cloud percaya bahwa model sumber terbuka dan model sumber tertutup akan hidup berdampingan dalam waktu yang lama. Pasar model yang besar secara bertahap akan tumbuh di tengah persaingan dari jalur teknis yang berbeda.

Editor|Zhang Yufei