berita

Perusahaan-perusahaan bintang AI berjuang untuk model-model kecil, biayanya anjlok dan mereka lebih menghemat tagihan listrik, sehingga mempercepat mempopulerkan AI

2024-07-22

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Hal-hal cerdas (akun publik:zhidxcom
Disusun oleh Meng Qiang
Editor Yunpeng

Menurut laporan Venture Beat, minggu lalu, Hugging Face, Mistral AI, dan OpenAI meluncurkan model kecil (SLM) masing-masing pada 16 dan 18 Juli, berjanji untuk mempopulerkan kemampuan pemrosesan bahasa alami yang canggih. Di masa lalu, perusahaan-perusahaan teknologi bersaing untuk mengejar jaringan saraf yang lebih besar dan lebih kompleks pada jalur model bahasa yang besar. Venture Beat percaya bahwa model-model kecil ini telah membuka jalur-jalur baru dan juga dapat mempengaruhi cara perusahaan menggunakan solusi AI.

Model kecil, seperti namanya, relatif terhadap model bahasa besar (LLM). Model ini umumnya memiliki parameter yang lebih sedikit dan kebutuhan sumber daya komputasi yang lebih rendah. Dibandingkan dengan model bahasa besar dengan parameter yang seringkali mencapai ratusan miliar atau bahkan triliunan, parameter dari tiga model kecil baru: SmolLM, Mistral NeMo, dan GPT-4o mini dapat berkisar dari ratusan juta hingga puluhan miliar, bergantung pada pelatihannya volume. Konsumsi energi lebih rendah dibandingkan model bahasa besar. Meskipun ketiga model tersebut menggunakan metode berbeda untuk mempopulerkan AI, ketiga model tersebut memiliki tujuan yang sama: menghadirkan kemampuan pemrosesan bahasa yang canggih ke lebih banyak perangkat dan aplikasi.

1. Bagaimana model kecil mengubah komputasi edge

Venture Beat percaya bahwa SmolLM dari Hugging Face adalah yang paling inovatif dari ketiganya. Ini dirancang khusus untuk berjalan di perangkat seluler dan memiliki tiga spesifikasi: 135 juta, 360 juta, dan 1,7 miliar parameter, yang memfasilitasi pemrosesan AI pada perangkat edge dan memecahkan masalah utama privasi dan latensi data.

Pentingnya SmolLM lebih dari sekadar meningkatkan efisiensi. Mengizinkan perangkat edge menggunakan pemrosesan AI dapat memungkinkan aplikasi perangkat berjalan berdasarkan latensi rendah dan perlindungan privasi tinggi. Di masa lalu, banyak fungsi AI yang kompleks tidak dapat diwujudkan karena masalah privasi atau koneksi. Dengan SmolLM, fungsi-fungsi ini mungkin menjadi kenyataan.

Selain itu, Mistral AI meluncurkan model Mistral NeMo, yang memiliki 12 miliar parameter dan jendela konteks hingga 128 ribu. Mistral NeMo ditujukan untuk komputer desktop dan ditempatkan di antara model cloud besar dan AI seluler ultra-kompak. Yang pertama adalah model AI berskala besar yang dilatih dan dijalankan pada platform komputasi awan, sedangkan yang kedua adalah perangkat seluler dengan sumber daya terbatas ( seperti ponsel).

Venture Beat mengatakan bahwa metode komputasi Mistral NeMo dapat membawa perubahan besar pada bidang perusahaan. Model ini berpotensi memanfaatkan perangkat keras tingkat konsumen untuk mendemokratisasi kemampuan AI kompleks yang dulunya dimiliki oleh raksasa teknologi dan lembaga penelitian yang memiliki dana besar. Hal ini dapat membantu berbagai industri mempopulerkan aplikasi berbasis AI, seperti mengoptimalkan layanan pelanggan dan menyediakan alat analisis data yang lebih canggih.

2. Model kecil GPT-4o mini OpenAI yang efisien memiliki harga yang menarik

OpenAI juga mengikuti kompetisi model kecil dengan peluncuran GPT-4o mini, yang disebut sebagai model kecil paling hemat biaya di pasar. Biaya inputnya hanya sebesar 15 sen per juta token dan biaya output sebesar 60 sen per juta token. Venture Beat mengklaim bahwa GPT-4o mini sangat mengurangi akses dana integrasi AI.

Selain itu, strategi penetapan harga GPT-4o mini dapat melahirkan gelombang baru inovasi berbasis AI, terutama di kalangan startup dan usaha kecil. Dengan mengurangi biaya integrasi AI secara signifikan, model ini secara efektif menurunkan hambatan masuk dalam mengadopsi solusi berbasis AI. Ventrue Beat percaya bahwa hal ini dapat mempercepat inovasi dan reformasi teknologi di berbagai industri. Selain itu, peralihan ke model yang lebih kecil mencerminkan tren baru dalam komunitas AI: peneliti dan pengembang semakin fokus pada efisiensi, aksesibilitas, dan aplikasi khusus. Tren ini dapat mengarah pada solusi AI yang lebih bertarget dan efisien yang dioptimalkan untuk tugas dan industri tertentu.

3. Model kecil mempromosikan inovasi teknologi ramah lingkungan dan mengurangi jejak karbon teknologi

Peralihan ke model yang lebih kecil juga sejalan dengan meningkatnya kekhawatiran mengenai dampak AI terhadap lingkungan. Pelatihan dan pengoperasian model kecil mengonsumsi lebih sedikit energi, sehingga dapat mengurangi jejak karbon teknologi AI. Ketika perusahaan-perusahaan teknologi menghadapi tekanan yang semakin besar untuk menjadi berkelanjutan, Venture Beat percaya bahwa konsumsi energi yang rendah dan emisi yang rendah dari model kecil ini dapat menjadi nilai jual yang penting.

Implikasi lingkungan dari peralihan ke model yang lebih kecil ini bisa sangat besar. Ketika AI menjadi lebih umum, penghematan energi dari pengembangan model-model yang lebih efisien bisa sangat besar. Hal ini memungkinkan AI untuk mengambil peran kepemimpinan dalam inovasi ramah lingkungan dibandingkan terus berkontribusi terhadap pemanasan global.

Namun, munculnya model-model kecil bukannya tanpa tantangan. Ketika AI semakin banyak digunakan, permasalahan bias, akuntabilitas, dan penggunaan etis menjadi semakin mendesak. Jika tidak diatur, penyebaran AI melalui model-model kecil dapat memperkuat bias yang ada atau menciptakan dilema etika baru. Bagi pengembang dan pengguna model kecil, selain kemampuan teknis, masalah etika juga harus diprioritaskan.

Kesimpulan: Masa depan pengembangan AI mengarah pada diversifikasi dan spesialisasi

Meskipun model kecil memiliki keunggulan dalam efisiensi dan kemampuan generalisasi, kekuatan pemrosesannya mungkin tidak sebanding dengan model bahasa besar pada banyak tugas karena keterbatasan jumlah parameter. Venture Beat mengatakan bahwa hal ini menunjukkan bahwa dalam lanskap pengembangan AI di masa depan, akan terdapat model bahasa dengan berbagai ukuran, dan model yang lebih kecil akan memiliki aspek tertentu yang menjadi keahliannya.

Ke depan, kami memperkirakan perkembangan model AI akan berkembang. Baik itu model bahasa besar atau model kecil, pendekatan satu ukuran untuk semua tidak disarankan. Kuncinya adalah menemukan keseimbangan antara ukuran model. kinerja dan persyaratan aplikasi spesifik. Bagi perusahaan dan pengambil keputusan teknis, ketiga model kecil ini mewakili peralihan menuju solusi AI yang lebih efisien, profesional, dan dapat diterapkan, sehingga memberikan kemungkinan baru untuk integrasi AI di lingkungan perusahaan. Mengenai apakah model kecil dapat menggantikan dominasi model besar saat ini di cloud, masih terlalu dini untuk menarik kesimpulan.

Sumber: VentureBeat