Llama menjadi model teratas di antara model-model besar, Zuckerberg memulai perdebatan: Bermain open source, zaman telah berubah

2024-07-24

Laporan Jantung Mesin

Editor: Asia Oriole, Ayam Big Pan, Du Wei

Perselisihan antara open source dan close source sudah berlangsung lama, dan kini mungkin sudah mencapai klimaks baru.

Dalam hal model open source besar, seri Llama telah menjadi representasi tipikal sejak kelahirannya. Performa luar biasa dan fitur open source telah sangat meningkatkan penerapan dan aksesibilitas teknologi kecerdasan buatan. Setiap peneliti dan pengembang dapat memperoleh manfaat darinya, menjadikan penelitian dan penerapannya lebih luas.

Kini Meta Llama 3.1 405B resmi dirilis. Dalam blog resminya, Meta mengatakan: "Hingga saat ini, model bahasa besar open source sebagian besar tertinggal dibandingkan model tertutup dalam hal fungsionalitas dan kinerja. Sekarang, kita sedang memasuki era baru yang dipimpin oleh open source."

Pada saat yang sama, pendiri dan CEO Meta Zuckerberg secara pribadi menulis artikel panjang yang menjelaskan pentingnya open source bagi semua pengembang, bagi Meta, dan bagi dunia. Ia mengatakan bahwa open source merupakan kondisi yang diperlukan untuk perkembangan positif AI. Mengambil contoh pengembangan Unix dan Linux, AI open source akan lebih kondusif bagi inovasi, perlindungan data, dan efektivitas biaya.

Ia juga percaya bahwa model Llama open source dapat membangun ekosistem yang lengkap untuk memastikan kemajuan teknologi dan tidak kehilangan keunggulan akibat persaingan. Meta memiliki sejarah open source yang sukses. Melalui model AI open source, Zuckerberg berharap dapat mempromosikan kesetaraan dan penerapan teknologi global yang aman.

Tautan asli: https://about.fb.com/news/2024/07/open-source-ai-is-the-path-forward/

Berikut isi aslinya:

Zuckerberg menyuntikkan gen sumber terbuka ke dalam Meta

Pada masa-masa awal komputasi berkinerja tinggi, perusahaan teknologi besar berinvestasi besar-besaran dalam mengembangkan Unix versi sumber tertutup mereka sendiri. Pada saat itu sulit membayangkan cara lain untuk mengembangkan perangkat lunak canggih tersebut.

Namun, Linux open source secara bertahap menjadi populer: awalnya karena memungkinkan pengembang untuk secara bebas memodifikasi kode dan lebih terjangkau, namun kemudian menjadi lebih maju, lebih aman, dan memiliki ekosistem yang lebih luas daripada Unix sumber tertutup, mendukung lebih banyak fungsi. Saat ini, Linux adalah landasan standar industri untuk komputasi awan dan sistem operasi yang menjalankan sebagian besar perangkat seluler, dan semua orang mendapat manfaat dari produk unggulannya.

Saya yakin perkembangan kecerdasan buatan akan mengikuti arah yang sama.Saat ini, beberapa perusahaan teknologi sedang mengembangkan model sumber tertutup terkemuka, namun sumber terbuka dengan cepat menutup kesenjangan tersebut.

Tahun lalu, Llama 2 hanya sebanding dengan model generasi lama. Dan tahun ini, Llama 3 telah bersaing atau bahkan mengungguli model-model terkemuka di industri di beberapa bidang. Mulai tahun depan, kami berharap model Llama di masa depan akan menjadi model besar tercanggih di industri. Llama juga memimpin dalam hal keterbukaan, kemampuan untuk dimodifikasi, dan efektivitas biaya.

Hari ini, kami mengambil langkah berikutnya - menjadikan AI open source sebagai standar industri. Kami merilis model AI open source mutakhir pertama Llama 3.1 405B, serta versi yang ditingkatkan dari model Llama 3.1 70B dan 8B. Dibandingkan dengan model sumber tertutup, model sumber terbuka ini jauh lebih hemat biaya, terutama sifat sumber terbuka dari model 405B, menjadikannya pilihan terbaik untuk menyempurnakan dan menyaring model kecil.

Selain merilis model ini, kami juga bekerja sama dengan banyak perusahaan untuk memperluas ekosistem yang lebih luas. Amazon, Databricks, dan Nvidia meluncurkan rangkaian layanan lengkap untuk memungkinkan pengembang menyempurnakan dan menyaring model mereka sendiri. Inovator seperti Groq telah membangun layanan inferensi berlatensi rendah dan berbiaya rendah untuk semua model baru.

Model-model ini akan tersedia di semua platform cloud utama termasuk AWS, Azure, Google, Oracle, dan lainnya. Scale.AI, Dell, Deloitte, dan lainnya sudah siap membantu perusahaan mengadopsi Llama dan melatih model khusus menggunakan data mereka sendiri. Seiring berkembangnya komunitas dan semakin banyak perusahaan yang mengembangkan layanan baru, bersama-sama kita dapat menjadikan Llama sebagai standar industri dan memberikan manfaat AI bagi semua orang.

Meta berkomitmen terhadap AI open source. Berikut alasan mengapa menurut saya open source adalah platform pengembangan terbaik, mengapa Llama open source bagus untuk Meta, dan mengapa AI open source bagus untuk dunia dan akan tetap ada dalam jangka waktu lama. .

AI sumber terbuka untuk pengembang

Saat saya berbicara dengan pengembang, CEO, dan pejabat pemerintah di seluruh dunia, saya biasanya mendengar beberapa tema:

Kita perlu melatih, menyempurnakan, dan menyaring model kita sendiri. Setiap organisasi memiliki kebutuhan berbeda yang paling baik dilayani dengan menggunakan model yang dilatih atau disesuaikan pada skala berbeda dan dengan data spesifik. Tugas pada perangkat dan tugas klasifikasi memerlukan model kecil, sedangkan tugas yang lebih kompleks memerlukan model besar. Sekarang Anda dapat mengambil model Llama yang canggih, terus melatihnya menggunakan data Anda sendiri, lalu menyaringnya ke ukuran model yang paling sesuai dengan kebutuhan Anda - tanpa kami atau orang lain dapat melihat data Anda.
Kita perlu mengendalikan nasib kita sendiri dan tidak “dikurung” oleh vendor sumber tertutup. Banyak organisasi tidak mau bergantung pada model yang tidak dapat mereka jalankan dan kendalikan sendiri. Mereka tidak ingin vendor model sumber tertutup dapat mengubah model, mengubah ketentuan penggunaan, atau bahkan menghentikan layanan sepenuhnya. Mereka juga tidak ingin terpaku pada satu platform cloud dengan hak eksklusif atas model mereka. Open source memungkinkan ekosistem luas dari toolchain kompatibel yang dapat Anda alihkan dengan mudah.
Kita perlu melindungi data kita. Banyak organisasi menangani data sensitif yang perlu dilindungi dan tidak dapat dikirim ke model sumber tertutup melalui cloud API. Beberapa organisasi tidak mempercayai vendor model sumber tertutup dengan data mereka. Open source memecahkan masalah ini karena memungkinkan Anda menjalankan model di mana pun Anda inginkan. Perangkat lunak open source diketahui lebih aman karena proses pengembangannya lebih transparan.
Kita membutuhkan model yang efisien dan ekonomis.Pengembang dapat menjalankan Llama 3.1 405B pada infrastruktur mereka sendiri untuk melakukan inferensi dengan biaya sekitar 50% dari biaya penggunaan model sumber tertutup (seperti GPT-4), yang cocok untuk tugas inferensi sisi pengguna dan offline.
Kami ingin berinvestasi pada ekosistem yang akan menjadi standar dalam jangka panjang.Banyak yang melihat open source berkembang lebih cepat dibandingkan model tertutup, dan mereka ingin membangun sistem mereka pada arsitektur yang memberikan keuntungan terbesar dalam jangka panjang.

AI sumber terbuka ke Meta

Model bisnis Meta adalah membangun pengalaman dan layanan terbaik bagi masyarakat. Untuk mencapai hal tersebut, kita harus memastikan bahwa kita selalu memiliki akses terhadap teknologi terbaik dan tidak terjebak dalam ekosistem pesaing yang tertutup sehingga mereka tidak dapat membatasi apa yang kita kembangkan.

Saya ingin berbagi pengalaman penting: Meskipun Apple mengizinkan kami membuat konten di platformnya, kami masih terbatas dalam hal layanan pembuatan. Entah itu pajak yang mereka kenakan pada pengembang, aturan sewenang-wenang yang mereka terapkan, atau semua inovasi produk yang mereka cegah, jelas bahwa jika kita dapat membangun versi terbaik dari produk kita dan pesaing tidak dapat membatasi apa yang kita bangun, Meta dan banyak lainnya. perusahaan akan mampu memberikan pelayanan yang lebih baik kepada masyarakat. Secara filosofis, ini adalah alasan utama mengapa saya sangat yakin akan pembangunan ekosistem terbuka untuk komputer generasi berikutnya di bidang AI dan AR/VR.

Orang sering bertanya kepada saya apakah saya khawatir kehilangan keunggulan teknis dengan Llama open source, tapi menurut saya hal ini tidak mencerminkan gambaran yang lebih besar karena beberapa alasan:

Pertama, untuk memastikan bahwa kita dapat mempertahankan kepemimpinan teknologi dalam jangka panjang dan tidak terjebak dalam ekosistem sumber tertutup, Llama perlu berevolusi menjadi ekosistem yang lengkap termasuk perkakas, peningkatan efisiensi, optimalisasi perangkat keras, dan integrasi lainnya. Jika perusahaan kami adalah satu-satunya perusahaan yang menggunakan Llama, ekosistemnya tidak akan berkembang dan keadaan kami tidak akan lebih baik dibandingkan dengan varian Unix yang bersumber tertutup.

Kedua, saya memperkirakan pengembangan AI akan terus menjadi sangat kompetitif, yang berarti bahwa model open source pada saat tertentu tidak akan merugikan kita dalam persaingan melawan model terbaik berikutnya.Jalan Llama untuk menjadi standar industri adalah dengan tetap kompetitif, efisien, dan terbuka dari generasi ke generasi.

Ketiga, perbedaan utama antara penyedia model Meta dan sumber tertutup adalah bahwa menjual akses ke model AI bukanlah model bisnis kami. Artinya, merilis Llama ke publik tidak akan mengganggu pendapatan, keberlanjutan, atau kemampuan kami untuk berinvestasi dalam penelitian, sedangkan penyedia sumber tertutup akan melakukannya. (Ini adalah salah satu alasan mengapa beberapa penyedia sumber tertutup melobi administrator publik agar tidak menggunakan sumber terbuka.)

Terakhir, Meta memiliki segudang pengalaman sukses dengan proyek sumber terbuka. Kami telah menghemat miliaran dolar dengan berbagi desain server, jaringan, dan pusat data kami dengan Open Compute Project dan menstandardisasi rantai pasokan. Dengan menggunakan alat-alat terkemuka yang bersifat open source seperti PyTorch, React, dan banyak lagi, kami mendapat manfaat besar dari inovasi dalam ekosistem. Pendekatan ini sudah sangat efektif sejak lama.

AI sumber terbuka bagi dunia

Saya percaya open source diperlukan untuk masa depan AI. AI mempunyai potensi untuk meningkatkan produktivitas, kreativitas, dan kualitas hidup manusia melebihi teknologi modern lainnya, dan untuk memajukan penelitian medis dan ilmiah sekaligus mempercepat pertumbuhan ekonomi.Open source akan memastikan bahwa lebih banyak orang di seluruh dunia dapat memperoleh manfaat dan peluang dari pengembangan AI, bahwa kekuasaan tidak terkonsentrasi di tangan beberapa perusahaan saja, dan bahwa teknologi dapat diterapkan secara lebih merata dan aman ke seluruh masyarakat.

Ada perdebatan yang sedang berlangsung tentang keamanan model AI open source. Maksud saya adalah AI open source akan lebih aman daripada alternatifnya. Saya pikir pemerintah pada akhirnya akan sampai pada kesimpulan bahwa mereka mendukung open source karena akan membuat dunia lebih sejahtera dan aman.

Dalam kerangka keamanan yang saya pahami, kita perlu melindungi dari dua jenis bahaya: tidak disengaja dan disengaja.

Kerusakan yang tidak disengaja mengacu pada kemungkinan bahwa sistem AI secara tidak sengaja menyebabkan kerusakan saat beroperasi. Misalnya, model AI modern mungkin secara tidak sengaja memberikan saran kesehatan yang salah. Atau, dalam skenario masa depan, ada kekhawatiran bahwa model mungkin secara tidak sengaja mereplikasi dirinya sendiri atau mengoptimalkan sasaran secara berlebihan, sehingga merugikan manusia.
Kerugian yang disengaja adalah ketika pelaku kejahatan menggunakan model AI dengan tujuan menyebabkan kerugian.

Patut dicatat bahwa dampak buruk yang tidak disengaja mencakup sebagian besar kekhawatiran masyarakat terhadap AI—mulai dari dampak sistem AI terhadap miliaran pengguna hingga skenario fiksi ilmiah yang benar-benar membawa bencana. Dalam hal ini, keamanan yang ditawarkan oleh open source bahkan lebih signifikan karena sistemnya lebih transparan dan dapat diteliti secara luas.

Secara historis, perangkat lunak sumber terbuka lebih aman karena alasan ini. Demikian pula, menggunakan Llama dan sistem keamanannya seperti Llama Guard mungkin lebih aman dan andal dibandingkan model sumber tertutup. Akibatnya, sebagian besar diskusi tentang keamanan AI open source berfokus pada bahaya yang disengaja.

Proses keamanan kami mencakup pengujian ketat dan penilaian tim merah untuk memverifikasi apakah model kami berpotensi menyebabkan kerusakan material, dengan tujuan memitigasi risiko sebelum dirilis. Karena model ini bersifat open source, siapa pun dapat mengujinya sendiri. Kita harus ingat bahwa model ini dilatih berdasarkan informasi yang sudah tersedia di Internet, jadi ketika mempertimbangkan dampak buruknya, titik awalnya haruslah apakah model tersebut dapat menyebabkan lebih banyak dampak buruk daripada informasi yang diperoleh dengan cepat dari Google atau hasil penelusuran lainnya.

Penalaran mengenai tindakan yang disengaja akan berguna untuk membedakan apa yang dapat dilakukan oleh individu atau pelaku berskala kecil dengan apa yang dapat dilakukan oleh pelaku berskala besar yang memiliki sumber daya besar, seperti negara.

Pada suatu saat di masa depan, pelaku kejahatan individu dapat memanfaatkan kecerdasan model AI untuk menciptakan jenis bahaya baru dari informasi yang sudah tersedia di Internet. Pada titik ini, keseimbangan kekuatan sangat penting bagi keselamatan AI.

Saya pikir akan lebih baik jika kita hidup di dunia dimana AI digunakan secara luas, sehingga aktor-aktor besar bisa mengimbangi aktor-aktor kecil yang jahat. Ini juga merupakan cara kami mengelola keamanan di jejaring sosial, dengan sistem AI yang lebih kuat yang mengidentifikasi dan memblokir aktor-aktor kurang canggih yang sering menggunakan sistem AI berskala lebih kecil.

Secara lebih luas, institusi-institusi besar akan berkontribusi terhadap keamanan dan stabilitas masyarakat ketika mereka menerapkan AI dalam skala besar. Selama setiap orang memiliki akses terhadap model yang bersifat generasi, pemerintah dan institusi dengan sumber daya komputasi yang lebih banyak akan mampu mengimbangi pelaku kejahatan dengan sumber daya komputasi yang lebih sedikit.

Saat mempertimbangkan peluang masa depan, ingatlah bahwa sebagian besar perusahaan teknologi dan penelitian ilmiah terkemuka saat ini dibangun di atas perangkat lunak sumber terbuka. Jika kita bersama-sama berinvestasi pada AI open source, perusahaan dan penelitian generasi berikutnya akan memiliki akses terhadapnya. Hal ini mencakup start-up yang baru memulai, serta orang-orang di universitas dan negara yang mungkin tidak memiliki sumber daya untuk mengembangkan SOTA AI dari awal.

Secara keseluruhan, AI open source mewakili kemungkinan penggunaan global terbesar dari teknologi ini untuk menciptakan peluang ekonomi dan keamanan bagi semua orang.

Kerjasama stabil, open source memiliki jangkauan luas

Pada model Llama sebelumnya, Meta telah merilis model ini untuk pengembangannya sendiri tanpa fokus membangun ekosistem yang lebih luas. Untuk peluncuran ini, kami mengambil pendekatan berbeda. Kami membangun tim secara internal untuk membuat Llama tersedia bagi sebanyak mungkin pengembang dan mitra, dan secara aktif membangun kemitraan sehingga lebih banyak perusahaan di ekosistem ini dapat menawarkan kemampuan unik kepada pelanggan mereka.

Saya yakin peluncuran Llama 3.1 akan menjadi titik balik dalam industri ini, dan sebagian besar pengembang akan mulai menggunakan teknologi open source, dan saya memperkirakan pendekatan ini akan dimulai dengan open source kami.

Saya berharap kita dapat bekerja sama untuk memberikan manfaat AI kepada dunia.

Anda dapat mengakses model ini sekarang di llama.meta.com.

Mark Zuckerberg

berita

Llama menjadi model teratas di antara model-model besar, Zuckerberg memulai perdebatan: Bermain open source, zaman telah berubah

Perkenalan

informasi kontak saya