Laporan Mingguan AI |. Model besar tidak dapat menentukan mana yang lebih besar, 9.11 atau 9.9; OpenAI merilis model ringan GPT-4o mini

Laporan Mingguan AI |. Model besar tidak dapat menentukan mana yang lebih besar, 9.11 atau 9.9 merilis model ringan GPT-4o mini

2024-07-21

Model besar tidak bisa menentukan mana yang lebih besar, 9.11 atau 9.9

Soal matematika yang sulit bagi siswa sekolah dasar telah membuat bingung banyak model AI besar di dalam dan luar negeri. Mana yang lebih besar, 9.11 atau 9.9? Mengenai masalah ini, pada tanggal 17 Juli, reporter China Business News menguji 12 model besar, di antaranya Alibaba Tongyi Qianwen, Baidu Wenxinyiyan, Minimax dan Tencent Yuanbao menjawab dengan benar, tetapi ChatGPT-4o, Byte Doubao, Dark of the Moon Mian kimi, Zhipu Qingyan , Pengetahuan Nol Satu Segala Sesuatu, Bintang Langkah Yuewen, Baichuan Zhibai Xiaoying, Diskusi Shangtang semuanya mendapat jawaban yang salah, dan cara yang salah berbeda. Sebagian besar model besar secara keliru membandingkan angka setelah koma desimal dalam Tanya Jawab dan mengira bahwa 9,11 lebih besar dari 9,9.

Komentar: Di balik kesalahan tersebut, kemampuan matematika yang buruk dari model besar adalah masalah yang sudah berlangsung lama. Beberapa orang dalam industri percaya bahwa model bahasa generatif dirancang untuk lebih mirip pemikiran literal daripada pemikiran numerik. Namun, pelatihan korpus yang ditargetkan secara bertahap dapat meningkatkan kemampuan model dalam menjawab pertanyaan sains di masa depan.

OpenAI merilis model ringan GPT-4o mini, biaya model turun 99% dalam dua tahun

Pada tanggal 18 Juli waktu setempat, OpenAI merilis model besar ringan baru GPT-4o mini. Menurut laporan, GPT-4o mini akan menggantikan GPT-3.5 Turbo di robot tanya jawab ChatGPT mulai sekarang, dan pengguna perusahaan akan dapat mengakses GPT-4o mini mulai minggu depan. “Kami berharap GPT-4o mini akan memperluas penerapan kecerdasan buatan dan membuat kecerdasan buatan lebih terjangkau.” Menurut sebuah artikel di situs resmi OpenAI, harga input GPT-4o mini adalah 15 sen ($0,15)/juta. token (elemen kata). ), harga keluarannya adalah 60 sen (USD 0,6)/juta token, 60% lebih murah dibandingkan GPT-3.5 Turbo. OpenAI mengatakan perusahaan juga akan terus mengurangi biaya sambil meningkatkan kinerja model. Dibandingkan dengan model text-davinci-003 tahun 2022, harga GPT-4o mini telah turun sebesar 99%.

Komentar: Meskipun OpenAI belum merilis model generasi berikutnya GPT-5, OpenAI masih memperbarui model berdasarkan kemampuan yang ada dan terus menurunkan biaya model besar. Produsen model besar lainnya juga mempromosikan model ringan tahun ini. Google merilis model ringan Gemini 1.5 Flash pada bulan Mei tahun ini. Seri Claude 3 yang dirilis oleh Anthropic pada bulan Maret menyertakan Claude 3 Haiku yang ringan. Model besar dengan parameter lebih kecil telah menunjukkan potensi besar tahun ini. Pelatihan dapat meningkatkan kinerja dengan meningkatkan jumlah data daripada meningkatkan jumlah parameter.

Enam produsen model besar merespons masalah buruknya kemampuan digital model besar

Reporter China Business News baru-baru ini menghubungi dan mewawancarai sejumlah produsen model besar, termasuk Alibaba Tongyi, Tencent Hunyuan Team, Dark Side of the Moon Kimi, MiniMax Conch, Xueersi Jiuzhang, NetEase Youdao, dll. Selama wawancara, mereka menjawab pertanyaan-pertanyaan besar. masalah model matematika yang buruk. Wang Xiaoming, manajer produk Laboratorium Tongyi Alibaba, mengatakan bahwa masalah serupa adalah masalah penghitungan matematis dan penalaran logis yang umum, dan juga merupakan kasus yang sering diuji oleh pengembang selama proses pelatihan dan penggunaan model. jawaban yang salah". "Ini sebenarnya pertanyaan tentang probabilitas. Tim Tencent Hunyuan menyatakan bahwa model besar itu sendiri adalah model probabilistik, dan sulit untuk menyelesaikan masalah perhitungan numerik atau perbandingan secara stabil dalam berbagai keadaan.

Komentar: "Mana yang lebih besar, 9.11 atau 9.9?" tidak sulit bagi manusia, tetapi untuk model besar, pertanyaan ini tidak mudah dijawab. Dilihat dari jawaban yang komprehensif, pandangan yang disebutkan oleh penanggung jawab produsen model besar antara lain bahwa model besar belum secara akurat mengontrol aturan penghitungan atau perbandingan antar angka pada tahap yang sangat awal. Banyak orang dalam industri juga percaya bahwa di masa depan, perlu untuk meningkatkan tingkat kecerdasan model dasar yang mendasarinya dan menyelesaikan kesalahan tersebut dari tingkat data pelatihan dan alat eksternal. Solusi akhirnya mungkin adalah meningkatkan kemampuan generasi berikutnya model. Penemuan kasus-kasus seperti itu akan membantu produsen meningkatkan pemahaman mereka tentang batasan kemampuan model besar.

Undang-undang Kecerdasan Buatan akan mulai berlaku di seluruh UE pada tanggal 1 Agustus

Undang-undang Kecerdasan Buatan pertama di dunia (UU AI UE) yang dikeluarkan oleh Uni Eropa akan berlaku di seluruh UE pada tanggal 1 Agustus. Undang-undang ini juga merupakan undang-undang paling komprehensif yang menargetkan pengawasan kecerdasan buatan yang dirilis di dunia sejauh ini. Undang-Undang Kecerdasan Buatan UE juga meletakkan dasar bagi peraturan kecerdasan buatan global, yang bertujuan untuk mencapai “efek Brussel” yang sama seperti Peraturan Perlindungan Data Umum (GDPR). Menurut RUU terbaru, perusahaan yang melanggar peraturan akan dikenakan denda administratif hingga 35 juta euro atau 7% dari pendapatan tahunan maksimum, mana saja yang lebih tinggi.

Komentar: UE selalu menjadi yang terdepan dalam regulasi teknologi. Undang-Undang Kecerdasan Buatan UE adalah undang-undang regulasi kecerdasan buatan komprehensif pertama di dunia, yang menunjukkan pandangan ke depan dan kepemimpinan UE di bidang regulasi teknologi. Namun, peraturan tersebut juga akan meningkatkan biaya operasional perusahaan. You Yunting, mitra di Firma Hukum Dabang Shanghai, mengatakan bahwa sejak penerapan GDPR, biaya perusahaan, terutama biaya kepatuhan, telah meningkat secara signifikan. Undang-Undang Kecerdasan Buatan juga diperkirakan akan mengalami hal yang sama, yang berarti perusahaan harus berinvestasi pada peraturan baru dan menunjuk personel yang berdedikasi untuk mempelajari kebijakan kepatuhan, selain itu, pemrosesan pemberitahuan pelanggaran, sistem pengungkapan publik, dan lain-lain juga akan meningkatkan biaya.

Nilai tujuh model utama setelah mengikuti "Ujian Masuk Perguruan Tinggi" dirilis: hanya dua mata pelajaran sains yang dapat diambil

Pada bulan Juni sebelumnya, OpenCompass, sistem evaluasi Sinan di bawah Laboratorium Kecerdasan Buatan Shanghai, merilis hasil evaluasi makalah lengkap pertama dari ujian masuk perguruan tinggi AI, yang menunjukkan bahwa kandidat AI dapat memperoleh skor maksimal 303 poin dalam tiga mata pelajaran selain bahasa dan matematika, dan gagal dalam semua matematika. Pada tanggal 17 Juli, OpenCompass selanjutnya merilis penilaian yang memperluas cakupan mata pelajaran. Tim tersebut menguji 7 model AI besar di seluruh 9 mata pelajaran ujian masuk perguruan tinggi, sehingga dapat dibandingkan dengan nilai penerimaan ujian masuk perguruan tinggi.

Jika AI mengikuti ujian masuk perguruan tinggi, di universitas mana ia bisa diterima? Tes OpenCompass menemukan bahwa jika model besar mengikuti ujian seni liberal, nilai terbaik dapat "diterima" pada satu buku, namun jika mengikuti ujian sains, paling banyak hanya dapat "diterima" pada dua buku (berdasarkan garis skor Provinsi Henan, yang memiliki jumlah ujian masuk perguruan tinggi terbanyak tahun ini) sebagai referensi).

Komentar: Dilihat dari evaluasi guru penilaian, dibandingkan dengan calon manusia, model besar saat ini masih memiliki keterbatasan besar. Setelah menyelesaikan penilaian, para guru sepakat bahwa meskipun model besar memiliki kinerja yang baik dalam penguasaan pengetahuan dasar, namun masih kurang memuaskan dalam hal penalaran logis dan penerapan pengetahuan yang fleksibel. Khususnya, ketika menjawab pertanyaan subjektif, model besar seringkali tidak dapat sepenuhnya memahami batang pertanyaan dan tidak memahami arah kata ganti, sehingga menghasilkan jawaban yang salah; ketika menjawab pertanyaan matematika, proses pemecahan masalah bersifat mekanis dan kurang logis. masalah dengan logika spasial sering terjadi.

Li Feifei menetaskan "unicorn", valuasi World Labs melebihi US$1 miliar

Pada 17 Juli, dilaporkan bahwa valuasi World Labs, sebuah startup "kecerdasan spasial" yang didirikan oleh ilmuwan komputer terkenal Tiongkok Li Feifei, telah melampaui US$1 miliar. Startup ini terutama menggunakan teknologi pemrosesan data visual mirip manusia untuk melengkapi AI dengan kemampuan penalaran tingkat lanjut.

Sejak didirikan pada bulan April tahun ini, World Labs telah melakukan dua putaran pendanaan, dengan investor termasuk investor teknologi terkemuka Andreessen Horowitz dan dana AI Radical Ventures. Dapat dipahami bahwa putaran pendanaan terakhir perusahaan ini mungkin mencapai sekitar US$100 juta. Li Feifei, Andreessen Horowitz dan Radical Ventures tidak menanggapi permintaan komentar.

Komentar: Sebagai sosok legendaris, tren kewirausahaan Li Feifei juga menarik banyak perhatian industri. Li Feifei menjadi profesor tetap di Departemen Ilmu Komputer di Stanford pada usia 33 tahun, seorang akademisi di National Academy of Engineering pada usia 44 tahun, dan saat ini menjabat sebagai direktur Stanford Human-Centered Artificial Intelligence Institute (HAI). ). ImageNet, tolok ukur pencapaian di bidang computer vision, juga didorong olehnya. Ia memiliki banyak murid, seperti Andrej Karpathy yang pernah bekerja di OpenAI dan Tesla, serta Jim Fan yang saat ini bekerja di Nvidia, dll. Mereka juga merupakan tokoh berpengaruh di bidang AI.

Raksasa produsen chip AI dan cloud "menangkap" perusahaan AI global

Menurut statistik dari Crunchbase, sebuah perusahaan database layanan perusahaan, pembiayaan untuk startup AI global pada paruh pertama tahun ini meningkat sebesar 24% dibandingkan tahun lalu menjadi US$35,6 miliar Investasi AI dalam beberapa tahun terakhir. Menurut statistik publik dari China Business News, Nvidia telah berinvestasi atau mengakuisisi tidak kurang dari 16 perusahaan terkait AI pada tahun ini, dan sebagian besar putaran pendanaan berjumlah lebih dari 100 juta dolar AS. Setelah Microsoft berinvestasi di OpenAI, Microsoft juga berpartisipasi dalam berbagai putaran pendanaan dengan total lebih dari 100 juta dolar AS pada tahun ini. Google telah menerapkan ekosistem AI secara ekstensif melalui berbagai platform investasinya dan berpartisipasi dalam tidak kurang dari 31 putaran pendanaan. Dalam putaran ledakan investasi AI ini, tokoh-tokoh aktif termasuk AMD, Amazon, SoftBank, dll.

Komentar: Popularitas AI secara intuitif tercermin dalam investasi. Gaya investasi dan preferensi raksasa-raksasa besar tidak persis sama. Perlu dipertimbangkan apakah mereka adalah produsen yang bisnis utamanya adalah perangkat keras semikonduktor seperti Nvidia dan AMD, atau produsen cloud seperti Microsoft, Google, dan Amazon, semuanya. berharap untuk berinvestasi di beberapa perusahaan besar. Vendor model dan vendor cloud lebih bersedia untuk mengikat secara kuat model start-up yang besar. Mengamati putaran pembiayaan terbesar di industri tahun ini, kita dapat menemukan bahwa model dasar berukuran besar, kendaraan otonom, data AI, dan robot humanoid adalah titik fokus terbesar.

Inggris meluncurkan penyelidikan antimonopoli ke Microsoft, kesepakatan Infleksi AI

Regulator antimonopoli Inggris, Otoritas Persaingan dan Pasar (CMA), baru-baru ini menyatakan bahwa mereka telah memulai penyelidikan antimonopoli formal terhadap transaksi Microsoft-Inflection AI. Pada bulan Maret tahun ini, Microsoft setuju untuk membayar $650 juta kepada startup AI, Inflection AI, untuk melisensikan perangkat lunak AI-nya. Selain itu, Microsoft mengumumkan perekrutan salah satu pendiri Inflection AI Mustafa Suleyman dan Karén Simonyan, serta sebagian besar karyawan perusahaan.

Komentar: Valuasi Inflection AI sekitar US$4 miliar. Orang dalam industri mengatakan bahwa perilaku Microsoft setara dengan mencaplok Inflection AI dengan harga murah. Berbeda dengan akuisisi, Inflection AI tetap mempertahankan teknologi miliknya. Selain Inggris, bulan lalu ada laporan bahwa Komisi Perdagangan Federal AS (FTC) juga sedang meninjau kesepakatan tersebut. Menurut laporan, FTC telah mengeluarkan panggilan pengadilan kepada Microsoft dan Inflection AI, meminta dokumen yang relevan dari dua tahun terakhir.

Perusahaan robot humanoid Zhuji Dynamics menyelesaikan pembiayaan Seri A

Pada tanggal 15 Juli, China Business News mengetahui bahwa start-up robot humanoid umum Zhuji Dynamics menyelesaikan pembiayaan Seri A, dipimpin oleh China Merchants Venture Capital, platform investasi ekuitas swasta SAIC Group Shangqi Capital, dan pemegang saham lama Fengrui Capital, Oasis Capital, dan Mingshi Capital juga berpartisipasi dalam investasi, dan jumlah pembiayaan belum diungkapkan. Sebelumnya, Alibaba juga berinvestasi di Zhuji Dynamics. Zhuji Dynamics didirikan pada tahun 2022. Pendirinya Zhang Wei adalah profesor tetap di Universitas Sains dan Teknologi Selatan. Produk Zhuji Dynamics mencakup robot humanoid ukuran penuh, robot berkaki empat, robot bipedal, dan solusi terkait.

Komentar: Banyak perusahaan robot humanoid yang masih dalam proses pendanaan. Tahun ini, ada acara pendanaan yang konstan di jalur robot humanoid. Pada bulan Januari tahun ini, Era Xingdong mengumumkan penyelesaian pembiayaan putaran malaikat senilai lebih dari 100 juta yuan. Selanjutnya, Teknologi Yushu mengumumkan penyelesaian pembiayaan putaran B2 sebesar 1 miliar yuan, Robot Eksplorasi Kepler menyelesaikan pembiayaan putaran malaikat, dan Robot Universal Galaxy menyelesaikan pendanaan putaran malaikat. pembiayaan putaran 700 juta yuan. Raksasa internet Tencent, Baidu, dan Alibaba masing-masing berinvestasi di UBTECH, Zhiyuan Robot, dan Zhuji Dynamics, sementara Meituan berinvestasi di Galaxy Universal Robots dan Yushu Robot. Setelah perusahaan robot humanoid mengumpulkan dana, langkah selanjutnya adalah bagaimana menerapkan produksi massal.

NVIDIA dan Mistral AI merilis model besar Mistral-NeMo

Menurut berita pada 19 Juli, NVIDIA dan startup Perancis Mistral AI merilis model bahasa besar Mistral-NeMo AI, yang memiliki 12 miliar parameter dan jendela konteks (jumlah maksimum token yang dapat diproses oleh model AI pada satu waktu) dari 128.000 token. Model besar AI Mistral-NeMo terutama ditujukan untuk lingkungan perusahaan dan mengimplementasikan solusi kecerdasan buatan tanpa menggunakan sumber daya cloud dalam jumlah besar.

Komentar: Mistral AI telah menyelesaikan pembiayaan sebesar 600 juta euro tahun ini, dan daftar investornya termasuk Nvidia dan Samsung. Microsoft sebelumnya juga telah mengumumkan investasi sebesar 15 juta euro pada Mistral AI, yang akan diubah menjadi ekuitas dalam putaran pembiayaan Mistral AI berikutnya. Mistral AI telah bermitra dengan Nvidia untuk meluncurkan model besar, dan perusahaan juga akan menyeimbangkan dan mencari kerja sama di antara raksasa-raksasa besar. Nvidia semakin terlibat dalam ekosistem AI. Sebelumnya, Nvidia telah membuat model seri Nemotron-4 340B menjadi open source untuk digunakan pengembang guna menghasilkan data sintetis untuk melatih model bahasa besar.

berita

Laporan Mingguan AI |. Model besar tidak dapat menentukan mana yang lebih besar, 9.11 atau 9.9 merilis model ringan GPT-4o mini

Perkenalan

informasi kontak saya