membuat sejarah, model open source alibaba tongyi qwen2.5 masuk sepuluh besar dalam uji buta dunia terhadap model besar

membuat sejarah, model open source alibaba tongyi qwen2.5 masuk sepuluh besar dunia dalam uji buta model besar

2024-09-30

reporter klien chao news, zhang yunshan

menurut berita pada tanggal 29 september, platform pengujian benchmark chatbot arena baru-baru ini mengumumkan daftar tes buta terbaru dari model-model besar. model open source alibaba tongyi qianwen qwen2.5 yang dirilis 10 hari yang lalu sekali lagi masuk ke dalam sepuluh besar di dunia model bahasa besar qwen2.5 -72b-instruct menempati peringkat kesepuluh dalam daftar llm dan merupakan satu-satunya model besar tiongkok yang masuk sepuluh besar; model bahasa visual seri qwen qwen2-vl-72b-instruct menempati peringkat kesembilan dalam daftar vision dan merupakan yang tertinggi -mencetak model besar sumber terbuka.

pada saat yang sama, jumlah model turunan yang dikembangkan oleh komunitas open source global berdasarkan pengembangan sekunder seri qwen melebihi 74.300, melampaui 72.800 model turunan seri llama. tongyi qianwen qwen telah berkembang menjadi keluarga model bahasa generatif terbesar di dunia. di papan peringkat open llm, daftar resmi model sumber terbuka di komunitas hugging face, seri qwen dan model turunannya telah menempati sepuluh kursi teratas.

baik itu performa model atau pengaruh ekologis, qwen telah menciptakan sejarah model besar open source di tiongkok.

qwen2.5-72b-instruct menempati peringkat kesepuluh dalam daftar model bahasa besar chatbot arena

chatbot arena adalah platform pengujian kinerja model besar yang diluncurkan oleh organisasi penelitian terbuka lmsys org. sejak diluncurkan pada mei 2023, chatbot arena telah menjadi arena terpenting bagi model besar top dunia. platform ini saat ini mengintegrasikan lebih dari 70 model besar di seluruh dunia. model-model besar tersebut secara anonim dibagi menjadi beberapa pasangan dan diserahkan kepada pengguna untuk pengujian buta. pengguna memilih kemampuan model berdasarkan pengalaman percakapan nyata.

qwen2.5, dirilis pada 19 september, dengan cepat masuk dalam daftar. skor model andalan qwen2.5-72b-instruct berada di peringkat kesepuluh dalam daftar llm, di belakang o1, gpt-4o, dan model lainnya dari openai, dan merupakan model besar tiongkok. model dengan skor tertinggi; qwen2-vl-72b-instruct, model bahasa visual sumber terbuka pada hari yang sama, menempati posisi kesembilan dalam daftar vision, sedikit di belakang model sumber tertutup seperti gpt-4o dan gemini. -1.5-pro, dan merupakan model sumber terbuka dengan kinerja terbaik. sebelumnya, beberapa model open source di seri qwen telah masuk ke daftar chatbot arena.

chatbot arena secara resmi mengumumkan bahwa qwen2-vl-72b-instruct adalah model bahasa visual sumber terbuka dengan peringkat tertinggi

peluncuran qwen2.5 memicu karnaval di komunitas open source di dalam dan luar negeri. kumpulan model open source ini mencakup model bahasa besar, model multi-modal, model matematika, dan model kode dengan berbagai ukuran mencapai skala yang sama di industri. performa terbaik, lebih dari 1,5 juta unduhan dalam 10 hari peluncuran. beberapa pengembang asing memuji tongyi qianwen sebagai "ai terbuka" yang sebenarnya; beberapa ulasan pengguna menemukan bahwa qwen2.5 adalah level sota dari 0,5b hingga 72b, jadi mereka memulai topik: "semua orang telah menggantinya dengan qwen2.5 apa yang umum terjadi?" model bekas?”

komunitas open source luar negeri memuji qwen2.5

"harap sebutkan sumbernya saat mencetak ulang"

laporan/umpan balik

berita

membuat sejarah, model open source alibaba tongyi qwen2.5 masuk sepuluh besar dunia dalam uji buta model besar

perkenalan

informasi kontak saya