berita

teleai menyelesaikan pelatihan model besar wanka wangan produksi nasional pertama, telechat2-115b sumber terbuka

2024-09-29

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

baru-baru ini, institut penelitian kecerdasan buatan china telecom (disebut sebagai: teleai) berhasil menyelesaikan model besar triliunan parameter pertama di tiongkok berdasarkan pelatihan klaster wanka yang diproduksi secara nasional (disebut sebagai: wanka wancan), dan secara resmi membuka sumber yang pertama di dalam negeri. model yang dihasilkan berdasarkan cluster wanka yang diproduksi secara nasional. telechat2-115b, model besar dengan ratusan miliar parameter yang dilatih oleh cluster huawanka dan kerangka pembelajaran mendalam dalam negeri, adalah model besar star semantics.

ini merupakan tonggak sejarah dan pencapaian penelitian ilmiah penting lainnya yang dipimpin oleh profesor li xuelong, cto, kepala ilmuwan china telecom group, dan dekan china telecom artificial intelligence research institute. hal ini menandai bahwa pelatihan model skala besar di dalam negeri telah benar-benar mewujudkan substitusi nasionalisasi dan secara resmi memasuki pasar. tahap baru inovasi independen, keamanan dan pengendalian untuk produksi dalam negeri.

telechat2-115b telah dilatih berdasarkan "platform layanan komputasi cerdas terintegrasi" tianyi cloud yang dikembangkan sendiri oleh china telecom dan "platform ai xinghai" milik perusahaan kecerdasan buatan. telechat2-115b menggunakan berbagai metode pengoptimalan untuk meningkatkan efisiensi dan akurasi pelatihan model sekaligus memastikan pelatihan akurasi. stabilitas, mencapai lebih dari 93% efisiensi komputasi gpu dengan daya komputasi yang sama, sedangkan waktu pelatihan efektif model menyumbang lebih dari 98%.

sumber terbuka telechat2-115b menandai perjalanan baru lainnya untuk lokalisasi model besar. sebagai badan usaha milik negara pertama yang merancang dan membuat model besar menjadi sumber terbuka, teleai secara aktif mendorong kemajuan berkelanjutan dari teknologi model besar melalui sumber terbuka, dan terus mendorong dan memimpin transisi cepat inovasi teknologi ke penerapan industri.

dalam daftar pengujian opencampass pada bulan mei tahun ini, kemampuan penalaran logis model seri telechat menduduki peringkat pertama dalam daftar model besar open source. sebagai versi generasi baru, telechat2-115b menduduki peringkat pertama dengan skor 86,9 poin dalam daftar komprehensif model akses terbuka evaluasi c-eval terbaru yang dirilis pada bulan september. kemampuan umumnya hampir 30% lebih tinggi dibandingkan model seri telechat, terutama dalam hal penggunaan alat, penalaran logis, perhitungan matematis, pembuatan kode, dan penulisan bentuk panjang.

telechat2-115b menempati peringkat pertama dalam daftar lengkap model akses terbuka c-eval

dapat dipahami bahwa model semantik besar yang dikembangkan sendiri oleh teleai telah memenangkan tempat pertama di banyak kompetisi resmi. diantaranya, ia memenangkan tempat pertama dalam evaluasi pemahaman semantik spasial tiongkok dan evaluasi ekstraksi jenis peristiwa sejarah tiongkok kuno pada konferensi ccl2024. selain itu, ia juga berhasil meraih juara pada nlpcc2024 chinese argumentative paper mining (shared task5) challenge.

(informasi)

laporan/umpan balik