berita

nvidia meluncurkan model ucapan visual baru nveagle, yang dapat mengobrol sambil melihat gambar

2024-09-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

pinwan melaporkan pada tanggal 2 september bahwa menurut berita resmi nvidia, nvidia bekerja sama dengan tim peneliti georgia tech, umd dan hkpu untuk meluncurkan model bahasa visual baru-nveagle.

dilaporkan bahwa nveagle dapat memahami adegan kehidupan nyata yang kompleks dan memberikan interpretasi dan respons yang lebih baik melalui masukan visual.inti dari desainnya adalah mengubah gambar menjadi markup visual dan kemudian menggabungkannya dengan penyematan teks untuk meningkatkan pemahaman informasi visual. nveagle mencakup tiga versi: eagle-x5-7b, eagle-x5-13b dan eagle-x5-13b-chat. diantaranya, versi 7b dan 13b terutama digunakan untuk tugas bahasa visual umum, sedangkan versi 13b-chat secara khusus disesuaikan untuk ai percakapan dan dapat berinteraksi lebih baik berdasarkan masukan visual.

keunggulan nveagle adalah penerapan mekanisme mixed expert (moe), yang secara dinamis dapat memilih encoder visual yang paling tepat berdasarkan tugas yang berbeda, sehingga sangat meningkatkan kemampuan pemrosesan informasi visual yang kompleks.model ini telah dipublikasikan di hugging face agar mudah digunakan oleh para peneliti dan pengembang.