berita

satu artikel untuk memahami meta connect 2024: llama 3.2 telah hadir, kacamata ar orian diluncurkan

2024-09-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


penulis teknologi tencent wu bin hao boyang

editor zheng kejun

pada pukul 1:00 tanggal 26 september waktu beijing, meta connect 2024 tahunan diadakan di menlo park, california. zuckerberg memulai dengan produk baru yang diharapkan, quest 3s, mengumumkan bahwa impian meta tentang metaverse telah mulai menyebar ke pasar konsumen tingkat pemula.

pada saat yang sama, meta juga mengumumkan versi 3.2 terbaru dari model ai besar llama, yang menyediakan kemampuan visual multi-modal, dikombinasikan dengan kemampuan dialog suara ai terbaru, ai voice. arti terbesar dari peluncuran model-model ini adalah bahwa meta telah menyelesaikan semua model multi-modal arus utama, yang meletakkan dasar yang kuat untuk integrasi perangkat keras ai dan xr. pada saat yang sama, beberapa aplikasi ai yang diumumkan oleh meta, seperti ai terjemahan real-time dan ai manusia digital real-time yang sebanding dengan "her 2.0", juga telah mengambil langkah lebih jauh dalam solusi industri dan berpotensi menjadi aplikasi pembunuh. .

selain itu, kacamata ar orion yang dirilis kali ini disebut sebagai kacamata ar paling kuat di permukaan oleh xiao zha. kacamata tersebut juga memberikan lebih banyak pintu masuk ke dunia metaverse masa depan. meski masih belum sempurna, namun juga merupakan produk yang mengusung ambisi bentuk akhir peralatan komputasi spasial ai. menurut pemberitaan media asing, harga produk ini melebihi 10.000 dolar as.

mate masih bersikeras untuk terus maju di dua jalur metaverse dan ai, dan berupaya menggabungkan realitas virtual dan kecerdasan buatan melalui integrasi produk.

pada konferensi connect pada tahun 2024, zuckerberg sekali lagi menunjukkan kepada dunia bentuk pintu masuk dari dunia realitas virtual yang ia paparkan. kita melihat integrasi virtualitas dan realitas, integrasi pengendalian otonom dan kecerdasan buatan, serta bentuk nyata produk dan integrasi pengalaman operasi masa depan.

zuckerberg merangkum konferensi pers tersebut: meluncurkan 5 produk baru, meta bekerja keras membangun masa depan yang lebih terbuka

meta quest 3s telah hadir, harga diturunkan tetapi bahan tidak

meta quest 3s adalah yang pertama kali muncul, dan kali ini jarang merilis harga produk lebih awal dari parameter dan fitur baru.

zuckerberg sangat ingin memberi tahu semua orang bahwa kacamata vr baru ini hanya dijual seharga $299,99, yang berarti lebih murah $200 dibandingkan quest 3 yang dirilis pada periode yang sama tahun lalu.

meta quest 3s memiliki chip qualcomm snapdragon xr2 gen 2 dan memori berjalan 8gb yang sama dengan "kakaknya" quest 3, yang berarti mereka memiliki kekuatan pemrosesan yang persis sama untuk menghitung data.

pada saat yang sama, quest 3s menggunakan pengontrol touch plus yang sama dengan quest 3 dan mendukung teknologi penangkapan gerakan mata dan tangan.

bahkan quest 3s memiliki daya tahan baterai lebih lama. menurut data resmi yang diberikan meta, quest 3s dengan baterai internal 4324mah mampu bertahan hingga 2,5 jam, sedangkan quest 3 dengan kapasitas baterai lebih besar (5060 mah) hanya mampu bekerja maksimal 2,2 jam.

sebagai produk kacamata virtual reality murah, yang disayangkan dari quest 3s adalah tidak menggunakan struktur optik pancake yang lebih mainstream. ia menggunakan lensa fresnel yang sama dengan seri quest 1 dan 2. desainnya relatif lebih matang dan berbiaya rendah, tetapi ini juga berarti ukuran dan berat keseluruhannya akan lebih besar dibandingkan quest 3.

namun perbedaan nyata antara kedua produk ini adalah perbedaan efek tampilan: quest 3s menggunakan lcd fast-switching 1832 x 1920 (20 ppd piksel per derajat) dengan kecepatan refresh 90/120 hz.

bidang pandang horizontal dan vertikalnya hanya 96 dan 90 derajat, dibandingkan dengan quest 3 yang berukuran 2064 x 2208 (25 ppd piksel per derajat) dan bidang pandang horizontal 110 derajat dan vertikal 96 derajat.

jelas sekali, quest 3s menunjukkan ambisi meta di bawah impian metaverse selama bertahun-tahun. quest 3s menggunakan kacamata realitas virtual dengan konfigurasi inti yang mendekati produk mainstream tetapi lebih murah untuk mempromosikan mempopulerkan kacamata vr ke basis pengguna yang lebih luas.

kekuatan pendorong lain yang mendorong meta untuk menciptakan produk semacam itu adalah ekosistem realitas virtualnya, yang masih terus membaik secara bertahap.

pada konferensi pers, zuckerberg mengatakan bahwa quest 3s akan mendukung teknologi dolby vision dan menambahkan fungsi pengenalan layar yang dapat mengidentifikasi komputer yang digunakan dan mentransmisikan layar dengan satu klik. hal ini memperluas skenario penggunaan yang lebih luas dari produk realitas virtual yang dipasang di kepala seperti quest 3s.

namun, meta mengacaukan satu hal: saat demonstrasi langsung teknologi ini, quest 3s tiba-tiba mengalami crash, yang menyebabkan sorakan dari penonton zuckerberg tidak punya pilihan selain menghadapinya.

selanjutnya, zuckerberg menunjukkan versi terbaru dari horizon worlds. meskipun masih terlihat seperti permainan "bermain rumah", namun perlahan membaik: tahun ini, fungsi youtube multi-pemain avantar diluncurkan.

dari segi aplikasi pihak ketiga, kejutan terbesar datang dari "batman: arkham shadow", yang akan dirilis pada 22 oktober dan akan dibundel dengan quest 3 dan 3s baru dan akan berlaku hingga april tahun depan. "alien: rogue invasion" yang diumumkan sebelumnya dan game zombie "arizona sunshine" juga akan diluncurkan di platform quest. selain itu, meta juga mengumumkan akan meluncurkan wordle (permainan kata yang diterbitkan setiap hari oleh new york times) untuk quest.

oh iya, agar kamu bisa membeli quest 3s yang baru, meta telah berinisiatif menghentikan produksi quest 2 dan quest pro setelah inventaris kedua produk ini terjual habis, satu-satunya pilihan yang bisa kamu pilih adalah quest 3s yang lebih murah, atau quest 3s yang lebih murah. ini adalah quest 3 dengan konfigurasi yang lebih tinggi.

xiao zha berkata bahwa model sisi akhir paling kuat llama 3.2 telah hadir

meta meluncurkan model besar multi-modal llama 3.2, versi ringannya dapat dijalankan di ponsel

seperti konferensi connect terakhir, protagonis dari konferensi ini juga sangat diperlukan: ai.

zuckerberg mengumumkan pembaruan 3.2 dari model dasarnya llama. model besarnya tersedia dalam versi 90b dan 11b, dan model sisi akhir tersedia dalam ukuran 1b dan 3b.

xiao zha mendemonstrasikan fitur produk baru yang dikembangkan untuk llama 3.2: dengan mengunggah gambar, anda tidak hanya dapat menghapus dan menambahkan fungsi kuas ajaib, tetapi juga secara langsung mengubah pakaian karakter berdasarkan deskripsi teks, dan bahkan mengganti latar belakang saat ini dengan pelangi.

menurut dokumentasi teknis yang diberikan mata, llama 3.2 dapat langsung dipahami sebagai versi llama 3.1 yang mendukung multi-modalitas. karena meta tidak memperbarui parameter model bahasanya selama proses pelatihan pengenalan gambar.

dalam hal metode pelatihan, meta menggunakan metode yang lebih konvensional, yaitu menambahkan adaptor gambar dan encoder ke llama3.1, menggunakan model difusi untuk melatih teks dan gambar yang sesuai, dan kemudian melakukan penyesuaian konten domain.

terakhir, pada tahap penyesuaian model pasca-pelatihan, llama 3.2 juga menggunakan beberapa putaran penyesuaian yang diawasi, pengambilan sampel penolakan (menggunakan distribusi tambahan untuk menghasilkan sampel, dan menerima atau menolak sampel sesuai dengan probabilitas tertentu) dan preferensi langsung optimasi. biarkan model selaras.

menariknya, selama proses ini, meta menggunakan llama 3.1 untuk menghasilkan beberapa set keterangan gambar guna mengoptimalkan deskripsi model gambar.

meta menggunakan llama 3.1 untuk menghasilkan beberapa set subtitle gambar untuk mengoptimalkan deskripsi model gambar.

dalam hasil pengujian yang diberikan oleh meta, kemampuan penalaran grafis llama 3.2 versi 90b lebih unggul dari gpt 4o-mini dalam beberapa pengujian. versi 11b secara komprehensif melampaui versi haiku, versi lebih kecil dari claude 3.

zuckerberg mengatakan bahwa versi sisi klien 1b dan 3b dari llama 3.2 akan menjadi ai sisi klien yang paling kuat.

saat ini menerima input dan output teks dan mendukung panjang konteks maksimum 128 ribu token. kedua model sisi akhir ini dilatih melalui pemangkasan (pemangkasan parameter dengan pemanfaatan rendah pada model besar) dan distilasi (menggunakan model besar sebagai pengajar dan mode pelatihan parameter inti pembelajaran model kecil) pada llama 3.1 8b dan 70b. selama proses pelatihan penyempurnaan, data sintetis yang disediakan oleh llama 3.1 405b juga ditambahkan untuk mengoptimalkan kinerjanya dalam berbagai kemampuan seperti peringkasan, penulisan ulang, mengikuti instruksi, penalaran bahasa, dan penggunaan alat.

konferensi pers menunjukkan bahwa llama 3.2 versi 3b melampaui model gemma 2 2b yang dirilis oleh google pada bulan juni dan model phi 3.5 3.8b yang dirilis oleh microsoft pada bulan agustus dalam banyak hal, terutama dalam hal fungsi sisi terminal yang umum digunakan seperti sebagai ringkasan, mengikuti perintah dan keuntungan skor terlihat jelas dalam tugas menulis ulang.

misalnya, pada set pengujian ifeval, yang menguji kemampuan untuk mematuhi instruksi pengguna, versi llama 3.2 3b meningkat lebih dari 20% dibandingkan dengan phi 3.5 dengan ukuran yang sama. dalam dua benchmark yang menguji kemampuan memanggil alat, llama 3.2 juga memiliki keunggulan yang jelas.

hal ini memungkinkan llama 3.2 menjadi apa yang dikatakan xiao zha saat ini sebagai “yang terkuat” dalam hal pengalaman aplikasi praktis di sisi perangkat. namun dari segi kemampuan dasar seperti penalaran dan matematika, llama 3.2 3b sebagian besar tertinggal dari phi 3.5 mini.

selain itu, model ini mendukung perangkat keras qualcomm dan mediatek pada hari peluncuran dan dioptimalkan untuk prosesor arm.

selain llama 3.2 yang mendukung pemahaman multimodal gambar, kali ini meta juga meluncurkan meta ai voice di connect. menyelesaikan semua fungsi multimodal utama sekaligus. dalam demonstrasi langsung, seperti gpt-4o, dapat mendukung interupsi dialog dan suaranya sangat natural, namun sayangnya tidak menunjukkan bahwa ia memiliki intonasi dan ekspresi emosional yang kaya seperti gpt-4o.

meski performanya hanya setara gpt-4o, meta ai voice menemukan nilai jual baru: memberikan pilihan suara untuk 5 selebriti, seperti judi dench dari bos wanita berwajah dingin di tahun 007, dan heroine dari crazy rich asians . suara protagonis lin jiazhen.

dibandingkan openai yang digugat ke pengadilan karena diduga mencuri suara scarlett johansson, meta jelas lebih bisa diandalkan dalam hal ini. menurut wall street journal, meta telah membayar "jutaan dolar" untuk setiap suara selebriti. beberapa selebritas ingin membatasi penggunaan suara mereka dan memastikan mereka tidak bertanggung jawab jika meta ai digunakan.

menurut "reuters", celebrity voice akan diluncurkan minggu ini di amerika serikat dan pasar berbahasa inggris lainnya melalui rangkaian aplikasi meta, termasuk facebook, instagram, dan whatsapp.

selain melengkapi kemampuan model dasar, meta juga mendemonstrasikan beberapa fitur baru pada aplikasi ai. fitur-fitur ini sebagian besar didukung oleh solusi ai yang ada, namun meta melangkah lebih jauh. ini juga lebih cocok untuk skenario penggunaan media sosial atau kacamata ai.

misalnya, meta ai studio kini mendukung pembangunan langsung sistem manusia digital ai. dalam demonstrasi langsung, latensi percakapan dengan manusia digital sangat rendah, dan efek gerakan serta suaranya nyata dan alami.

meta ai studio mendukung secara langsung pembangunan sistem manusia digital ai

bayangkan memiliki ai yang berbicara kepada anda dengan suara dan wajah nyata sebagai pendamping emosional anda. saya ingin menyebutnya sebagai her 2.0 yang "terlihat".

apakah hal ini akan mengantarkan masa keemasan produk pendamping ai masih harus diuji lebih lanjut oleh pengguna.

produk lain yang sangat menakjubkan adalah terjemahan meta live. dengan kemampuan multi-modal baru meta ai, ia dapat langsung mengenali dan mengganti bentuk mulut bahasa asli ke bentuk mulut bahasa target. fitur ini sebenarnya telah diterapkan oleh perusahaan seperti heygen, namun berdasarkan luasnya cakupan aplikasi meta, fitur ini mungkin menjadi produk terkait pertama yang sepenuhnya populer.

meskipun llama 3.1 sudah menjadi model sumber terbuka yang paling banyak digunakan oleh pengembang, untuk memperluas lapisan aplikasi dengan lebih baik, meta juga merilis alat pengembangan produk llama resmi pertama versi rilis llama stack di konferensi connect, yang dapat sangat menyederhanakan alur kerja pengembang menggunakan model llama di lingkungan yang berbeda, dan juga dapat mengaktifkan penerapan aplikasi berbasis alat dengan satu klik seperti pengambilan generasi yang ditingkatkan (rag) dan fungsi keamanan terintegrasi.

peluncuran llama 3.2 sangat penting bagi meta. teknologi ini melengkapi kekurangan utama llama dalam model multi-modal mutakhir, dan juga memberikan landasan bagi fungsi multi-modal pada produk perangkat keras ai berikutnya, seperti kacamata ray-ban yang mendukung kecerdasan ai.

produk populer "kacamata ray-ban", serang saat setrika masih panas dan luncurkan produk baru

pada konferensi meta connect tahun lalu, mungkin tidak ada yang menyangka bahwa produk terpopuler bukanlah quest 3, melainkan produk kacamata ai generasi kedua yang diluncurkan oleh meta dan produsen kacamata ray-ban.

meski belum diketahui generasi pertamanya, namun tidak menyurutkan semangat para pecinta teknologi di eropa dan amerika serikat untuk bergegas membeli kacamata pintar ray-ban generasi kedua. menurut statistik idc, meta telah mengirimkan lebih dari 700.000 pasang kacamata ray-ban , terutama volume pesanan pada kuartal kedua tahun ini yang lebih tinggi dibandingkan generasi pertama yang meningkat lebih dari dua kali lipat dari kuartal ke kuartal. sepanjang siklus hidup kacamata ray-ban meta, pada mei 2024, penjualan globalnya telah melampaui 1 juta unit, dan pasar memperkirakan pengiriman setahun penuh pada tahun 2024 akan melebihi 1,5 juta unit.

meta menyerang saat setrika masih panas dan langsung meluncurkan produk barunya pada tahun ini.

daripada mengatakan ini adalah produk baru, lebih baik dikatakan bahwa ini adalah gaya tembus pandang yang benar-benar baru, karena desain keseluruhannya sama persis dengan tahun lalu.

namun ia memiliki bodi kacamata transparan dengan kesan teknologi yang lebih kuat - seperti yang diharapkan, perusahaan perangkat keras di seluruh dunia memiliki pemahaman yang sama tentang "sense of technology", yang harus tembus pandang.

meta telah menambahkan lebih banyak fungsi ai pada kacamata generasi ini. peningkatan terbesar adalah penambahan fungsi pengenalan gambar kecerdasan buatan real-time, yang memungkinkan pengguna bertanya kepada kacamata ray-ban meta tentang pemandangan atau objek yang sedang mereka lihat. pengguna juga dapat memindai kode qr langsung melalui kacamatanya dan menghubungi nomor telepon yang terlihat.

selain itu, kacamata hitam ini juga mendukung fungsi pengingat seperti ponsel pintar, terjemahan bahasa real-time termasuk inggris ke prancis, italia, atau spanyol, dan integrasi dengan aplikasi streaming musik seperti amazon music, audible, dan iheart radio yang terintegrasi.

orian, bentuk ultimate kacamata ar menurut meta?

orian seharusnya sudah diproduksi secara massal sejak lama, namun karena pengetatan anggaran meta secara keseluruhan akibat epidemi, zuckerberg memutuskan untuk menunda peluncurannya. hal ini mengakibatkan meta tidak meluncurkan produk kacamata ar pertamanya hingga tahun 2024.

ini adalah kacamata ar yang beratnya hanya 98 gram, tidak terlalu ringan di antara produk kacamata ar.

rangka orian terbuat dari paduan magnesium, yang lebih ringan dari aluminium dan lebih mudah menghilangkan panas. lensanya terbuat dari silikon karbida, yang tahan lama, ringan, dan memiliki indeks bias tinggi, sehingga cahaya yang dipancarkan proyektor pada kacamata meluas ke area tampilan yang lebih luas.

namun menyebut orian sebagai kacamata ar sepertinya tidak terlalu berlebihan. jika ingin berfungsi dengan baik, perlu bekerja sama dengan gelang dan badan komputasi.

badan komputasi memberikan lebih banyak kekuatan pemrosesan, dan kacamata tidak dapat bekerja sendiri tanpanya. jika anda ingin menggunakan orian secara normal, anda harus selalu memakai badan komputasi di sisi anda.

gelang ini memiliki fungsi yang lebih menarik, terbuat dari bahan tekstil berperforma tinggi dan menggunakan elektromiografi (emg) untuk memahami sinyal saraf yang terkait dengan gerak tubuh. dalam beberapa milidetik, sinyal-sinyal ini diubah menjadi sinyal masukan dan dikomunikasikan ke agen komputasi, seperti film fiksi ilmiah.

dari segi tampilan, orion memiliki bidang pandang 70 derajat dan dilengkapi dengan proyektor micro led di dalam bingkainya, yang dapat memproyeksikan gambar ke substrat silikon lensa .

zuckerberg berharap orang-orang akan menggunakan orion untuk dua tujuan utama: berkomunikasi dengan informasi digital yang diterapkan di dunia nyata, dan berinteraksi dengan kecerdasan buatan.

yang terakhir ini lebih mudah dipahami. orion memiliki kemampuan ai yang sama dengan kacamata ray-ban meta, termasuk kemampuan pengenalan gambar dan kemampuan interaksi bahasa yang baru ditambahkan.

yang pertama lebih abstrak. pada adegan tersebut, meta mendemonstrasikan pemandangan yang menggabungkan gambar holografik dengan dunia nyata. meta mengembangkan aplikasi messenger versi ar untuk kacamata ini, yang dapat mewujudkan panggilan video proyeksi holografik secara real-time, seolah-olah pihak lain sedang berdiri di sampingnya. anda.

untuk mempromosikan kacamata ar, meta juga menghadirkan huang renxun sebagai pengguna gelombang pertama yang merasakan orion. zuckerberg berkata: "huang telah mencobanya dan mengatakan itu bagus"!

dalam pandangan zuckerberg, pematangan kacamata ar akan terjadi secara bertahap. di satu sisi, kacamata kecerdasan buatan tanpa tampilan, seperti ray-ban meta, akan lebih cepat dipopulerkan.

di sisi lain, akan dipopulerkan oleh kacamata dengan layar kecil, seperti hypernova mendatang dari meta, yang dapat memberikan interaksi sentuhan yang lebih mudah, seperti berinteraksi dengan meta ai atau berkomunikasi dengan teman.

xiao zha mengatakan bahwa orion mewakili bentuk akhir dari kacamata ar: kacamata ar yang matang memiliki daya komputasi yang cukup untuk memungkinkan anda meninggalkan ponsel cerdas di rumah.

meski begitu, meski terpisah dari ponsel, namun tetap harus membawa perangkat komputasinya saat bepergian, yang masih jauh dari bentuk akhir yang kita bayangkan.

selain itu, ada juga baskom berisi air dingin yang dituangkan tepat waktu: daya tahan baterai orion hanya 2 jam. sederhananya, orion hanya bisa mengizinkan anda menjadi superhero di dunia maya selama 2 jam.

dan mewujudkan kebebasan tertinggi dari kacamata ar mungkin tidak terlalu murah. menurut pemberitaan media asing seperti the verge dan techcrunch, saat memamerkan mesin uji tersebut, staf meta mengatakan bahwa harga perangkat keras orion saat ini melebihi us$10.000. artinya, harga produk ini jauh lebih tinggi dibandingkan vision pro milik apple.

kesimpulan

dari kegagalan metaverse di tahun 2022 dan diejek banyak pihak, hingga menjadi raja ai open source di tahun 2023, dan kemudian menggunakan kacamata pintar di tahun ini untuk membuka pintu ke perangkat keras ai generasi baru. zuckerberg menyelesaikan serangan balik yang hampir mustahil dalam tiga tahun terakhir.

selama periode ini, dua keputusan pentingnya: membuat ai open source dan mengembangkan kacamata pintar yang ringan, keduanya membuahkan hasil di connect hari ini.

dari tampilan kacamata ray-ban yang dilengkapi fungsi ai, kita memang sudah melihat keunggulan kacamata sebagai pembawa di era ai: tidak hanya bisa menggunakan suara untuk memanggil model berukuran besar, tapi juga bisa langsung memanfaatkan potensinya. dari ai multimodal. "melihat" langsung adalah pengalaman pengguna yang jauh lebih alami dibandingkan "memindai" dengan ponsel. dan keterusterangan ini kemungkinan besar akan menentukan perpindahan perangkat pintar generasi berikutnya.

orion yang terakhir dirilis merupakan karya masa depan yang mengusung ambisi bentuk akhir peralatan komputasi spasial ai. dibandingkan dengan vision pro yang berat dan tidak nyaman, visi mr ringan xiao zha lebih mirip masa depan komputasi spasial. dan kini visi tersebut telah terwujud. jika migrasi perangkat pintar di era ai ditakdirkan untuk terjadi, meta adalah perusahaan yang paling dekat dengan ambang batasnya dibandingkan dengan upaya kecil seperti ai pin.

jika anda berbicara dengan seseorang di tahun 2022 tentang semua ini, dia pasti tidak akan mempercayainya.zuckerberg, seorang tech nerd yang terlihat agak teduh, benar-benar menepati janjinya dan membawa kita semakin dekat ke pintu masuk metaverse.