berita

teks lengkap pidato shun xiangyang di forum ilmuwan muda 50²: 10 pemikiran tentang model besar

2024-09-28

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

pada tanggal 28 september, "forum ilmuwan muda 50²" ke-4 diadakan di universitas sains dan teknologi selatan. shen xiangyang, seorang akademisi asing dari akademi teknik nasional, memberikan pidato utama tentang "bagaimana seharusnya kita berpikir tentang model besar di dunia?" era kecerdasan buatan umum" dan memberikan 10 pemikirannya tentang model besar.

berikut isi spesifik dari 10 pemikirannya:

1. daya komputasi adalah ambang batasnya: kebutuhan daya komputasi pada model besar sangat besar dalam 10 tahun terakhir. hari ini kita akan membuat model kecerdasan buatan yang besar, dengan mengatakan bahwa kebuntuan menyakiti perasaan dan kurangnya pemblokiran berarti tidak ada perasaan.

2. data tentang data: jika gpt-5 keluar, volume data bisa mencapai 200t. namun tidak banyak data bagus di internet. setelah dibersihkan, 20t mungkin hampir maksimal. oleh karena itu, di masa depan untuk membangun gpt-5, selain data yang ada, lebih banyak data multi-modal dan bahkan data yang disintesis secara artifisial. akan dibutuhkan.

3. bab selanjutnya dari model besar: ada banyak penelitian ilmiah multimodal yang harus dilakukan. saya percaya bahwa arah yang sangat penting adalah penyatuan pemahaman dan pembangkitan multimodal.

4. pergeseran paradigma kecerdasan buatan: setelah o1 keluar, ide awal pra-pelatihan gpt berubah menjadi jalur pembelajaran mandiri saat ini, yaitu proses penguatan pembelajaran pada langkah inferensi dan pembelajaran mandiri berkelanjutan. keseluruhan prosesnya sangat mirip dengan cara manusia berpikir dan menganalisis masalah, dan juga membutuhkan banyak daya komputasi.

5. model besar menjangkau ribuan industri: dalam gelombang konstruksi model besar di tiongkok, semakin banyak model besar yang digunakan di industri. tren ini pasti seperti ini, dan proporsi model besar secara umum akan semakin mengecil di masa depan.

6. agen ai, dari visi hingga implementasi: aplikasi super sudah ada sejak awal. aplikasi super ini adalah asisten super dan agen super.

7. sumber terbuka vs sumber tertutup: menurut saya llama meta bukanlah sumber terbuka tradisional. ini hanya membuka model dan tidak memberi anda kode dan data asli. oleh karena itu, ketika kita menggunakan sistem sumber terbuka, kita juga harus membuat sendiri pikiran untuk benar-benar memahami gambaran besarnya. sistem model pekerjaan sumber tertutup.

8. perhatikan tata kelola ai: kecerdasan buatan mempunyai dampak besar terhadap ribuan industri dan seluruh masyarakat, dan semua orang harus menghadapinya bersama-sama.

9. memikirkan kembali hubungan manusia-komputer: hanya dengan benar-benar memahami interaksi manusia-komputer, kita dapat menjadi pemimpin yang benar-benar bernilai komersial bagi setiap generasi perusahaan teknologi tinggi. bicara sekarangopenaimenambahkan microsoft berarti era ini masih terlalu dini. mereka sudah maju, namun masih banyak ruang untuk imajinasi di masa depan.

10. sifat kecerdasan: meskipun model besar telah mengejutkan semua orang, kita tidak memiliki teori tentang model besar dan pembelajaran mendalam. tentangaimunculnya permasalahan tersebut hanya sekedar dibicarakan namun tidak dijelaskan secara gamblang.

"forum ilmuwan muda 50²" adalah pertemuan akademik tahunan new cornerstone science foundation, yang diselenggarakan olehuniversitas sains dan teknologi selatan, divisi nilai sosial berkelanjutan tencent, dan new cornerstone science foundation diselenggarakan bersama. new cornerstone science foundation didirikan dan dioperasikan secara independen oleh tencent dengan investasi sebesar 10 miliar yuan selama 10 tahun. saat ini, yayasan ini merupakan salah satu yayasan sains kesejahteraan masyarakat terbesar di tiongkok. pendirian dan pengoperasiannya merupakan investasi jangka panjang tencent di bidang teknologi bagus. tindakan nyata untuk pendanaan ilmu pengetahuan.

"forum ilmuwan muda 50²" adalah platform pertukaran akademik interdisipliner untuk pemenang "penghargaan eksplorasi ilmiah". "penghargaan eksplorasi ilmiah" didirikan pada tahun 2018. ini adalah penghargaan kesejahteraan masyarakat yang didanai oleh new cornerstone science foundation dan dipimpin oleh para ilmuwan. saat ini merupakan salah satu proyek pendanaan terbesar untuk talenta ilmiah dan teknologi muda di tiongkok. setiap pemenang akan membagikan ide besar dan eksplorasi terbarunya di forum setidaknya sekali selama periode pendanaan lima tahun. "50²" berarti bahwa 50 ilmuwan muda yang dipilih oleh "penghargaan eksplorasi ilmiah" setiap tahun akan memberikan pengaruh yang signifikan terhadap terobosan ilmu pengetahuan dan teknologi dalam 50 tahun ke depan.

berikut ini adalahshen xiangyangteks lengkap pidato di forum ini:

saya sangat senang mendapat kesempatan untuk berbagi dengan anda beberapa pembelajaran dan pengalaman terkini mengenai kecerdasan buatan di shenzhen hari ini.

saya akan melanjutkanyao qizhitopik kecerdasan buatan yang pak pak bicarakan, izinkan saya memberi tahu anda tentang beberapa hal yang kita lakukan sekarang di era model besar, terutama melihat masalah ini dari perspektif integrasi teknologi dan transisi industri.

faktanya, bukan hanya pentingnya perkembangan teknologi di era kecerdasan buatan. seluruh sejarah perkembangan manusia adalah sejarah perkembangan teknologi, tanpa teknologi, tidak akan ada pertumbuhan pdb. kita tidak akan melihat kembali hal-hal seperti mengebor kayu untuk membuat api atau menciptakan roda – kita hanya akan melihat banyak terobosan luar biasa dalam bidang fisika dalam 100 tahun terakhir, dan terobosan dalam kecerdasan buatan dan ilmu komputer dalam 70 tahun terakhir. . kita bisa melihat ada banyak peluang.

topik yang kita bicarakan hari ini adalah kecerdasan buatan dan model besar. dalam beberapa tahun terakhir, semua orang pasti terkejut dengan pengalaman baru kecerdasan buatan selangkah demi selangkah. bahkan jika saya telah bekerja di bidang kecerdasan buatan sepanjang hidup saya, akan sulit membayangkan situasi saat ini beberapa tahun yang lalu.

saya ingin membahas tiga contoh: yang pertama adalah menghasilkan teks dari teks, yang kedua adalah menghasilkan gambar dari teks, dan yang ketiga adalah menghasilkan video dari teks. baru saja kita berbicara tentang sistem kecerdasan buatan seperti chatgpt, yang tidak hanya tersedia secara internasional tetapi juga di dalam negeri. misalnya, sebelum saya datang ke sini untuk memberikan pidato hari ini, saya bertanya kepada chatgpt bahwa saya akan berpartisipasi dalam forum ilmuwan muda 50² tencent dan memberikan pidato. topik apa yang harus saya bicarakan berdasarkan latar belakang saya? anda mungkin menganggapnya agak lucu, namun sebenarnya setelah menggunakannya, menurut anda itu sangat bagus.

semua orang sudah familiar dengan chatgpt. dua tahun lalu, openai meluncurkan sistem yang menghasilkan grafik. tujuh bulan lalu, sora dirilis. anda memberinya pesan dan menghasilkan video definisi tinggi berdurasi 60 detik untuk anda, seperti video berjalan di jalanan tokyo ini. (saya tidak akan menampilkan videonya karena keterbatasan waktu.)

izinkan saya memberi anda contoh diagram vinsensian ini. saya mengambil jurusan grafis komputer, dan saya rasa saya memiliki pemahaman yang baik tentang apakah sebuah foto bagus atau buruk. dua tahun lalu, foto ini keluar. ini adalah foto pertama yang dihasilkan oleh kecerdasan buatan dalam sejarah manusia, dan muncul di sampul majalah mode amerika ("cosmopolitan"). seorang seniman digital di san francisco menggunakan sistem openai dan mengajukan pertanyaan, yang menghasilkan hasil berikut. bagian ini adalah: di langit berbintang yang luas, seorang astronot wanita berjalan di mars dan berjalan menuju lensa sudut lebar. saya tidak punya banyak bakat seni, tapi saya sangat terkejut saat melihat gambar ini. saya rasa anda akan setuju dengan saya. ketika kecerdasan buatan membuat gambar seperti itu, itu benar-benar terlihat seperti anggota astronot wanita. jadi kecerdasan buatan ini telah mencapai tingkat yang sangat cerdas.

saat ini kami memiliki teknologi yang luar biasa dan bahkan produk yang luar biasa. kami juga bekerja sangat keras di rumah dan membangun model skala besar. dari teknologi hingga model hingga aplikasi selanjutnya, kami mengerjakan semua aspek. tadi, akademisi yao juga banyak bercerita tentang karya terbaru universitas tsinghua. jadi saya ingin berbagi dengan anda bagaimana kita harus berpikir tentang model besar di era kecerdasan buatan secara umum. saya ingin berbagi beberapa pendapat saya sendiri.

pemikiran pertama adalah bahwa daya komputasi adalah ambang batasnya.

hal terpenting tentang kecerdasan buatan umum saat ini, model besar, dan pembelajaran mendalam adalah pertumbuhan keseluruhan kekuatan komputasi kecerdasan buatan dalam beberapa tahun terakhir.

dalam 10 tahun terakhir, daya komputasi yang digunakan oleh model-model besar telah meningkat, awalnya enam hingga tujuh kali lipat per tahun, dan kemudian lebih dari empat kali lipat per tahun. izinkan saya mengajukan pertanyaan sekarang, jika suatu barang meningkat empat kali setahun, berapa kali lipatnya dalam 10 tahun? anda pikirkan dulu, saya akan membahas masalah ini lagi nanti.

semua orang tahu bahwa perusahaan yang paling diuntungkan dari gelombang pengembangan kecerdasan buatan ini adalahnvidia, pengiriman nvidia meningkat dari tahun ke tahun, kekuatan komputasinya meningkat secara bertahap, dan nilai pasar seluruh perusahaan telah menjadi salah satu dari tiga perusahaan di dunia (microsoft, apple, nvidia) dengan nilai pasar us$3 triliun. yang paling penting adalah karena permintaan daya komputasi setiap orang setiap tahunnya. jumlah chip nvidia yang dibeli pada tahun 2024 masih berkembang pesat. misalnya, elon musk sedang membangun cluster yang terdiri dari 100.000 kartu h100. sangat sulit untuk membangun sistem 10.000 kartu persyaratan jaringan sangat tinggi.

hari ini kita berbicara tentang daya komputasi dan model besar. yang paling penting adalah hukum penskalaan (daya komputasi dan data). semakin besar daya komputasi, semakin banyak kecerdasan yang tumbuh. sayangnya, ketika seluruh jumlah data bertambah, pertumbuhan daya komputasi bukanlah pertumbuhan linier, melainkan pertumbuhan daya komputasi lebih seperti pertumbuhan persegi.

karena ketika model menjadi lebih besar, jumlah data perlu ditingkatkan untuk melatih model, sehingga secara relatif lebih seperti pertumbuhan persegi. oleh karena itu, kebutuhan daya komputasi sangat besar dalam 10 tahun terakhir. jadi saya hanya akan mengatakan satu hal: hari ini saya akan membuat model kecerdasan buatan yang besar. jika macet, itu menyakiti perasaan anda.

saya baru saja bertanya, jika setiap tahun naik 4 kali lipat, berapa kali naiknya dalam 10 tahun? kita semua yang mempelajari komputer tahu bahwa ada sesuatu yang disebut "hukum moore", yang berarti kekuatan komputasi berlipat ganda setiap 18 bulan atau lebih. beginilah perkembangan intel selama bertahun-tahun. mengapa nvidia kini melampaui intel? alasan yang sangat penting adalah tingkat pertumbuhannya berbeda. jika meningkat dua kali lipat dalam 18 bulan, mungkin akan meningkat 100 kali lipat dalam 10 tahun, yang juga sangat luar biasa; jika meningkat 4 kali lipat setiap tahun, maka akan menjadi 1 juta kali lipat dalam 10 tahun. jika dipikir-pikir seperti ini, bisa dimaklumi jika nilai pasar nvidia meningkat begitu pesat dalam 10 tahun terakhir.

pemikiran kedua adalah tentang data.

kekuatan komputasi, algoritme, dan data adalah tiga faktor penting untuk kecerdasan buatan. saya sebutkan sebelumnya bahwa kita memerlukan banyak data untuk melatih kecerdasan buatan secara umum. ketika chatgpt3 keluar, itu masih dalam tahap penerbitan makalah, dan dikatakan membutuhkan 2 triliun data token; pada saat gpt-4 keluar, itu akan menjadi sekitar 12t; hari ini diperkirakan memiliki kuantitas melebihi 20t. siapapun yang peduli dengan kecerdasan buatan tahu bahwa semua orang sudah lama menunggu gpt5 keluar, tapi belum keluar. jika gpt-5 keluar, penilaian pribadi saya mungkin jumlah datanya akan mencapai 200t . melihat ke belakang, tidak banyak data bagus di internet. setelah anda membersihkannya, 20t mungkin hampir menjadi yang teratas. jadi di masa depan, jika anda ingin membangun gpt-5, selain data yang sudah ada, anda memerlukannya lebih banyak data multi-modal, bahkan data yang disintesis secara artifisial.

hal yang sangat menarik adalah dalam tiga puluh atau empat puluh tahun terakhir, setiap orang telah membagikan informasi mereka secara online. di masa lalu, kami mengira kami bekerja untuk mesin pencari tahun untuk sesaat seperti chatgpt, ia mengintegrasikan segalanya dan mempelajari model kecerdasan buatan melalui kekuatan komputasi yang kuat.

pemikiran ketiga, bab selanjutnya dari model besar.

anda sudah bekerja sampai hari ini, apa yang harus anda lakukan selanjutnya? yang pertama adalah model bahasa. diwakili oleh chatgpt, teknologi yang mendasarinya adalah pemrosesan bahasa alami. apa yang dikerjakan semua orang saat ini adalah model multi-modal, yang diwakili oleh gpt-4, dan banyak teknologi di dalamnya adalah visi komputer. ke depan, kita perlu mengembangkan kecerdasan yang terkandung di dalamnya. apa tujuan dari kecerdasan yang diwujudkan? faktanya, kita perlu membangun model dunia. sekalipun multimodal, tidak ada model fisik yang mendasarinya, jadi kita perlu membangun model dunia seperti itu. model dunia berarti anda tidak hanya harus membaca ribuan buku, namun juga melakukan perjalanan ribuan mil untuk memasukkan lebih banyak pengetahuan di dunia kembali ke otak anda. jadi kita harus membuat robot. saya pikir shenzhen harus mengambil keputusan untuk membuat robot dan mewujudkan kecerdasan. ada jalur khusus pada robot yang disebut mengemudi otonom. mengemudi otonom adalah robot khusus, tetapi ia melaju pada rute tertentu.

apa yang harus dilakukan? ada banyak penelitian ilmiah multimodal yang harus dilakukan, dan saya yakin arah yang sangat penting adalah penyatuan pemahaman dan pembangkitan multimodal. kalaupun sora dibangun, generasi multi-modul dan pemahaman multi-modul tidak menyatu. ada banyak penelitian ilmiah yang dapat kita lakukan di bidang ini.

sebagai contoh, beberapa siswa saya membuat perusahaan model besar, step stars, dan pemahaman multimodal mereka sangat baik. jika anda menunjukkan gambar kepada kecerdasan buatan, mengapa perilaku dalam gambar tersebut disebut "keterampilan tidak valid", ai akan menjelaskan kepada anda bahwa gambar tersebut terlihat seperti anak kecil yang berguling-guling di tanah, tetapi ibunya acuh tak acuh, dan dia melihat ponsel dan minum minuman, sehingga keterampilan anak-anak ini disebut keterampilan tidak valid. ai sekarang menjadi semakin baik dalam memahami grafik.

pemikiran keempat adalah perubahan paradigma kecerdasan buatan.

dua minggu lalu, openai merilis model terbarunya, o1. saya sebutkan sebelumnya bahwa gpt telah berkembang. setelah gpt4, gpt5 belum dirilis. semua orang berpikir, jika ini hanya peningkatan parameter model besar, apakah sudah mencapai puncaknya? tidak ada yang tahu, ini belum dirilis, dan kami belum membuat model yang lebih besar di china.

namun kini muncul dimensi baru, yaitu tidak melakukan pra-pelatihan sebelumnya (ekspansi), melainkan melakukan ekspansi saat melakukan inferensi. berubah dari gagasan awal gpt menjadi jalur belajar mandiri masa kini, yaitu proses pemantapan pembelajaran pada langkah penalaran dan pembelajaran mandiri yang berkesinambungan.

dulu, kami melakukan pra-pelatihan, pada dasarnya memprediksi apa kata selanjutnya dan apa yang akan terjadi selanjutnya. sekarang ide barunya adalah membuat draf dan mencoba melihat apakah jalur ini benar dan jalur itu benar. seperti halnya otak manusia, dalam berpikir ada sistem yang cepat dan ada sistem yang lambat. seperti halnya ketika kita mengerjakan soal matematika, kita membuat rancangannya terlebih dahulu untuk melihat cara mana yang akan berhasil pada peluang dalam proses optimalisasi rantai pemikiran. sejauh ini, hanya openai yang merilis sistem seperti itu, dan saya mendorong semua orang untuk melihat beberapa contoh di sini.

yang terpenting keseluruhan prosesnya sangat mirip dengan cara manusia berpikir dan menganalisis masalah, menyusun, memverifikasi, memperbaiki kesalahan, dan memulai dari awal. melakukan hal ini juga memerlukan daya komputasi yang besar.

pemikiran kelima adalah bahwa model-model besar telah menyebar ke ribuan industri.

semua perusahaan harus menghadapi peluang yang dibawa oleh model besar, namun setiap perusahaan tidak perlu membuat model besar universal. jika anda bahkan tidak memiliki 10.000 kartu, tidak ada peluang untuk membuat model besar universal model besar model harus memiliki setidaknya 10.000 kartu.

misalnya, saat gpt4 keluar, total volume pelatihannya adalah 2×10^25 flops. dengan jumlah pelatihan yang begitu besar, dibutuhkan waktu satu tahun untuk menjalankan 10.000 kartu a100 untuk mencapai jumlah tersebut. jika jumlah ini tidak dapat dicapai, tidak akan ada model besar universal yang nyata. dengan model umum yang besar, kita dapat membangun model industri kita sendiri yang besar berdasarkan hal ini, misalnya sektor keuangan dan asuransi. untuk suatu perusahaan, anda memiliki datanya sendiri, termasuk data internal dan data pelanggan. jika anda mengambil data ini dan menggunakan lusinan atau ratusan kartu, anda dapat membuat model yang sangat bagus untuk perusahaan anda. jadi itu dibangun lapis demi lapis.

tentu saja, ada dimensi lain yang sangat penting yang sangat saya sukai, yaitu model pribadi masa depan. saat ini, kami secara bertahap telah menggunakan pc dan ponsel (data telah terakumulasi sampai batas tertentu), dan semakin memahami kami di masa depan, saya yakin akan ada ai super cerdas yang dapat membantu anda setelah mengumpulkan relevan data, itu dapat membangun model pribadi anda sendiri. ini ada di bagian terminal (pribadi), dan telepon seluler adalah hal yang wajar. dalam hal pc, perusahaan pc seperti microsoft dan lenovo juga sedang mempromosikan konsep ai pc, jadi peluang seperti itu juga ada.

dalam gelombang konstruksi model besar di tiongkok, semakin banyak model industri besar yang disertakan. berikut ini contohnya. karena model-model besar tiongkok harus mendapat persetujuan dari administrasi ruang siber tiongkok sebelum dapat online, pada akhir juli tahun ini, total 197 model di tiongkok telah disetujui oleh administrasi ruang siber tiongkok, sebesar dimana 70% adalah model industri besar dan 30% adalah model umum besar. tren ini pasti seperti ini, dan proporsi model besar secara umum akan semakin mengecil di masa depan. misalnya, kita dapat membuat model keuangan pada model besar secara umum. ini adalah model besar yang dibuat oleh sebuah perusahaan di shanghai untuk pelanggan keuangannya. misalnya, ketika laporan keuangan nvidia keluar, anda dapat langsung merangkum hal-hal penting dan permasalahannya.

pemikiran keenam adalah ai agent, mulai dari visi hingga implementasi.

hari ini kita melihat apa saja aplikasi super terbesar dari model besar dan di mana peluang terbesarnya. banyak orang masih mencoba mencari aplikasi super. sebenarnya aplikasi super ini sudah ada sejak awal. aplikasi super ini adalah asisten super, agen super.

gates dan saya bekerja bersama di microsoft selama bertahun-tahun, dan kami berdua memikirkan masalah ini. apa susahnya? kesulitannya terletak pada memahami alur kerja ketika anda benar-benar ingin melakukan pekerjaan yang bermanfaat. jika anda mengajukan pertanyaan, pertanyaan itu dapat dipecah selangkah demi selangkah. apa yang dapat saya lakukan hari ini adalah sesuatu yang mempunyai tingkat pengaruh tertentu, seperti menjadi layanan pelanggan atau asisten pribadi. tapi banyak pekerjaan yang tidak bisa diselesaikan. anda harus menjadi otak digital. model besar di bawah ini hanyalah langkah pertama. kemampuan model besar tidak cukup kuat untuk membantu anda melakukan semua pekerjaan di atas langkah demi langkah. karena memang ingin membuat agen seperti itu, agar bisa melakukan sesuatu, perlu memahami apa saja permasalahan berikut ini, dan setiap bagian memiliki skill yang sesuai.

kami telah melakukan banyak contoh bagus dengan menggunakan model saat ini. misalnya, anda bisa menjadi konsultan kesehatan ai, berbicara tentang pemahaman anda tentang kosmetik, dan merekomendasikan kosmetik.

pemikiran ketujuh adalah open source dan close source.

dalam perkembangan ilmu pengetahuan dan teknologi dunia beberapa dekade terakhir, khususnya perkembangan ilmu pengetahuan dan teknologi tiongkok, ada dua hal yang sangat penting.

yang pertama adalah munculnya internet. dengan internet, anda dapat menemukan semua makalah dan materi secara online.

yang kedua adalah open source. open source memungkinkan anda memperpendek kesenjangan dengan para pemimpin dalam pembuatan aplikasi. namun open source tidak sama dengan open source untuk model dan database yang besar, meskipun kemampuan open source kini mendekati kemampuan close source. ada juga banyak perusahaan di tiongkok yang melakukan hal-hal open source. alat open source terbaik saat ini adalah meta's llama 3.1, yang diklaim dekat dengan openai. menurut saya tidak. menurut saya ini bukan open source tradisional, ini hanya membuka model dan tidak memberi anda kode dan data asli. oleh karena itu, ketika kita menggunakan sistem open source, kita juga harus mengambil keputusan benar-benar memahami penutupan sistem model besar.

pemikiran kedelapan adalah memperhatikan tata kelola ai.

karena ai berkembang begitu pesat, dunia sangat mementingkan keselamatan ai. karena dampak dari hal ini begitu besar. kecerdasan buatan memberikan dampak yang sangat besar terhadap ribuan industri dan seluruh masyarakat. perkembangan dunia sebenarnya menuntut semua orang untuk menghadapinya secara bersama-sama.

pemikiran kesembilan adalah memikirkan kembali hubungan manusia-mesin.

saya baru saja memperkenalkan teks vincent, gambar vincent, dan video vincent - seberapa besar kecerdasan mesin, dan seberapa besar kejutan yang ditimbulkan oleh interaksi manusia-komputer kepada kita?

sekitar 10 tahun yang lalu, kolumnis "new york times" john markoff menulis sebuah buku yang sangat saya sukai, "machine of loving grace", yang merangkum dua jalur perkembangan teknologi di masa lalu: yang satu adalah kecerdasan buatan; intelligent augmentation), yaitu peningkatan kecerdasan, yaitu interaksi manusia-komputer. setelah komputer tersedia, komputer membantu orang melakukan banyak hal, dan bermain catur adalah salah satu contohnya.

faktanya, hanya dengan benar-benar memahami interaksi manusia-komputer kita dapat menjadi pemimpin dengan nilai komersial nyata bagi setiap generasi perusahaan teknologi tinggi. antarmuka kecerdasan buatan saat ini menjadi sangat jelas, yaitu proses dialog. perwakilan saat ini adalah chatgpt. namun berbicara tentang openai plus microsoft berarti era ini masih terlalu dini. mereka sudah maju, namun masih banyak ruang untuk imajinasi di masa depan.

pikiran yang kesepuluh adalah hakikat kecerdasan.

meskipun model besar telah mengejutkan semua orang saat ini, kita tidak memiliki teori tentang model besar dan pembelajaran mendalam. saat ini, kami ingin sekali memiliki teori apa pun yang dirasa bagus. berbeda dengan fisika, dari sudut pandang fisika, segala sesuatu mulai dari langit berbintang yang luas hingga kuantum terkecil dijelaskan oleh beberapa hukum fisika yang indah. saat ini tidak ada teori kecerdasan buatan yang tidak dapat dijelaskan atau kokoh. kerangka pembelajaran mendalam saat ini tidak dapat mencapai kecerdasan buatan umum yang sebenarnya.

mengenai munculnya kecerdasan buatan, semua orang hanya membicarakannya namun tidak menjelaskannya secara jelas. mengapa kecerdasan muncul ketika modelnya cukup besar? mengapa model 70b bisa muncul dengan kecerdasan? tidak ada kebenaran seperti itu. jadi kami juga bekerja sangat keras untuk mengatasi masalah ini. musim panas lalu saya juga mengadakan seminar di universitas sains dan teknologi hong kong dengan tema "teori matematika untuk kecerdasan yang muncul". ketika membahas kecerdasan yang muncul, beberapa prinsip ilmiah dan matematika perlu dijelaskan dengan jelas dan lebih banyak orang yang bersedia mengeksplorasi kebutuhan untuk berpartisipasi. ikut serta, terutama dengan munculnya proyek “penghargaan eksplorasi sains” dan “peneliti batu penjuru baru” tencent, semakin banyak ilmuwan muda yang bergabung, dan mereka memiliki lebih banyak kepercayaan diri dan keyakinan untuk mendalami tugas sulit dalam pembuatannya. terobosan untuk pengembangan kecerdasan buatan di masa depan adalah salah satu pertanyaannya.

sekali lagi selamat kepada seluruh pemenang dan ilmuwan muda. pengembangan ilmu pengetahuan dan teknologi perlu dilakukan oleh generasi muda dari generasi ke generasi, khususnya kecerdasan buatan. terima kasih sekali lagi.