berita

bagaimana cara menggunakan ai untuk mengubah sains?

2024-09-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

teks |. merpati putih

editor|wang yisu

“logika yang mendasari ai untuk sains berbeda dengan logika pelatihan model bahasa besar saat ini.” lu jintan, direktur teknis teknologi shenzhen, mengatakan dengan blak-blakan bahwa logika kecerdasan buatan saat ini di bidang penelitian ilmiah dan penerapan skala besar. model bahasa di industri lain tidak sama.

sudah diketahui secara luas di industri bahwa pelatihan model bahasa besar bergantung pada "pengumpanan" data berkualitas tinggi. semakin banyak data, semakin kuat kemampuan model bahasa besar. namun, di beberapa bidang penelitian ilmiah tertentu, jumlah datanya relatif langka. misalnya, untuk jenis struktur protein tertentu, mungkin diperlukan waktu beberapa tahun untuk memperoleh ratusan data eksperimen berkualitas tinggi.

hal ini juga berarti bahwa penerapan ai dalam bidang penelitian ilmiah memerlukan data yang relatif lebih sedikit untuk mencapai efek model yang lebih baik.

jadi, bagaimana tepatnya ai mengubah ilmu pengetahuan? dan bagaimana cara menjalankan model bisnisnya? sebagai salah satu perusahaan perwakilan ai untuk sains, shenzhen technology telah memberikan pemikiran dan solusi tersendiri.

dalam komputasi ilmiah tradisional, jika anda ingin memprediksi sifat fisik molekul dan atom melalui informasi strukturalnya, anda biasanya perlu melakukan perhitungan mikroskopis yang dikombinasikan dengan masalah praktis. saat ini, industri masih kurang dalam mewujudkan kemampuan komputasi lintas skala tersebut dan lebih mengandalkan penilaian empiris dan verifikasi eksperimental.

pada saat yang sama, dengan perluasan skala sistem komputasi, jumlah perhitungan dalam perhitungan ilmiah tradisional telah meningkat secara eksponensial, seringkali mencapai puluhan ribu atau bahkan ratusan juta sistem skala atom jika perhitungan sepenuhnya bergantung pada fisik konvensional model, waktu penghitungan keseluruhan akan menjadi siklusnya bisa sangat panjang.

"teknologi shenzhen dapat membuat model menghasilkan hasil penghitungan yang mendekati keakuratan model fisik, dan pada saat yang sama sangat meningkatkan kinerja penghitungan." lu jintan berkata, "kami menggunakan ai agar sesuai dengan metode fisik ini, yang mungkin ada sebelumnya memerlukan sejumlah besar perhitungan. segalanya menjadi lebih cepat."

mengambil contoh pengenalan gambar, intinya adalah menganalisis informasi piksel gambar. dengan memperkenalkan jaringan saraf konvolusional, jaringan ini dapat mengekstrak fitur lokal dalam gambar, menguraikan gambar asli ke dalam peta fitur yang berbeda, dan melakukan solusi perkiraan melalui fitur. kombinasi. ini sebenarnya ini adalah analisis reduksi dimensi.

faktanya, ai juga merupakan aplikasi pengurangan dimensi di bidang ilmiah. ai mengurangi kompleksitas komputasi melalui kemampuan pemodelannya yang kuat, terutama pada tahap awal yang melibatkan penghitungan lintas skala. pada saat yang sama, berdasarkan kemampuan model besar multimodal, analisis multidimensi dan prediksi berbagai jenis data seperti struktur molekul, sifat fisik, data eksperimen, dll juga dapat dicapai.

misalnya, dalam proses penemuan obat, biasanya pertama-tama perlu menganalisis struktur protein dan titik target, lalu menyaring kandidat senyawa dengan afinitas tinggi terhadap titik target dari ratusan ribu atau bahkan jutaan perpustakaan senyawa. penilaian multidimensi biasanya dilakukan, termasuk analisis afinitas, prediksi dan evaluasi sifat kimia farmasi (seperti toksisitas, penyerapan, metabolisme, dll.).

“di bidang ai untuk sains, kunci dari model besar yang mendukung penghitungan lintas skala terletak pada skala parameter yang besar dan kemampuan generalisasi yang kuat. banyaknya parameter model memungkinkannya menangkap fenomena fisik, kimia, dan biologi yang kompleks, dan kemampuan generalisasi yang kuat "model dasar dapat memprediksi sifat obat yang relevan berdasarkan struktur mikronya, dan juga dapat diterapkan pada bidang material saat model ditransfer." stabilitas dan keadaan fisik material lainnya pada suhu dan tekanan yang berbeda.”

oleh karena itu, pemahaman teknologi shenzhen tentang model umum dasar dalam ai untuk sains lebih terletak pada seperangkat model pra-pelatihan dasar yang dapat diterapkan ke berbagai bidang industri untuk memecahkan masalah melalui penyesuaian.

beberapa model dasar yang saat ini dipelajari oleh teknologi shenzhen masih dapat memperoleh hasil yang baik dengan pelatihan data yang terbatas, dan dapat lebih dioptimalkan dan direvisi berdasarkan data berkualitas lebih tinggi yang diperoleh. di bawah sistem model ini, memungkinkan ai untuk mempelajari prinsip-prinsip ilmiah dasar itu sendiri dan melalui pelatihan tambahan dengan sejumlah kecil data domain sudah dapat mencapai hasil yang baik, yang sedikit berbeda dari model bahasa besar.

lu jintan mengatakan kepada light cone intelligence, “sumber data di bidang komputasi ilmiah tidak tersebar luas, dan tidak banyak kumpulan data publik. jadi, sebagian besar pekerjaan kami saat ini adalah bagaimana membuat efek pelatihan model lebih besar lebih efektif berdasarkan kumpulan data kecil.

dalam dua tahun terakhir, teknologi shenzhen juga telah berhasil meluncurkan serangkaian model industri besar, seperti model simulasi molekuler dpa, model konformasi molekul 3d uni-mol, model pelipatan protein uni-fold, model struktur asam nukleat uni-rna, uni-rna -dock mesin docking molekul obat berkinerja tinggi, dan model bahasa besar multi-modal literatur ilmiah uni-smart, dll.

menurut lu jintan, teknologi shenzhen saat ini memiliki ratusan model di bidang bahan dan obat-obatan, dan model tersebut juga telah berhasil diintegrasikan ke dalam platform produk teknologi shenzhen.pada saat yang sama, teknologi shenzhen juga telah mencapai kerja sama strategis dengan puluhan perusahaan farmasi terkemuka di industrinya, dan juga akan mencapai terobosan komersialisasi pada tahun 2023, dengan pendapatan melebihi 100 juta.

saat ini, bisnis teknologi shenzhen telah mencakup pendidikan cerdas di universitas, penelitian dan pengembangan biomedis, dan material baterai baru.

namun menurut klasifikasi algoritma ai untuk sains saat ini, pengembangan secara keseluruhan masih pada tahap l2, yang mendekati akurasi eksperimental. masih lebih berorientasi pada manusia, menggunakan perhitungan model untuk membantu manusia dan mengurangi stres.

pada tahap l3, ai dapat langsung memberikan hasil, dan dalam beberapa skenario, dapat langsung menggantikan eksperimen manusia.

jika anda ingin berpindah dari l2 ke l3, "kesulitan utamanya adalah keakuratan setiap tautan harus mencapai ketinggian tertentu. pada saat yang sama, bagaimana mengintegrasikan algoritma di setiap tautan juga merupakan tantangan besar." dikatakan.

menghadapi masa depan, lu jintan percaya bahwa ruang pasar ai untuk sains cukup besar, baik dalam bidang pendidikan dan penelitian ilmiah, biomedis, atau bahan baterai, penambahan ai sebenarnya dapat memecahkan banyak masalah mendasar, setidaknya pada tingkat eksperimental. , dan memberdayakan masyarakat. industri, eksplorasi perbatasan, dll. memberikan lebih banyak ide dan titik masuk.

berikut detail percakapan antara guangcone intelligence dan lu jintan, direktur teknis teknologi shenzhen (dihapus dan diedit oleh guangcone intelligence):

teknologi shenzhen menggunakan ai

meningkatkan kualitas dan efisiensi penelitian dan pengembangan ilmu pengetahuan

t: model-model besar telah mengubah pemrosesan bahasa alami, pembuatan video dan gambar.

a:model bahasa besar telah mulai digunakan dalam penambangan informasi literatur, informasi paten, dan bidang lainnya.kami menyebutnya model besar literatur, kami juga memiliki beberapa hasil penelitian di bidang ini juga akan melakukan beberapa aplikasi multi-modal seperti interpretasi gambar dan grafik.

dalam komputasi ilmiah tradisional, masalah yang sering dihadapi berasal dari skala mikro hingga makro. model fisik yang berbeda digunakan untuk memecahkan masalah, namun kemampuannya masih kurang dalam beberapa skenario komputasi lintas skala. misalnya, jika kita ingin memprediksi sifat makroskopis suatu molekul melalui informasi struktur atomnya, kita memerlukan kemampuan untuk membuat model dalam berbagai skala.

kecerdasan buatan mencakup model-model besar, yang dapat mencapai pemodelan lintas skala. dengan mempelajari model fisik tersebut dan kemudian menerapkannya pada masalah tertentu, masalah tersebut dapat diselesaikan dengan baik.

kita biasanya perlu melakukan penghitungan throughput yang besar, seringkali pada sistem dengan puluhan ribu atau bahkan ratusan juta atom. jika penghitungan didasarkan pada model fisik, jangka waktunya akan relatif lama. apa yang dilakukan teknologi shenshi di sini adalah memungkinkan model menghasilkan hasil perhitungan yang mendekati keakuratan model fisik, dan pada saat yang sama, dapat meningkatkan kinerja komputasi secara signifikan.

t: bagaimana cara mengubah penghitungan pada skala sistem yang terdiri dari ratusan juta atom menjadi penghitungan dalam bidang model besar?

a:pada skala mikroskopis, interaksi antara dua atom dapat dianalisis melalui model fisika, seperti persamaan mekanika klasik atau mekanika kuantum, untuk menghitung gaya interaksi dan lintasan gerak di antara keduanya. saat ini perhitungannya hanya perlu mempertimbangkan pengaruh timbal balik dari dua atom, dan masalahnya relatif sederhana. namun, seiring bertambahnya jumlah atom dalam sistem, situasinya menjadi lebih rumit. misalnya, ketika atom ketiga dimasukkan, selain mempertimbangkan interaksi berpasangan antara masing-masing atom, efek banyak benda di antara ketiganya juga harus dianalisis. pada saat ini, interaksi dan lintasan antar atom tidak hanya bergantung pada dua atom, tetapi ditentukan bersama oleh keadaan keseluruhan sistem, dan besarnya perhitungan meningkat secara nonlinier. para ilmuwan sering memperkenalkan algoritma perkiraan, seperti teori fungsional kepadatan atau simulasi dinamika molekuler, untuk menangani perhitungan secara efisien pada skala yang berbeda.

apa yang dilakukan ai pada awalnya adalah menggunakan ai untuk menyesuaikan persamaan fisik ini dan meningkatkan kinerja komputasi. ini dapat dibandingkan dengan pengenalan gambar. poin intinya adalah menganalisis berbagai piksel. setelah kami menambahkan jaringan saraf konvolusional, ini akan membagi gambar menjadi gambar fitur dan kemudian melakukan solusi perkiraan. apa yang kami lakukan pada masa-masa awal kecerdasan buatan di bidang komputasi ilmiah juga dapat dilihat sebagai tindakan pengurangan dimensi, yaitu membuat hal-hal yang sebelumnya memerlukan perhitungan dalam jumlah besar menjadi lebih cepat.

t: apa perbedaan antara metode penghitungan ai tradisional dan munculnya model besar?

a:definisi model besar relatif kabur, dan jumlah parameter umumnya digunakan sebagai indikator. semakin banyak parameter, semakin besar pula jumlah perhitungannya. bagi kami, ini lebih tentang menyediakan penghitungan multiskala. model pra-pelatihan kami saat ini, uni-mol, didasarkan pada struktur tiga dimensi molekul dan atom, memprediksi sifat fisik yang relevan, menetapkan hubungan struktur-aktivitas, dan menyelesaikannya secara langsung pengalaman. metode ini menggabungkan perhitungan pada skala yang berbeda dan memberikan metode perhitungan baru untuk bidang-bidang seperti ilmu material.

saat kami menangani model besar, kami biasanya lebih menekankan kemampuan generalisasi model. di bidang ai untuk sains, hal ini relatif umum. misalnya, model dasar dapat memprediksi beberapa sifat terkait obat berdasarkan struktur mikro. jika model ini dimigrasikan, model tersebut dapat diterapkan pada bidang material. namun, sifat yang menjadi perhatian mungkin bukan sifat obat, tetapi sifat di bawahnya keadaan suhu dan tekanan yang berbeda, sehingga pemahaman kita tentang model umum dasar dalam ai untuk sains lebih merupakan sekumpulan model pra-pelatihan dasar yang dapat diterapkan pada berbagai bidang industri untuk memecahkan masalah melalui penyesuaian.

t: apa peran utama multimodalitas?

a:ini melibatkan penggabungan berbagai jenis data, seperti struktur molekul, sifat fisik, data eksperimen, dll., untuk analisis komprehensif. misalnya, dalam proses penemuan obat, biasanya perlu menganalisis struktur protein dan titik target terlebih dahulu, lalu menyaring senyawa dengan afinitas tinggi terhadap titik target dari ratusan ribu atau bahkan jutaan perpustakaan senyawa selama proses penyaringan , prosesnya dapat mencakup analisis afinitas, analisis khasiat obat, apakah beracun, apakah bermanfaat bagi penyerapan tubuh manusia, dll. ini mungkin analisis multidimensi. oleh karena itu, jika anda ingin mendapatkan efek penyaringan yang lebih baik, anda perlu menganalisisnya dari berbagai sudut dan properti.

masalah multi-modal yang umum seperti gambar dan video mungkin lebih mirip dengan aplikasi multi-modal kita dalam penambangan data dokumen. misalnya, dalam sebuah makalah, tidak hanya informasi teks di dalam makalah yang perlu dibaca, tetapi juga informasi gambar , dan informasi gambar perlu dilakukan penambangan mendalam, kemudian diintegrasikan dengan informasi teks, dan akhirnya mengeluarkan hasilnya. dalam literatur, kami juga menerapkan kemampuan multimodal yang umum ini.

t: seberapa besar permintaan data model di bidang ai untuk sains?

a:beda bidang tentu berbeda. semakin banyak semakin baik. ada juga masalah kesulitan dalam mendapatkannya. misalnya, dalam aplikasi tersegmentasi di bidang biomedis dan bidang baterai, kesulitan memperoleh data berbeda. di industri dengan siklus penelitian dan pengembangan dan verifikasi yang panjang, keluaran data akan relatif kecil, dan jumlah data absolut akan terbatas. . misalnya, untuk beberapa jenis struktur protein tertentu, mungkin hanya ada beberapa ratus catatan dalam beberapa tahun, namun di bidang lain, datanya pasti lebih dari itu.

namun, model fisik dasar dapat menghasilkan lebih banyak data. beberapa model dasar yang sedang kami pelajari masih dapat memperoleh hasil yang baik dalam pelatihan data terbatas, dan dapat dioptimalkan serta diperbaiki berdasarkan data berkualitas lebih tinggi yang diperoleh di masa mendatang. di bawah sistem model kami, memungkinkan ai untuk mempelajari prinsip-prinsip ilmiah dasar itu sendiri dan melalui pelatihan tambahan dengan sejumlah kecil data domain sudah dapat mencapai hasil yang baik, yang sedikit berbeda dari model bahasa besar.

t: bagaimana cara membuat ai mempelajari logika ilmiah dasar dan kemudian memecahkan masalah aplikasi tertentu?

a:umumnya beberapa model fisik digunakan untuk melakukan penghitungan secara langsung, kemudian data yang dihasilkan dilatih, kemudian model fisik tersebut disimulasikan.

t: apa hubungan antara model besar dasar dan model besar dari setiap tipe vertikal? haruskah saya melatih sendiri model besar dasar, atau menggunakan model besar sumber terbuka pihak ketiga?

a:skenario yang berbeda berbeda. jika mengacu pada model bahasa yang besar, ini lebih banyak digunakan dalam interpretasi dokumen, seperti interpretasi kertas. aplikasi dasarnya adalah untuk menafsirkan sebuah makalah. karena pertimbangan biaya, beberapa model umum yang besar akan digunakan untuk membantu saya menafsirkan makalah tersebut. jika kami ingin menafsirkan banyak makalah, atau bahkan melakukan penelusuran keseluruhan di perpustakaan makalah kami yang besar, termasuk penelusuran dan analisis paten, maka kami akan menggunakan model literatur yang kami kembangkan sendiri untuk melakukan interpretasi makalah yang lebih rinci.

oleh karena itu, kami masih mengerjakan produk untuk pengguna. kami dapat memutuskan model mana yang lebih cocok untuk produk kami, dan kami juga akan menentukan pilihan berdasarkan pertimbangan biaya.

saat ini, kami menyebut banyak model sebagai model pra-pelatihan. misalnya, dpa yang kami rilis tahun lalu adalah sekumpulan model pra-pelatihan untuk menghitung fungsi potensial antar atom dari berbagai unsur waktu lalu, berharap hal ini dapat memobilisasi beberapa kekuatan open source, kita dapat berkontribusi dan berbagi data bersama untuk melatih model agar lebih matang.

t: berapa banyak model yang dimiliki teknologi shenzhen sekarang?

a:kami sekarang memiliki ratusan model gabungan di bidang material dan obat-obatan.

pendapatan melebihi 100 juta, bekerja sama dengan lusinan perusahaan farmasi

model bisnis teknologi shenzhen

t: bisakah anda berbagi kemajuan penelitian dan pengembangan terkini teknologi shenzhen di bidang pengobatan ai?

a:di bidang kedokteran, kami sebenarnya sedang fokus pada penelitian praklinis, yang mencakup hampir semua skenario komputasi praklinis, seperti penemuan target awal dan analisis struktur protein, hingga analisis target, penyaringan molekuler, dan analisis afinitas, hingga prediksi sifat, dll . rangkaian tautan ini berisi banyak metode penghitungan seperti itu, dan sekarang kami telah menerapkan algoritme.

dikombinasikan dengan skenario medis, kami mengemas semua algoritme ini ke dalam satu produk, yaitu platform desain obat kami hermite. kami sekarang pada dasarnya bekerja sama dengan 50 perusahaan farmasi dalam negeri teratas di berbagai bidang, terutama yang melibatkan tiga aspek, salah satunya adalah bioteknologi (bioteknologi). , satu adalah cro (organisasi penelitian klinis), dan satu lagi adalah farmasi (perusahaan farmasi), yang masing-masing memiliki perusahaan perwakilannya sendiri.

pekan lalu, kami baru saja menandatangani perjanjian kerja sama dengan emiten dalam negeri, eastern sunshine, yang membuat obat influenza oseltamivir. ia juga baru saja mendapat tiga sertifikasi kelas satu di amerika serikat. bisnis terkait. bekerjasama.

selain perusahaan tipikal di bidang biomedis seperti dongguang sunshine, kami sebenarnya juga bekerja sama dengan banyak lembaga penelitian ilmiah dan universitas yang bergerak dalam penelitian dan pengembangan obat, seperti universitas ilmu kedokteran china barat, rumah sakit xiangya, dan perguruan tinggi kedokteran.

t: produk kami saat ini sebenarnya dapat digunakan langsung menggunakan browser, dan penerapan secara keseluruhan juga sangat ringan. apakah semua metode penerapan produk inti seperti ini?

aya, sebagian besar yang kami lakukan secara online adalah pekerjaan inferensi ai. pekerjaan pelatihan biasanya diselesaikan secara offline, sehingga jumlah data yang akan ditransfer tidak terlalu besar. akan ada juga sejumlah kecil skenario pelatihan, dan ini lebih berbasis pada penyempurnaan model yang telah dilatih sebelumnya. hal ini juga dapat dilakukan dengan sejumlah kecil data, dan tekanan transmisi data juga kecil. penerapan yang ringan tidak berarti kami tidak menggunakan daya komputasi yang cukup. sistem ini menggunakan cloud hybrid dan daya komputasi hpc di belakang sistem, namun dikemas sebagai akses browser bagi pengguna. jika ini merupakan skenario privatisasi, kita juga perlu menerapkan sistem daya komputasi di belakangnya, yang tidak diperlukan pada saas.

secara umum, perusahaan besar perlu diprivatisasi. karena mereka memiliki persyaratan privasi data yang sangat tinggi, dalam beberapa skenario serupa dengan pengajaran atau di beberapa lembaga penelitian, mereka dapat digunakan sementara untuk topik tertentu tanpa memerlukan penerapan yang diprivatisasi.

q: bagaimana sebenarnya perkembangan proyek dengan koperasi yang ada saat ini? tepatnya pada tahap apa?

a:kerja sama kami dengan perusahaan farmasi terutama pada proses perhitungan. perusahaan tidak memproduksi obat, sehingga tidak ikut serta dalam proses pengembangan obat perusahaan farmasi.

kami pada dasarnya adalah full-link load. kami sekarang juga mencoba beberapa bidang dan eksplorasi baru, seperti mengintegrasikan perangkat lunak ke dalam laboratorium otomatis yang berfokus pada penelitian dan pengembangan perangkat keras, sehingga dapat bersama-sama melayani lebih banyak perusahaan, karena kebutuhan perusahaan farmasi sangat besar. masih cukup besar. betapa rumitnya.

dan dari segi pendapatan, pendapatan kami tahun lalu melebihi 100 juta.

ada dua model bisnis kerjasama kami dengan perusahaan farmasi, yang pertama menjual perangkat lunak, dan yang lainnya adalah penelitian dan pengembangan bersama.

banyak perusahaan besar akan ditempatkan secara lokal dan mampu mendukung tim mereka sendiri dan memiliki dana yang cukup untuk mendukung pembelian perangkat lunak. namun, beberapa mungkin merupakan perusahaan farmasi inovatif berukuran sedang atau baru yang tidak memiliki alat produksi yang canggih dan talenta yang sesuai untuk mendukung mereka penggunaan alat ini, mereka memilih untuk mengembangkan bersama dengan kami. kami dapat membantu mereka melakukan lebih banyak perhitungan. karena ini menyangkut keamanan data dan informasi, integrasi antara kedua pihak sangat erat.

namun banyak perusahaan farmasi besar yang memiliki dana dan bakat yang cukup, dan mereka bahkan berharap kami dapat memberi mereka beberapa layanan yang disesuaikan sambil menyediakan saas kepada mereka.

masa depan ai untuk sains

t: saya telah melihat beberapa klasifikasi algoritma saat ini, yang sangat mirip dengan lima klasifikasi mengemudi otonom. status apa yang dapat kita capai pada tahap l2? sejauh mana model ini dapat menggantikan model eksperimental sebelumnya? bisakah anda memberikan contoh kasus dari skenario tertentu?

a:dalam skenario l2, kami menyebutnya lebih dekat dengan akurasi eksperimental, dan lebih berorientasi pada manusia, komputasi untuk membantu manusia dan mengurangi tekanan eksperimental. karena terdapat perbedaan besar antara berbagai sistem dalam perancangan obat, kami telah mampu mencapai akurasi eksperimental yang mendekati pada beberapa sistem. jadi bukan berarti pengguna tidak perlu melakukan eksperimen sama sekali, tetapi saya dapat membantu pengguna melakukan hal-hal yang lebih mendasar, seperti penyaringan molekuler. mungkin 1 juta senyawa obat. ai dapat membantu pengguna menyaring ratusan ribu senyawa obat akhirnya, mungkin selebihnya memerlukan peneliti ilmiah untuk melakukan verifikasi eksperimental, dan besaran eksperimen akan sangat berkurang.

q: apa kesulitan berpindah dari l2 ke l3?

a:pemahaman saya tentang l3 ini adalah ai bisa langsung memberikan hasil yang setara dengan menggantikan langsung eksperimen manusia dalam skenario tertentu. kesulitan untuk mencapai l3 terutama terletak pada kenyataan bahwa keakuratan setiap tautan harus mencapai tingkat tertentu. selain itu, banyak algoritma yang terlibat, dan integrasi berbagai algoritma juga merupakan suatu kesulitan. integrasi algoritma sebenarnya mirip dengan sistem alur kerja yang lengkap, dan sistem ini dapat terus meninjau dan mengoptimalkan dirinya sendiri.

t: apakah ada pengulangan dalam keseluruhan teknologi dari masa lalu hingga saat ini? dan apakah akan ada hambatan dalam pengembangan model saat ini?

a:saat ini, kami terus melakukan iterasi pada berbagai algoritma berdasarkan data, terutama pada produk yang biasa digunakan oleh pengguna. iterasi algoritmanya lebih cepat. misalnya, produk dpa kami telah ditingkatkan dari generasi pertama ke generasi kedua adalah generasi pertama dapat mendukung pra-pelatihan di satu bidang, dan generasi kedua dapat melakukan pelatihan paralel pada waktu yang sama berdasarkan kumpulan data dengan metode anotasi berbeda.

hambatan terutama berasal dari data. di bidang komputasi ilmiah, sumber data tidak tersebar luas dan tidak banyak kumpulan data publik. oleh karena itu, sebagian besar pekerjaan kami saat ini adalah bagaimana membuat efek pelatihan model menjadi lebih baik berdasarkan kumpulan data kecil.

selain itu, ada hal tambahan lain yang perlu diperhatikan, yaitu masalah interpretabilitas. karena persyaratan komputasi ilmiah lebih ketat dan persyaratan untuk interpretabilitas lebih tinggi, kami sekarang mencoba meningkatkan interpretasi model dengan mengekspos parameter. jalur terjemahan, dll. seks.

q: bagaimana cara mengatasi masalah kelangkaan data?

a:di bidang ai for science, baik di bidang material maupun kedokteran, prinsip fisika tingkat mikro yang paling dasar adalah sama, sehingga kelebihannya adalah data di beberapa bidang material dapat langsung digunakan kembali di bidang medis. misalnya, dpa 2 dapat didasarkan pada data yang disediakan berdasarkan sistem standar berbeda membantu pengguna melatih model terpadu. kemudian ketika rangkaian model ini diterapkan secara khusus pada industri, sejumlah kecil data dapat digunakan untuk penyesuaian.

kami belum terlibat dalam pasar toc, namun sistem kami telah mencakup beberapa skenario pengajaran. kami memiliki platform penelitian ilmiah yang mengintegrasikan pengajaran, penelitian, dan aplikasi. pelanggan yang kami hadapi saat ini adalah universitas dan beberapa pengguna yang lebih berorientasi pada konsumen. untuk perguruan tinggi dan universitas, kami akan memiliki platform pelatihan praktis serupa untuk para guru. platform ini dapat mendukung segala hal mulai dari pengajaran hingga siswa menghadiri kelas, hingga penggunaan, dan bahkan implementasi hasil penelitian.

q: apakah ada pertanyaan?apa ruang pengembangan pasar atau sains di masa depan?

a:saya pikir ruang pasarnya cukup besar. baik itu penelitian ilmiah, kedokteran, atau material, penambahan ai, setidaknya pada tingkat eksperimental, sebenarnya dapat memecahkan masalah, membantu peneliti ilmiah meningkatkan hasil eksperimen, dan mengurangi beban eksperimen.

dalam hal penerimaan pelanggan secara keseluruhan, sebagian biaya yang kami keluarkan dalam banyak skenario adalah untuk mendidik pengguna, misalnya, di bidang narkoba, kami menjalin hubungan kerja sama jangka panjang dengan pelanggan karena kami perlu mendampingi pelanggan melalui seluruh siklus verifikasi. .

sebagai perbandingan, bidang material jauh lebih cepat. misalnya, siklus penelitian dan pengembangan baterai sangat cepat. jika pengaruh rasio elektrolit diprediksi oleh ai, maka cukup untuk melakukan verifikasi persiapan.

di tingkat nasional, kementerian sains dan teknologi, bersama dengan yayasan ilmu pengetahuan alam tiongkok, meluncurkan pekerjaan penerapan khusus al for science. hal ini juga semakin menunjukkan bahwa semua pihak mulai dari tingkat sosio-ekonomi hingga kebijakan makro nasional optimis dan sangat mendukung hal ini, tidak diragukan lagi.

t: ai untuk sains masih dalam tahap awal. tahap apa yang akan dikembangkan dalam tiga tahun ke depan?

a:saya rasa setidaknya semua pelanggan akan memiliki pemahaman yang sama tentang masalah ini. sekarang semua orang mulai aktif menggunakan ai, dan pemahaman mereka tentang ai telah mencapai tingkat yang lebih tinggi. semua industri tidak akan merasa asing atau merasa jijik dengan kata ini, dan memiliki sikap yang relatif positif. langkah selanjutnya adalah bagaimana kita dapat membangun hubungan kerjasama yang mirip dengan kreasi bersama dengan pelanggan kita. bagaimanapun, industri ini adalah industri yang sensitif terhadap data. dalam jangka waktu tiga tahun, kami juga berharap dapat membantu pelanggan menemukan beberapa skenario implementasi praktis.

faktanya, menurut saya jika dilihat lebih jelas dari segi nilai, penerimaan pelanggan masih cukup tinggi, karena secara umum, baik itu perusahaan farmasi atau energi baru yang baru saja disebutkan, semua orang semakin memperhatikan investasi inovasi. kami juga berharap dapat membantu menginovasi seluruh paradigma penelitian ilmiah, termasuk infrastruktur penelitian ilmiah dan skenario tingkat atas. melalui platform penelitian ilmiah kami, kami dapat menghubungkan mereka dan memberdayakan berbagai industri.