berita

google mengungkap senjata rahasia tpu-nya, alphachip muncul di nature, dan memberikan penjelasan mendalam tentang proses pengembangan chip desain ai

2024-09-29

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

baru-baru ini, google deepmind secara resmi mengumumkan algoritme desain chip terbarunya alphachip on nature. metode ini didedikasikan untuk mempercepat dan mengoptimalkan pengembangan chip komputer. metode ini telah diuji oleh beberapa produk tpu dan dapat menyelesaikan tugas yang dibutuhkan oleh pakar manusia hanya dalam beberapa jam. berminggu-minggu atau bahkan berbulan-bulan desain tata letak chip.

pada tahun 2020, google menerbitkan makalah pracetak penting "penempatan chip dengan pembelajaran penguatan mendalam", yang untuk pertama kalinya menunjukkan kepada dunia tata letak chipnya yang dirancang menggunakan metode pembelajaran penguatan baru.inovasi ini memungkinkan google memperkenalkan ai ke dalam desain chip tpu, sehingga menghasilkan tata letak chip yang melampaui desainer manusia.

pada tahun 2022, google semakin membuka kode algoritme yang dijelaskan dalam makalah ini, sehingga memungkinkan para peneliti di seluruh dunia menggunakan sumber daya ini untuk melakukan pra-pelatihan blok chip.

saat ini, metode pembelajaran berbasis ai ini telah melalui pengujian pada beberapa generasi produk seperti tpu v5e, tpu v5p, dan trillium, dan telah mencapai hasil yang luar biasa di google. yang lebih luar biasa lagi adalah tim google deepmind baru-baru ini menerbitkan lampiran metode ini di nature, menguraikan secara lebih rinci dampaknya yang luas pada bidang desain chip. pada saat yang sama,google juga membuka pos pemeriksaan berdasarkan pra-pelatihan 20 modul tpu, berbagi bobot model, dan menamakannya alphachip.

munculnya alphachip tidak hanya menandakan bahwa ai akan semakin banyak digunakan dalam bidang desain chip, namun juga menandai bahwa kita memasuki era baru "desain berbasis chip".

alphachip: bagaimana google deepmind menggunakan ai untuk merevolusi desain chip

sebagai puncak dari deepmind google, alphachip menarik perhatian komunitas teknologi global dengan kemajuan revolusionernya dalam desain chip.

desain chip adalah bidang puncak teknologi modern. kompleksitasnya terletak pada koneksi cerdik dari komponen presisi yang tak terhitung jumlahnya melalui kabel yang sangat halus. sebagai salah satu teknik pembelajaran penguatan pertama yang diterapkan untuk memecahkan masalah teknik dunia nyata, alphachip mampu menyelesaikan desain tata letak chip yang sebanding atau lebih baik dari manusia hanya dalam beberapa jam, bukan dalam hitungan minggu atau bulan kerja manual. perkembangan zaman ini telah membuka pintu bagi imajinasi kita melampaui batas-batas tradisional.

jadi, bagaimana tepatnya alphachip mencapai prestasi ini?

rahasia alphachip adalah pendekatannya terhadap pembelajaran penguatan, yang memperlakukan desain tata letak chip sebagai sebuah permainan. dimulai dengan grid kosong, alphachip secara bertahap menempatkan setiap komponen rangkaian hingga semuanya berada pada tempatnya. selanjutnya, berdasarkan kualitas tata letak, sistem akan memberikan imbalan yang sesuai.

lebih penting lagi, google secara inovatif mengusulkan jaringan saraf grafik "berbasis tepi".hal ini memungkinkan alphachip mempelajari hubungan timbal balik antara komponen chip dan menerapkannya pada desain keseluruhan chip, sehingga mencapai transendensi diri dalam setiap desain. mirip dengan alphago, alphachip dapat belajar melalui "permainan" dan menguasai seni merancang tata letak chip yang sangat baik.

dalam proses khusus merancang tata letak tpu, alphachip pertama-tama akan melakukan pra-pelatihan pada berbagai modul chip generasi sebelumnya, termasuk modul jaringan on-chip dan antar-chip, pengontrol memori, dan buffer transmisi data. fase pra-pelatihan ini memberi alphachip banyak pengalaman. google kemudian menggunakan alphachip untuk menghasilkan tata letak berkualitas tinggi untuk modul tpu saat ini.

berbeda dengan metode tradisional, alphachip terus mengoptimalkan dirinya dengan menyelesaikan lebih banyak tugas tata letak chip, sama seperti pakar manusia yang terus meningkatkan keterampilan mereka melalui latihan. seperti yang dikatakan oleh salah satu pendiri dan ceo deepmind, demis hassabis,google telah membangun umpan balik yang kuat seputar alphachip:

* pertama, latih model desain chip tingkat lanjut (alphachip)

* kedua, gunakan alphachip untuk merancang chip ai yang lebih baik

* kemudian, gunakan chip ai ini untuk melatih model yang lebih baik

* terakhir, gunakan model ini untuk merancang chip yang lebih baik

berulang kali, model dan chip ai ditingkatkan secara bersamaan. demis hassabis mengatakan, "ini adalah salah satu alasan mengapa tumpukan google tpu berkinerja sangat baik."

alphachip tidak hanya menempatkan lebih banyak modul daripada pakar manusia, tetapi juga memiliki panjang kabel yang jauh lebih sedikit.dengan diperkenalkannya setiap generasi baru tpu, alphachip merancang tata letak chip yang lebih baik dan menyediakan denah keseluruhan yang lebih lengkap, sehingga memperpendek siklus desain dan meningkatkan kinerja chip.

jumlah blok chip desain alphachip dan pengurangan panjang garis rata-rata pada tiga generasi tpu google (v5e, tpu v5p)

perjalanan 10 tahun google tpu: dari ketekunan dalam asic hingga inovasi dalam desain ai

sebagai penjelajah dan pionir di bidang tpu, melihat sejarah perkembangan google di lini teknologi ini, tidak hanya mengandalkan wawasannya yang tajam, tetapi juga menunjukkan keberaniannya yang luar biasa.

seperti yang kita ketahui bersama, pada tahun 1980an,asic (sirkuit terpadu khusus aplikasi) ditandai dengan efektivitas biaya tinggi, kekuatan pemrosesan yang kuat, dan kecepatan cepat.ini telah mendapat dukungan luas dari pasar. namun, fungsionalitas asic ditentukan oleh alat masker khusus, yang berarti pelanggan harus membayar biaya rekayasa non-berulang (nre) dimuka yang mahal.

saat ini,fpga (field programmable gate array) memiliki keunggulan dalam mengurangi biaya di muka dan mengurangi risiko logika digital yang disesuaikan.di mata publik, meski performanya tidak sepenuhnya unggul, namun memiliki keunikan di pasaran.

pada saat itu, industri secara umum memperkirakan bahwa hukum moore akan mendorong kinerja fpga melebihi kebutuhan asic. namun ternyata fpga, sebagai "chip universal" yang dapat diprogram, berkinerja baik dalam produk eksplorasi dan bervolume rendah serta dapat mencapai indikator kecepatan, konsumsi daya, atau biaya yang lebih baik daripada gpu, namun tetap tidak dapat menghilangkan "universalitas" dan optimalitas tidak dapat dicapai pada saat yang bersamaan." setelah fpga membuka jalan bagi arsitektur khusus, mereka memberi jalan kepada asic yang lebih terspesialisasi.

setelah memasuki abad ke-21, kegemaran akan teknologi ai semakin tinggi. pembelajaran mesin dan algoritma pembelajaran mendalam terus meningkat. permintaan industri akan chip komputasi ai khusus yang berkinerja tinggi dan berdaya rendah semakin meningkat . dengan latar belakang ini, google membuat keputusan berani pada tahun 2013,pilih asic untuk membangun infrastruktur tpu dan mengembangkan tensorflow dan jax.

perlu dicatat bahwa penelitian independen dan pengembangan asic adalah proses dengan siklus panjang, investasi besar, ambang batas tinggi, dan risiko besar. jika arah yang dipilih salah, hal ini dapat menyebabkan kerugian ekonomi yang sangat besar. namun, untuk mengeksplorasi solusi pembelajaran mesin yang lebih hemat biaya dan hemat energi, setelah google membuat kemajuan terobosan dalam pengenalan gambar melalui pembelajaran mendalam pada tahun 2012, google segera mulai mengembangkan tpuv1 pada tahun 2013 dan mengumumkan generasi pertama pada tahun 2015. tpu chip (tpu v1) online secara internal,hal ini menandai lahirnya akselerator pertama di dunia yang dirancang khusus untuk ai.

untungnya, tpu segera membuka peluang demonstrasi tingkat tinggi - pada bulan maret 2016, alphago lee berhasil mengalahkan juara dunia go lee sedol. sebagai versi generasi kedua dari seri alphago, ia berjalan di google cloud .

namun, tpu tidak segera mencapai keberhasilan penerapan skala besar di industri. baru setelah metode tata letak chip alphachip diusulkan, tpu benar-benar memasuki tahap pengembangan baru.

riwayat pengembangan google tpu

pada tahun 2020, google mendemonstrasikan kemampuan alphachip dalam makalah pracetak "penempatan chip dengan pembelajaran penguatan mendalam".ia mampu belajar dari pengalaman masa lalu dan terus melakukan peningkatan, serta dapat menghasilkan penyematan fitur yang kaya untuk netlist masukan dengan merancang arsitektur saraf penghargaan yang dapat secara akurat memprediksi berbagai netlist dan tata letaknya.

alphachip menganggap kondisi optimalisasi kinerja sebagai kondisi kemenangan permainan, mengadopsi metode pembelajaran penguatan, dan terus mengoptimalkan kemampuan tata letak chip dengan melatih agen dengan tujuan memaksimalkan imbalan kumulatif. mereka memulai 10,000 permainan, memungkinkan ai untuk mempraktikkan tata letak dan perutean pada 10,000 chip dan mengumpulkan data, sambil terus belajar dan mengoptimalkan.

pada akhirnya, mereka menemukan bahwa ai mengungguli atau menyamai tata letak manual dalam hal luas, daya, dan panjang kabel dibandingkan dengan insinyur manusia, sekaligus membutuhkan waktu yang jauh lebih sedikit untuk memenuhi standar desain. hasilnya menunjukkan hal itualphachip dapat menghasilkan tata letak yang menyaingi atau melampaui upaya manual pada netlist akselerator modern dalam waktu kurang dari 6 jam.dalam kondisi yang sama, pakar manusia yang ada mungkin memerlukan waktu beberapa minggu untuk menyelesaikan pekerjaan yang sama.

dengan bantuan alphachip, google semakin mengandalkan tpu.desember 2023google telah meluncurkan 3 versi gemini yang berbeda, model umum multi-modal yang besar. pelatihan model ini menggunakan chip cloud tpu v5p secara ekstensif.mei 2024,google telah merilis chip tpu trillium generasi keenam, yang dapat diperluas menjadi cluster hingga 256 tpu dalam satu pod dengan bandwidth tinggi dan latensi rendah. dibandingkan dengan produk generasi sebelumnya, trillium memiliki kemampuan yang lebih kuat dalam mengadaptasi pelatihan model .

pada saat yang sama, chip tpu secara bertahap melampaui google dan mendapatkan pengakuan pasar yang lebih luas.30 juli 2024dalam makalah penelitian yang dirilisnya, apple mengklaim telah memilih dua cluster cloud tensor processing unit (tpu) dari google saat melatih model kecerdasan buatan afm di ekosistem apple intelligence. data lain menunjukkan bahwa lebih dari 60% startup ai generatif dan hampir 90% unicorn ai generatif menggunakan infrastruktur ai google cloud dan layanan cloud tpu.

ada berbagai tanda bahwa setelah google mengasah pedangnya selama sepuluh tahun, tpu telah keluar dari masa penggarapan dan mulai memberi makan google kembali di era ai dengan kinerja perangkat kerasnya yang sangat baik.jalur "ai design ai chip" yang terdapat dalam alphachip juga membuka cakrawala baru di bidang desain chip.

ai merevolusi desain chip: dari google alphachip hingga eksplorasi otomatisasi proses penuh

meskipun alphachip unik dalam bidang chip yang dirancang oleh ai, ia tidak sendirian.jangkauan teknologi ai telah diperluas ke banyak bidang utama seperti verifikasi dan pengujian chip.

tugas inti dari desain chip adalah mengoptimalkan konsumsi daya (power), kinerja (performance) dan area (area) dari chip. ketiga indikator utama ini secara kolektif disebut ppa. tantangan ini disebut juga eksplorasi ruang angkasa desain. secara tradisional, tugas ini diselesaikan oleh alat eda, tetapi untuk mencapai kinerja optimal, insinyur chip harus terus-menerus melakukan penyesuaian manual dan kemudian menyerahkannya lagi ke alat eda untuk pengoptimalan, dan seterusnya. proses ini seperti menata furnitur di rumah, terus-menerus berusaha memaksimalkan pemanfaatan ruang dan mengoptimalkan sirkulasi, namun setiap penyesuaian setara dengan memindahkan furnitur dan menatanya kembali, yang sangat memakan waktu dan tenaga.

untuk mengatasi masalah ini,synopsys meluncurkan dso.ai pada tahun 2020.ini adalah solusi desain chip pertama di industri yang mengintegrasikan ai dan eda. dso.ai menggunakan teknologi pembelajaran penguatan untuk secara otomatis mencari ruang desain melalui ai guna menemukan titik keseimbangan terbaik tanpa intervensi manual. alat ini telah digunakan oleh banyak raksasa chip.

misalnya, setelah menggunakan dso.ai, microsoft mengurangi konsumsi daya modul chip sebesar 10%-15% sambil mempertahankan kinerja yang sama; stmicroelectronics meningkatkan efisiensi eksplorasi ppa lebih dari 3 kali lipat; raksasa chip memori sk hynix area chip berkurang sebesar 5%. data synopsys menunjukkan bahwa dso.ai telah berhasil membantu lebih dari 300 tape-out komersial, menandai peran penting ai dalam desain dan produksi chip sebenarnya.

dalam hal verifikasi chip yang dibantu ai, laporan teknis yang dirilis oleh synopsys juga menunjukkan bahwa proses verifikasi menempati hingga 70% dari keseluruhan siklus pengembangan chip. biaya pembuatan chip tape-out mencapai ratusan juta dolar, dan kompleksitas chip modern terus meningkat, sehingga membuat verifikasi menjadi sulit. untuk tujuan ini,synopsys meluncurkan alat vso.ai,gunakan ai untuk mengoptimalkan ruang verifikasi dan mempercepat konvergensi cakupan.

vso.ai dapat menyimpulkan jenis cakupan yang berbeda, melengkapi cakupan kode tradisional. ai juga dapat belajar dari pengalaman verifikasi untuk terus mengoptimalkan sasaran cakupan. selain itu, synopsys juga telah meluncurkan alat tso.ai, yang dapat membantu pengembang chip menyaring chip cacat yang diproduksi oleh pabrik pengecoran logam.

keterlibatan mendalam ai dalam bidang desain chip telah memicu ide yang berani: bisakah kita menggunakan ai untuk merancang chip yang lengkap? faktanya, nvidia sudah mencoba di bidang ini. rancang sirkuit melalui agen pembelajaran penguatan mendalam,hampir 13.000 sirkuit di nvidia h100 dirancang oleh ai. institut teknologi komputasi akademi ilmu pengetahuan tiongkok juga menggunakan ai untuk menghasilkan chip prosesor risc-v yang disebut "qiu meng no. 1" dalam waktu 5 jam.dengan 4 juta gerbang logika, kinerjanya sebanding dengan intel 80486.

secara keseluruhan, kemampuan ai untuk merancang chip yang lengkap masih terbatas, namun hal ini tidak diragukan lagi merupakan peluang penting untuk pengembangan chip di masa depan. dengan kemajuan teknologi yang terus berlanjut, potensi ai di bidang desain chip tentunya akan semakin tereksplorasi dan dimanfaatkan, dan pada akhirnya mengubah keseluruhan proses desain chip.

penulis: tian xiaoyao