berita

Amazon mengakuisisi perusahaan chip

2024-08-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Amazon telah mencapai kesepakatan untuk mengakuisisi pembuat chip dan perusahaan kompresi model AI Perceive, anak perusahaan Xperi yang berbasis di San Jose, California, senilai $80 juta secara tunai. Perceive adalah perusahaan yang mengembangkan solusi inferensi jaringan saraf terobosan, dengan fokus pada teknologi yang menghadirkan model kecerdasan buatan berskala besar pada perangkat edge.

Amazon belum mengungkapkan pemikiran spesifiknya tentang teknologi ini. “Kami senang telah menandatangani perjanjian untuk mengakuisisi Perceive dan membawa tim berbakatnya untuk bergabung dalam upaya kami menghadirkan model bahasa besar dan pengalaman multimodal ke perangkat yang mampu berjalan di edge,” kata juru bicara Amazon.

Xperi telah mencari pembeli untuk Perceive sejak awal tahun ini. Setelah kesepakatan selesai, sebagian besar dari 44 karyawan Perceive diperkirakan akan bergabung dengan Amazon. Amazon mengatakan mereka tidak memperkirakan kesepakatan itu memerlukan persetujuan peraturan, dan menyebutnya sebagai akuisisi rutin.

Pengenalan chip Perceive

Informasi menunjukkan bahwa Perceive dipimpin oleh co-CEO Murali Dharan dan Steve Teig. Perusahaan ini memiliki karyawan yang berlokasi di seluruh dunia. Perusahaan akan mengoperasikan laboratorium di Idaho. Teig mendorong penciptaan Perceive selama masa jabatannya sebagai chief technology officer Xperi, di mana ia mengawasi pengembangan teknologi, termasuk inovasi audio dan pencitraan inti, sekaligus memimpin tim pembelajaran mesin perusahaan. Dharan, yang sebelumnya bertanggung jawab atas arahan strategis, pengelolaan, dan pertumbuhan bisnis perizinan Xperi, kini bertanggung jawab memimpin operasi bisnis Perceive, termasuk penjualan, pemasaran, kesuksesan pelanggan, dan operasional.

Perceive menyediakan produk yang melayani model AI besar pada perangkat edge. Produk andalannya adalah prosesor Ergo AI, yang dapat menjalankan jaringan saraf tingkat pusat data di berbagai lingkungan, bahkan ketika daya terbatas.

Menurut laporan, ini adalah prosesor AI yang menghadirkan kinerja terobosan dan efisiensi energi ke perangkat edge. Mampu menjalankan jaringan saraf besar pada kecepatan bingkai penuh dan mendukung berbagai arsitektur dan tipe jaringan, termasuk CNN standar, RNN, LSTM, dan banyak lagi. Ergo fleksibel dan cukup kuat untuk menangani berbagai tugas pembelajaran mesin, mulai dari klasifikasi dan deteksi objek, segmentasi dan pose gambar, hingga pemrosesan sinyal audio dan bahasa. Anda bahkan dapat memintanya untuk melakukan banyak tugas, karena Ergo dapat menjalankan beberapa jaringan sekaligus.

Terlepas dari kekuatan pemrosesan Ergo, Ergo tidak memerlukan DRAM eksternal, dan paket kecilnya berukuran 7 mm x 7 mm menjadikannya ideal untuk digunakan pada perangkat ringkas seperti kamera, laptop, atau kacamata AR/VR.

Perceive mengatakan Ergo 20 hingga 100 kali lebih hemat energi dibandingkan produk lain, hanya membutuhkan daya komputasi 9 mW untuk melakukan inferensi pada video 30 fps. Ini berarti perangkat Anda dapat memberikan masa pakai baterai yang tak tertandingi dan menghasilkan lebih sedikit panas, sehingga memungkinkan paket yang lebih kecil dan lebih serbaguna.

Pada awal tahun 2023, Perceive meluncurkan prosesor Ergo 2 AI baru. Menurut laporan, chip tersebut dapat memberikan kinerja yang diperlukan untuk kasus penggunaan yang lebih kompleks, termasuk yang memerlukan model transformator, jaringan saraf yang lebih besar, beberapa jaringan yang berjalan secara bersamaan dan input multi-modal, sambil mempertahankan efisiensi daya yang terdepan di industri.

Menguraikan peluang pasar untuk chip Ergo terbaru, pendiri dan CEO Perceive Steve Teig mengatakan: "Dengan prosesor Ergo 2 baru, kami telah memperluas kemampuan yang kami tawarkan kepada produsen perangkat untuk membangun chip terbaik di kelasnya. kemampuan dalam perjalanan hingga produk-produk ambisius, “termasuk model transformasi untuk pemrosesan bahasa atau visi, pemrosesan video dengan kecepatan frame lebih tinggi, dan bahkan menggabungkan beberapa jaringan saraf besar dalam satu aplikasi.”

Ergo 2 berjalan empat kali lebih cepat dibandingkan chip Ergo generasi pertama Perceive dan memiliki kekuatan pemrosesan yang jauh lebih besar dibandingkan chip biasa yang dirancang untuk mikro-ML. Pengembang produk kini dapat memanfaatkan jaringan saraf canggih seperti YOLOv5, RoBERTa, GAN, dan U-Nets untuk memberikan hasil yang akurat dengan cepat. Semua pemrosesan Ergo 2 dilakukan dalam chip dan tidak memerlukan memori eksternal, sehingga meningkatkan efisiensi energi, privasi, dan keamanan. Chip Ergo 2 memungkinkan:

1.106 kesimpulan per detik menjalankan MobileNet V2

979 kesimpulan per detik saat menjalankan ResNet-50

Menjalankan YoloV5-S melakukan 115 inferensi per detik

Untuk memberikan peningkatan kinerja yang diperlukan untuk menjalankan jaringan besar ini, chip Ergo 2 menggunakan arsitektur pipeline dan desain memori terpadu, yang meningkatkan fleksibilitas dan efisiensi pengoperasian secara keseluruhan. Hasilnya, Ergo 2 dapat mendukung sensor beresolusi lebih tinggi dan aplikasi yang lebih luas, termasuk:

Aplikasi pemrosesan bahasa seperti ucapan-ke-teks dan penyelesaian kalimat

Aplikasi audio seperti pembatalan gema akustik dan deteksi peristiwa audio yang lebih kaya

Menuntut tugas pemrosesan video seperti resolusi super video dan deteksi pose.

Prosesor Ergo 2 berukuran 7 mm x 7 mm, diproduksi oleh GlobalFoundries menggunakan platform 22FDX, dan tidak memerlukan DRAM eksternal untuk dijalankan. Konsumsi dayanya yang rendah juga berarti tidak memerlukan pendinginan. Chip ini dapat menjalankan beberapa jaringan heterogen secara bersamaan, menghadirkan kemampuan video dan audio yang cerdas ke perangkat seperti kamera tingkat perusahaan yang digunakan untuk keamanan, kontrol akses, pencitraan termal, atau analisis video ritel; cocok untuk kasus penggunaan industri termasuk inspeksi visual atau Terintegrasi ke dalam produk konsumen seperti laptop, tablet, dan perangkat wearable canggih.

Sejarah chip yang dikembangkan sendiri oleh AWS

AWS telah membangun silikon kustom internalnya sendiri untuk beban kerja AI dan pengoptimalan cloud selama bertahun-tahun, sebagian besar berkat akuisisi Annapurna Labs oleh perusahaan lebih dari satu dekade lalu. Hal ini mendorong AWS untuk membangun prosesor Graviton, chip Inferentia, dan prosesor pembelajaran mesin Trainium miliknya sendiri selama beberapa tahun terakhir untuk melatih model AI di cloud.

Tahun ini, Amazon mengambil langkah maju yang besar dalam memajukan teknologi kecerdasan buatan (AI).

Pada konferensi tahunan AWS re:Invent, AWS mengumumkan dua chip khusus baru: AWS Trainium2 dan Graviton4. Kedua chip tersebut mewakili upaya berani Amazon Web Services (AWS) untuk memenuhi permintaan yang terus meningkat akan kemampuan AI, terutama ketika pasar menghadapi kekurangan besar unit pemrosesan grafis (GPU) berkinerja tinggi, yang terutama diproduksi oleh Nvidia.

Kebutuhan akan peningkatan daya komputasi berasal dari semakin populernya kecerdasan buatan generatif, yang memerlukan infrastruktur kuat untuk melatih dan menerapkan model. Nvidia dilaporkan kehabisan GPU hingga tahun 2024, dan sumber industri, termasuk CEO TSMC, memperkirakan bahwa krisis pasokan ini dapat berlanjut hingga tahun 2025. Oleh karena itu, chip baru Amazon bertujuan untuk mengurangi ketergantungan pada Nvidia dengan menyediakan alternatif yang dirancang khusus untuk beban kerja AI.

Chip Trainium2 dirancang untuk melatih model AI skala besar, dengan kinerja empat kali lebih tinggi dibandingkan chip generasi sebelumnya dan dua kali lebih hemat energi dibandingkan chip generasi sebelumnya. Menurut Amazon, chip tersebut dapat menangani 65 exaflops ketika digunakan dalam cluster cloud hingga 100,000 unit. Kemampuan ini mengurangi waktu untuk melatih model yang kompleks, seperti model dengan ratusan miliar parameter, dari bulan ke minggu. Kemajuan ini menjadikan Trainium2 pemimpin dalam infrastruktur pelatihan AI.

Dikenal karena potensinya, chip Trainium2 telah menarik minat beberapa pelaku industri, termasuk Anthropic, sebuah perusahaan yang berfokus pada pembuatan model AI yang ramah lingkungan.Salah satu pendiri Tom Brown menekankan bahwa Trainium2 akan memungkinkan mereka melakukan penskalaan dengan cepat dan memproses hingga empat kali lebih cepat dibandingkan model sebelumnya. Kemitraan antara AWS dan perusahaan seperti Anthropic menggambarkan tren yang berkembang dalam memanfaatkan teknologi cloud eksklusif untuk menyederhanakan operasi AI.

Sebaliknya, chip Graviton4 adalah prosesor Amazon yang paling kuat dan efisien, yang dirancang untuk berbagai beban kerja cloud. Dibandingkan dengan Graviton3 generasi sebelumnya, chip generasi keempat ini diharapkan dapat meningkatkan kinerja sebesar 30%, meningkatkan jumlah core sebesar 50%, dan meningkatkan bandwidth memori sebesar 75%. Peningkatan ini memungkinkan pengguna mengurangi biaya operasional dan meningkatkan kecepatan pemrosesan data, sehingga ideal untuk perusahaan yang menjalankan database berkinerja tinggi dan aplikasi analitik intensif.

Pengadopsi awal Graviton4 termasuk perusahaan seperti Datadog, Epic Games, dan SAP. Misalnya, Roman Visintine, chief cloud engineer di Epic, menunjukkan bahwa chip tersebut bekerja dengan baik dalam beban kerja yang sensitif terhadap latensi dan sangat bermanfaat untuk pengalaman bermain game online. Dalam lingkungan yang sangat kompetitif di mana akses dan pemrosesan data yang cepat sangat penting untuk kesuksesan, tren optimalisasi layanan cloud ini sangatlah penting.

Pengumuman Amazon juga menyoroti tren yang lebih besar dalam industri teknologi, di mana perusahaan semakin banyak berinvestasi dalam solusi chip khusus untuk memenuhi kebutuhan komputasi tertentu, terutama kecerdasan buatan dan tugas pembelajaran mesin. Dengan mengembangkan perangkat keras berpemilik, Amazon berharap dapat membedakan dirinya dan mengurangi ketergantungannya pada pembuat chip yang sudah mapan seperti Nvidia dan AMD.

Ketika teknologi AI terus berkembang dan menjadi lebih lazim di berbagai bidang, mulai dari layanan kesehatan hingga hiburan, kebutuhan akan chip yang efisien dan berkinerja tinggi akan semakin meningkat. Analis teknologi memperkirakan peluncuran chip Amazon baru ini tidak hanya akan segera memenuhi kebutuhan saat ini, namun juga akan meletakkan dasar bagi pengembangan kecerdasan buatan di masa depan.

Anehnya, peluncuran chip ini terjadi pada saat yang strategis, karena Microsoft juga mengumumkan pengembangan chipnya sendiri untuk kecerdasan buatan dan layanan cloud. Hal ini memicu persaingan yang ketat di bidang perangkat keras AI, mendorong perusahaan untuk berinovasi dengan cepat dan melampaui batas.

Chip AWS Trainium2 dan Graviton4 diharapkan akan tersedia bagi pelanggan dalam waktu dekat, dengan peluncuran Trainium2 sekitar tahun depan dan Graviton4 sudah dalam pratinjau. Ketika industri teknologi terus beralih ke komputasi awan dan solusi berbasis kecerdasan buatan, Amazon siap memainkan peran utama dalam transformasi digital ini.

Chip AI memiliki potensi besar

AWS sering mengembangkan chip. Selain untuk memenuhi kebutuhan bisnis perusahaan, hal ini juga sekali lagi membuktikan bahwa chip AI memiliki potensi besar, yang tidak hanya tercermin di cloud, tetapi juga di sisi perangkat.

Menurut Futurum Intelligence, pada tahun 2023, Nvidia akan menguasai 92% pasar GPU AI dan 75% dari seluruh pasar semikonduktor AI pusat data. Dominasi ini akan berlanjut di pasar yang sudah besar, yang diperkirakan akan tumbuh hampir setengahnya pada tahun 2024.

Perusahaan analis memperkirakan bahwa total nilai pasar prosesor dan akselerator untuk aplikasi kecerdasan buatan pusat data akan mencapai $56,3 miliar, meningkat 49,3% dari nilai pasar tahunan sebesar $37,7 miliar pada tahun 2023. Analis pasar memperkirakan bahwa pasar akan tumbuh pada tingkat pertumbuhan tahunan gabungan sebesar 29,7% selama lima tahun ke depan, menjadikan ukuran pasar menjadi US$98,4 miliar pada tahun 2026 dan US$138,3 miliar pada tahun 2028.

Futurum membagi pasar prosesor pusat data AI menjadi empat kategori: CPU, GPU, akselerator khusus (disebut XPU), dan akselerator cloud berpemilik yang diproduksi oleh perusahaan seperti Google, AWS, dan Microsoft.

Pada tahun 2023, CPU akan menguasai 20,5% pasar, GPU akan menguasai 73,5% pasar, dan XPU serta produk khusus cloud masing-masing akan menguasai 3%.

1. Pada tahun 2023, CPU akan menyumbang 20% ​​dari pemrosesan AI di pusat data dan akan terus memainkan peran penting. Futurum memperkirakan mereka akan tumbuh pada tingkat pertumbuhan tahunan gabungan selama lima tahun sebesar 28%, dari $7,7 miliar pada tahun 2023 menjadi $26 miliar pada tahun 2028. Futurum memperkirakan Nvidia akan menguasai pangsa pasar sebesar 37% pada tahun 2023, disusul Intel sebesar 23%.

2. Pada tahun 2023, GPU akan mencakup 74% dari chipset yang digunakan dalam aplikasi AI pusat data dan akan mengalami tingkat pertumbuhan tahunan gabungan selama lima tahun sebesar 30%, tumbuh dari US$28 miliar pada tahun 2023 menjadi US$102 miliar pada tahun 2028. Futurum memperkirakan Nvidia menguasai 92% pasar GPU AI.

3. XPU akan mengalami tingkat pertumbuhan tahunan gabungan selama lima tahun sebesar 31%, tumbuh dari US$1 miliar pada tahun 2023 menjadi US$3,7 miliar pada tahun 2028.

4. Akselerator AI cloud publik akan mengalami tingkat pertumbuhan tahunan gabungan selama lima tahun sebesar 35%, tumbuh dari US$1,3 miliar pada tahun 2023 menjadi US$6 miliar pada tahun 2028.

Futurum mengecualikan prosesor dan akselerator AI dari penelitian ini jika tidak tersedia untuk penggunaan publik di pusat data, sehingga tidak termasuk chipset AI yang dirancang dan digunakan oleh Meta, Tesla, dan Apple.

Dari perspektif geografis, Amerika Utara mendominasi pasar dan akan menguasai 55% pangsa pasar pada tahun 2023. Eropa, Timur Tengah dan Afrika (EMEA) dan Asia Pasifik (APAC) mengikuti pasar-pasar penting, sementara Amerika Latin (LATAM) mewakili wilayah berkembang dengan potensi pertumbuhan yang sangat besar.

Analisis visual dan audio adalah kasus penggunaan terbesar pada tahun 2023. Futurum memperkirakan bahwa tiga kasus penggunaan teratas pada tahun 2028 adalah analisis visual dan audio, simulasi dan pemodelan, serta pembuatan teks, analisis dan ringkasan.

Khusus untuk edge AI, penelitian baru dari Omdia memperkirakan bahwa pasar prosesor edge AI akan menghasilkan pendapatan $60,2 miliar pada tahun 2028, dengan tingkat pertumbuhan tahunan gabungan sebesar 11%.

Perkiraan prosesor edge terbaru Omdia mencatat bahwa pertumbuhan pendapatan akan didorong oleh peningkatan permintaan perangkat keras karena berbagai industri dan perangkat mengadopsi kecerdasan buatan. Salah satu bidang yang mendorong pertumbuhan pasar adalah segmen PC, dengan meningkatnya penawaran produk dari vendor besar seperti Intel, AMD, dan Apple. Vendor PC dilaporkan mencoba memasarkan penyertaan prosesor AI di perangkat mereka sebagai “nilai jual yang unik.”

Selain sektor komputer pribadi, laporan ini juga menyoroti pesatnya penerapan prosesor kecerdasan buatan di berbagai bidang seperti mobil, drone, kamera keamanan, dan robot.

Dari sini kita bisa melihat niat di balik akuisisi AWS.