uutiset

Amazon ostaa siruyhtiön

2024-08-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Amazon on päässyt sopimukseen siruvalmistajan ja tekoälymallien pakkausyrityksen Perceiven ostamisesta, San Josessa, Kaliforniassa sijaitsevan julkisesti noteeratun Xperin tytäryhtiön, 80 miljoonalla dollarilla käteisellä. Perceive on yritys, joka kehittää läpimurtoisia hermoverkkojen päättelyratkaisuja, ja se keskittyy teknologiaan, joka toimittaa laajamittaisia ​​tekoälymalleja reunalaitteisiin.

Amazon ei ole paljastanut erityisiä ajatuksiaan tekniikasta. "Olemme iloisia voidessamme allekirjoittaa sopimuksen Perceiven ostamisesta ja tuoda sen lahjakkaan tiimin mukaan pyrkimyksiimme tuoda suuria kielimalleja ja multimodaalisia kokemuksia laitteisiin, jotka pystyvät toimimaan reunalla", Amazonin tiedottaja sanoi.

Xperi on etsinyt ostajaa Perceivelle tämän vuoden alusta lähtien. Kaupan päätyttyä suurimman osan Perceiven 44 työntekijästä odotetaan liittyvän Amazoniin. Amazon sanoi, että se ei odottanut kaupan vaativan viranomaishyväksyntää, ja kutsui sitä rutiininomaiseksi hankinnaksi.

Perceiven sirun esittely

Tiedot osoittavat, että Perceiveä johtavat toimitusjohtajat Murali Dharan ja Steve Teig. Yrityksellä on työntekijöitä ympäri maailmaa. Yrityksellä on laboratorio Idahossa. Teig johti Perceiven luomista toimiessaan Xperin teknologiajohtajana, jossa hän valvoi teknologian kehitystä, mukaan lukien keskeiset ääni- ja kuvantamisinnovaatiot, ja johti samalla myös yrityksen koneoppimistiimiä. Aiemmin Xperin lisensointiliiketoiminnan strategisesta suunnasta, johtamisesta ja kasvusta vastannut Dharan vastaa nyt Perceiven liiketoiminnan johtamisesta, mukaan lukien myynti, markkinointi, asiakkaiden menestys ja toiminta.

Perceive tarjoaa tuotteita, jotka palvelevat suuria tekoälymalleja reunalaitteissa. Sen lippulaivatuote on Ergo AI -prosessori, joka pystyy ajamaan datakeskustason hermoverkkoja erilaisissa ympäristöissä, vaikka teho olisi rajallinen.

Raporttien mukaan tämä on tekoälyprosessori, joka tuo läpimurron suorituskyvyn ja energiatehokkuuden reunalaitteisiin. Pystyy ajamaan suuria neuroverkkoja täydellä kehysnopeudella ja tukemaan erilaisia ​​verkkoarkkitehtuureja ja -tyyppejä, mukaan lukien standardi CNN, RNN, LSTM ja paljon muuta. Ergo on riittävän joustava ja tehokas käsittelemään monenlaisia ​​koneoppimistehtäviä objektien luokituksesta ja havaitsemisesta kuvan segmentointiin ja asetteluun, äänisignaalin käsittelyyn ja kieleen. Voit jopa pyytää sitä suorittamaan moniajoja, koska Ergo voi käyttää useita verkkoja kerralla.

Ergon prosessointitehosta huolimatta se ei vaadi ulkoista DRAM-muistia, ja sen pieni 7 mm x 7 mm paketti tekee siitä ihanteellisen käytettäväksi kompakteissa laitteissa, kuten kameroissa, kannettavissa tietokoneissa tai AR/VR-laseissa.

Huomaa, että Ergo on 20-100 kertaa energiatehokkaampi kuin muut tuotteet, ja se vaatii vain 9 mW laskentatehoa tehdäkseen päätelmiä 30 fps -videosta. Tämä tarkoittaa, että laitteesi voi tarjota vertaansa vailla olevan akun keston ja tuottaa vähemmän lämpöä, mikä mahdollistaa pienemmän ja monipuolisemman paketin.

Vuoden 2023 alussa Perceive julkaisi uuden Ergo 2 AI -prosessorin. Raporttien mukaan siru voi tarjota suorituskyvyn, joka vaaditaan monimutkaisempiin käyttötapauksiin, mukaan lukien muuntajamalleja, suurempia hermoverkkoja, useita samanaikaisesti toimivia verkkoja ja multimodaalisia tuloja vaativat ominaisuudet säilyttäen samalla alan johtavan tehotehokkuuden.

Perceiven perustaja ja toimitusjohtaja Steve Teig kertoi uusimpien Ergo-sirujen markkinamahdollisuuksista: "Uusilla Ergo 2 -prosessoreilla olemme laajentaneet laitevalmistajille tarjoamiamme mahdollisuuksia rakentaa luokkansa parhaita siruja. kunnianhimoisiin tuotteisiin, "mukaan lukien muunnosmallit kielen tai näönkäsittelyyn, suuremman kuvanopeuden videon käsittelyyn ja jopa useiden suurten hermoverkkojen yhdistämiseen yhteen sovellukseen."

Ergo 2 toimii neljä kertaa nopeammin kuin Perceiven ensimmäisen sukupolven Ergo-siru ja siinä on paljon enemmän prosessointitehoa kuin tyypillisissä mikro-ML-siruissa. Tuotekehittäjät voivat nyt hyödyntää kehittyneitä neuroverkkoja, kuten YOLOv5, RoBERTa, GAN ja U-Nets tuottaakseen nopeasti tarkkoja tuloksia. Kaikki Ergo 2 -käsittely tapahtuu sirulla, eikä se vaadi ulkoista muistia, mikä parantaa energiatehokkuutta, yksityisyyttä ja turvallisuutta. Ergo 2 -siru mahdollistaa:

1 106 johtopäätöstä sekunnissa MobileNet V2:ta käytettäessä

979 johtopäätöstä sekunnissa käytettäessä ResNet-50:tä

YoloV5-S suorittaa 115 johtopäätöstä sekunnissa

Näiden suurten verkkojen suorituskyvyn parantamiseksi Ergo 2 -siru käyttää putkiarkkitehtuuria ja yhtenäistä muistisuunnittelua, mikä lisää sen joustavuutta ja yleistä toimintatehokkuutta. Tämän seurauksena Ergo 2 voi tukea korkeamman resoluution antureita ja laajempaa valikoimaa sovelluksia, mukaan lukien:

Kielenkäsittelysovellukset, kuten puhe tekstiksi ja lauseen viimeistely

Äänisovellukset, kuten akustinen kaiun vaimennus ja monipuolisempi äänitapahtumien tunnistus

Vaativia videonkäsittelytehtäviä, kuten videon superresoluutio ja asennon tunnistus.

Ergo 2 -prosessori on kooltaan 7 mm x 7 mm, ja sen on valmistanut GlobalFoundries 22FDX-alustalla, eikä se vaadi ulkoista DRAM-muistia toimiakseen. Sen pieni virrankulutus tarkoittaa myös sitä, että se ei vaadi jäähdytystä. Siru voi käyttää useita heterogeenisiä verkkoja samanaikaisesti ja toimittaa älykkäitä video- ja ääniominaisuuksia laitteisiin, kuten turvallisuuteen, kulunvalvontaan, lämpökuvaukseen tai vähittäiskaupan videoanalytiikkaan, mukaan lukien visuaalinen tarkastus kuluttajatuotteet, kuten kannettavat tietokoneet, tabletit ja kehittyneet puettavat laitteet.

AWS:n itse kehittämä siruhistoria

AWS on rakentanut omaa sisäistä mukautettua piitä tekoälyn työkuormille ja pilvioptimointiin jo vuosia, suurelta osin sen ansiosta, että yritys osti Annapurna Labsin yli kymmenen vuotta sitten. Tämä on saanut AWS:n rakentamaan omat Graviton-prosessorit, Inferentia-sirut ja Trainium-koneoppimisprosessorit muutaman viime vuoden aikana tekoälymallien opettamiseksi pilvessä.

Tänä vuonna Amazon otti suuren askeleen eteenpäin tekoälyteknologian (AI) edistämisessä.

Vuotuisessa AWS re:Invent -konferenssissaan AWS julkisti kaksi uutta mukautettua sirua: AWS Trainium2 ja Graviton4. Nämä kaksi sirua edustavat Amazon Web Servicesin (AWS) rohkeaa pyrkimystä vastata AI-ominaisuuksien kasvavaan kysyntään, varsinkin kun markkinoilla on vakava pula korkean suorituskyvyn grafiikkasuoritusyksiköistä (GPU), jotka pääasiassa tuottaa Nvidia.

Parannetun laskentatehon tarve johtuu generatiivisen tekoälyn kasvavasta suosiosta, joka vaatii tehokkaan infrastruktuurin mallien kouluttamiseen ja käyttöönottoon. Nvidia on kuulemma loppuunmyyty GPU:t vuoteen 2024 asti, ja alan lähteet, mukaan lukien TSMC:n toimitusjohtaja, ennustavat, että tämä toimituskriisi voi jatkua vuoteen 2025 asti. Tätä silmällä pitäen Amazonin uusilla siruilla pyritään vähentämään riippuvuutta Nvidiaan tarjoamalla vaihtoehto, joka on räätälöity erityisesti tekoälyn työkuormille.

Trainium2-siru on suunniteltu suurten tekoälymallien harjoittamiseen, ja sen suorituskyky on neljä kertaa parempi ja energiatehokkuus kaksi kertaa parempi kuin edellisen sukupolven sirulla. Amazonin mukaan siru pystyy käsittelemään 65 exaflopsia, kun sitä käytetään jopa 100 000 yksikön pilviklusterissa. Tämä ominaisuus lyhentää monimutkaisten mallien, kuten satojen miljardien parametrien mallien, kouluttamiseen kuluvaa aikaa kuukausista viikkoihin. Nämä edistysaskeleet tekevät Trainium2:sta johtavan tekoälyn koulutusinfrastruktuurin.

Potentiaalistaan ​​tunnustettu Trainium2-siru on jo herättänyt kiinnostusta useilta alan toimijoilta, mukaan lukien Anthropic, yritys, joka keskittyy ystävällisten tekoälymallien rakentamiseen.Toinen perustajista Tom Brown korosti, että Trainium2 mahdollistaa niiden skaalauksen nopeasti ja prosessoinnin jopa neljä kertaa nopeammin kuin edellinen malli. Kumppanuudet AWS:n ja Anthropicin kaltaisten yritysten välillä kuvaavat kasvavaa trendiä hyödyntää patentoitua pilviteknologiaa tekoälytoimintojen virtaviivaistamiseen.

Graviton4-siru on toisaalta Amazonin tehokkain ja tehokkain prosessori, joka on räätälöity erilaisiin pilvityökuormiin. Edelliseen sukupolveen Graviton3:een verrattuna tämän neljännen sukupolven sirun odotetaan parantavan suorituskykyä 30 %, lisäävän ytimien määrää 50 % ja lisäävän muistin kaistanleveyttä 75 %. Näiden parannusten avulla käyttäjät voivat vähentää käyttökustannuksia ja lisätä tietojenkäsittelyn nopeuksia, mikä tekee siitä ihanteellisen yrityksille, jotka käyttävät tehokkaita tietokantoja ja intensiivisiä analytiikkasovelluksia.

Graviton4:n varhaisia ​​käyttäjiä ovat muun muassa Datadog, Epic Games ja SAP. Esimerkiksi Roman Visintine, Epicin pilvipäällikkö, huomautti, että siru toimii hyvin latenssiherkissä työkuormissa ja on erityisen hyödyllinen online-pelaamiseen. Erittäin kilpaillussa ympäristössä, jossa nopea tiedon saanti ja käsittely ovat ratkaisevan tärkeitä menestymisen kannalta, tämä pilvipalvelun optimointitrendi on ratkaisevan tärkeä.

Amazonin ilmoitus korostaa myös teknologiateollisuuden suurempaa trendiä, jossa yritykset investoivat yhä enemmän räätälöityihin siruratkaisuihin vastatakseen erityisiin laskentatarpeisiin, erityisesti tekoäly- ja koneoppimistehtäviin. Kehittämällä omaa laitteistoa Amazon toivoo erottuvansa ja vähentävänsä riippuvuuttaan vakiintuneista siruvalmistajista, kuten Nvidia ja AMD.

Tekoälytekniikan kehittyessä ja yleistyessä eri aloilla terveydenhoidosta viihteeseen, tarve tehokkaille ja suorituskykyisille siruille vain kasvaa. Teknologiaanalyytikot odottavat, että näiden uusien Amazon-sirujen lanseeraus ei ainoastaan ​​vastaa välittömästi nykyisiin tarpeisiin, vaan luo pohjan tulevalle tekoälyn kehitykselle.

Yllättäen näiden sirujen lanseeraus tulee strategiseen aikaan, sillä Microsoft on ilmoittanut myös oman sirukehityksensä tekoäly- ja pilvipalveluihin. Tämä on herättänyt kovaa kilpailua tekoälylaitteistojen alalla, mikä on saanut yritykset nopeasti innovoimaan ja rikkomaan rajoja.

AWS Trainium2- ja Graviton4-sirujen odotetaan olevan asiakkaiden saatavilla lähitulevaisuudessa, kun Trainium2 julkaistaan ​​joskus ensi vuonna ja Graviton4 on jo ennakkoversiossa. Kun teknologiateollisuus jatkaa siirtymistä kohti pilvilaskentaa ja tekoälypohjaisia ​​ratkaisuja, Amazon on valmis olemaan tärkeässä roolissa tässä digitaalisessa muutoksessa.

AI-siruilla on suuri potentiaali

AWS kehittää usein siruja Yrityksen liiketoiminnan tarpeiden lisäksi se todistaa jälleen kerran, että tekoälysiruissa on paljon potentiaalia, mikä ei heijastu vain pilvessä, vaan myös laitepuolella.

Futurum Intelligencen mukaan vuoteen 2023 mennessä Nvidian osuus AI ​​GPU-markkinoista on 92 prosenttia ja 75 prosenttia koko datakeskusten AI-puolijohdemarkkinoista. Tämä hallitseva asema jatkuu jo ennestään suurilla markkinoilla, joiden odotetaan kasvavan lähes puoleen vuoteen 2024 mennessä.

Analyytikkoyhtiö arvioi, että datakeskusten tekoälysovellusten prosessorien ja kiihdyttimien kokonaismarkkina-arvo nousee 56,3 miljardiin dollariin, mikä on 49,3 % kasvua vuoden 2023 37,7 miljardin dollarin vuotuisesta markkina-arvosta. Markkina-analyytikot ennustavat, että markkinat kasvavat 29,7 prosentin vuotuisella kasvuvauhdilla seuraavien viiden vuoden aikana, mikä nostaa markkinoiden koon 98,4 miljardiin dollariin vuonna 2026 ja 138,3 miljardiin dollariin vuonna 2028.

Futurum jakaa tekoälyn datakeskusten prosessorimarkkinat neljään luokkaan: prosessorit, grafiikkasuorittimet, erikoiskiihdyttimet (kutsutaan XPU:iksi) ja Googlen, AWS:n ja Microsoftin kaltaisten yritysten tuottamat omat pilvikiihdytit.

Vuonna 2023 prosessorit muodostavat 20,5 % markkinoista, GPU:t 73,5 % ja XPU- ja pilvikohtaiset tuotteet kumpikin 3 %.

1. Vuonna 2023 prosessorit muodostavat 20 % palvelinkeskusten tekoälyn käsittelystä, ja niillä on jatkossakin tärkeä rooli. Futurum arvioi niiden kasvavan viiden vuoden 28 prosentin vuotuisella kasvuvauhdilla 7,7 miljardista dollarista vuonna 2023 26 miljardiin dollariin vuonna 2028. Futurum arvioi, että Nvidian markkinaosuus on 37 prosenttia vuonna 2023 ja Intelin 23 prosenttia.

2. Vuoteen 2023 mennessä grafiikkasuorittimet muodostavat 74 % palvelinkeskusten tekoälysovelluksissa käytetyistä piirisarjoista, ja niiden viiden vuoden yhdistetty vuotuinen kasvuvauhti on 30 %, mikä kasvaa 28 miljardista Yhdysvaltain dollarista vuonna 2023 102 miljardiin dollariin vuonna 2028. Futurum arvioi, että Nvidia omistaa 92 prosenttia AI ​​GPU-markkinoista.

3. XPU kokee viiden vuoden yhdistetyn 31 prosentin vuotuisen kasvuvauhdin, joka kasvaa 1 miljardista Yhdysvaltain dollarista vuonna 2023 3,7 miljardiin dollariin vuonna 2028.

4. Julkisten pilven tekoälykiihdyttimien vuotuinen kasvuvauhti on 35 % viiden vuoden aikana, ja se kasvaa 1,3 miljardista Yhdysvaltain dollarista vuonna 2023 6 miljardiin dollariin vuonna 2028.

Futurum sulkee pois tekoälyprosessorit ja -kiihdytit tästä tutkimuksesta, jos niitä ei ole saatavilla julkiseen käyttöön palvelinkeskuksissa, mikä sulkee pois Metan, Teslan ja Applen suunnittelemat ja käyttämät tekoälypiirisarjat.

Maantieteellisesti katsottuna Pohjois-Amerikka hallitsee markkinoita, ja sen osuus markkinaosuudesta on 55 % vuoteen 2023 mennessä. Eurooppa, Lähi-itä ja Afrikka (EMEA) sekä Aasian ja Tyynenmeren alue (APAC) seuraavat tärkeitä markkinoita, kun taas Latinalainen Amerikka (LATAM) edustaa kehittyvää aluetta, jolla on valtava kasvupotentiaali.

Visuaalinen ja äänianalytiikka ovat suurimmat käyttötapaukset vuonna 2023. Futurum ennustaa, että vuonna 2028 kolme suurinta käyttötapaa ovat visuaalinen ja äänianalyysi, simulointi ja mallintaminen sekä tekstin luominen, analysointi ja yhteenveto.

Omdian uusi tutkimus ennustaa, että reuna-AI-prosessorimarkkinat tuottavat 60,2 miljardia dollaria tuloja vuoteen 2028 mennessä, ja vuotuinen kasvu on 11 prosenttia.

Omdian uusimmassa reunaprosessoriennusteessa todetaan, että liikevaihdon kasvua vetää laitteistojen lisääntynyt kysyntä, kun eri toimialat ja laitteet ottavat käyttöön tekoälyn. Yksi markkinoiden kasvua vauhdittavista alueista on PC-segmentti, jonka tuotevalikoima kasvaa suurilta toimittajilta, kuten Intel, AMD ja Apple. PC-valmistajien kerrotaan yrittävän markkinoida tekoälyprosessorien sisällyttämistä laitteisiinsa "ainutlaatuisena myyntivalttina".

Raportissa korostetaan henkilökohtaisten tietokoneiden lisäksi tekoälyprosessorien nopeaa käyttöä esimerkiksi autoissa, droneissa, turvakameroissa ja roboteissa.

Tästä voimme nähdä AWS-kaupan taustalla olevat aikomukset.