Mitä jää jäljelle reunalle laskeutuneesta suuresta mallista?

2024-08-07

Kun suuret mallit alkavat teollisuuden voimaannuttamisprosessia, niiden laajamittaisesta käyttöönotosta reunalla/sivulla on tullut jatkokehityksen tärkein prioriteetti. Käyttöönotto reunalla/sivulla on kuitenkin varmasti parempi välitön vastaus ja yksityisyyden suojaaminen suurille malleille, mutta se kohtaa myös haasteita laskentatehon pirstoutumisen, energiatehokkuusongelmien ja toteutusskenaarioiden osalta. Yrityksille tämä on sekä vaikeus että mahdollisuus.

Teollisuuden sovellustarpeiden vetämänä suuret mallit kehittyvät kohti reunaa.

Tällä hetkellä maani suuri malliteollisuus kehittyy nopeasti. Tilastot osoittavat, että maaliskuun lopussa Kiinassa julkaistujen suurten mallien määrä on noussut 117:ään. Kuitenkin, toisin kuin Yhdysvalloissa, joka keskittyy alkuperäisiin läpimurtoihin, Kiinan suuret malliyritykset painottavat kehitysprosessissa enemmän sovellusten toteutusta. Zhou Hongyi, 360 Groupin perustaja ja puheenjohtaja, sanoi edellisessä puheessaan, että volyymimallit, laskentateho ja data eivät ole ainoita vaihtoehtoja kehittää malleja kohti biljoonia parametreja. Tekoälyn suurilla malleilla on monipuolisemmat kehityspolut. Li Dahai, yksi Face Wall Intelligencen perustajista ja toimitusjohtaja, korosti myös toimialamallien merkitystä, joista on nyt tullut yksi tärkeimmistä kehitystrendeistä.

Jos haluat tehostaa tuhansia toimialoja, suuria malleja ja niihin liittyvää laskentatehoa ei voida ottaa käyttöön vain pilvessä, Edge- ja loppupuolen malleilla on suhteellisia etuja, joita pilvellä ei ole. Ensimmäinen on, että päätypuolen mallilla on vahvempi luotettavuus. Päätteissä käyttöönotetut mallit voivat olla vuorovaikutuksessa ympäristön kanssa reaaliajassa ja jatkuvasti, mutta pilvimallien on vaikea ylläpitää tätä jatkuvuutta. Toiseksi asiakaspuolen malli voi paremmin varmistaa käyttäjien yksityisyyden. Tämä ongelma on herättänyt yhä enemmän huomiota, jos robotit tulevat tulevaisuudessa laajasti kotiin, yksityisyysongelmat muuttuvat vakavammiksi. Asiakaspuolen mallin edut tietosuojan varmistamisessa ovat vielä selvempiä.

Tämän ymmärryksen perusteella jotkut reunalaskentayritykset ovat ottaneet johtoaseman reunan tekoälyn ympärillä tapahtuvassa skenaariokäytännössä ja onnistuneet injektoimaan reuna-AI:tä useille kentälle. Esimerkiksi älykkään valmistuksen alalla NVIDIAn Jetson edge -laskenta-alusta voi tuoda tekoälyn laskentaominaisuudet teollisiin skenaarioihin ja ratkaista ongelmia, kuten vikojen havaitseminen ja joustava valmistus kokoonpanolinjalla käyttämällä GPU-kiihdytettyä AI-visuaalista päättelyä. Intelin ratkaisuja käytetään myös esimerkiksi älykkäässä valvonnassa, koulutuksessa ja opetuksessa sekä älykkäässä terveydenhuollossa.

Reuna- ja päätemallien kehitys on myös vauhdittanut reuna-AI-laskentaa, ja siihen liittyvä laskentateho, sirut ja muut alan ketjulinkit ovat käynnistäneet laajamittaisen kehitysaallon. Aixin Yuanzhin perustaja ja puheenjohtaja Qiu Xiaoxin huomautti, että suurten mallien todellinen laajamittainen toteutus edellyttää pilven, reunan ja pään tiivistä integrointia kolmella tasolla. Avain reuna- ja päätypuolen yhdistämiseen on tekoälyssä laskeminen ja havainto. Qiu Xiaoxin uskoo, että älykkäistä siruista ja multimodaalisista suurista malleista on tullut "kultainen yhdistelmä" tekoälyn aikakaudella Kun suuria malleja käytetään yhä laajemmin, älykkäämmistä, tehokkaammista ja ympäristöystävällisemmistä avainsanoja tulee. siruja ja tekoälyllä varustettua Prosessorin tehokas päättelysiru tulee olemaan järkevämpi valinta suurten mallien toteuttamiseen, mikä on myös avain inklusiivisen tekoälyn edistämiseen. STL Partners ennustaa, että vuoteen 2030 mennessä globaalien reunalaskennan potentiaalisten markkinoiden koko kasvaa 445 miljardiin Yhdysvaltain dollariin, ja alan vuotuinen kasvuvauhti on jopa 48 %.

Monipuolinen laskentatehon käyttöönotto selviytyäkseen pirstoutumisen haasteista

Suurien mallien käyttöönotto reuna-/päätypuolella ei kuitenkaan onnistu yhdessä yössä. Reunalaitteiden laskentaresurssien rajoitusten ja suurten mallien laskentaresurssitarpeiden moninaisuuden vuoksi reunan käyttöönotto kohtaa ensin haasteita laskentatehon suhteen. Toisaalta mallinvalmistajien on suoritettava suurille malleille tekninen käsittely, kuten pakkaus, karsiminen ja kvantifiointi, vähentääkseen mallin kokoa ja laskennallista monimutkaisuutta, jotta se voi mukautua reuna-/päätylaitteiden suorituskykyvaatimuksiin. toisaalta, miten laskentateho pohja Toimitilojen käyttöönotto on myös painopiste.

Zhang Yu, Intelin Kiinan verkko- ja reunadivisioonan teknologiajohtaja, korosti, että koska tekoäly antaa valtaa tuhansille teollisuudenaloille, eri sovelluksilla on erilaiset laskentatehon vaatimukset, ja käyttöalue on erittäin laaja. Ne, joilla on korkeat suorituskyvyn vaatimukset, täytyy isännöidä laskentatehoklusterissa, kun taas voidaan käyttää yhtä tai useampaa laitetta, joilla on alhainen laskentatehovaatimus. Arm Technologyn tuotejohtaja Yang Lei sanoi myös, että kun tällaisia suuria tekoälymalleja otetaan käyttöön päätelaitteissa, se kohtaa silti useita haasteita, kuten kustannuksia, virrankulutusta ja ohjelmistoekosysteemiä.

Vastauksena tällaisiin kysyntätrendeihin laskentatehoinfrastruktuurin toimittajat, kuten Inspur ja Lenovo, ovat viime vuosina rakentaneet laskentatehon asetteluja "loppureunan pilviverkon älykkyyden" ympärille. Tuotteisiin kuuluvat älykkäät reunayhdyskäytävät, reunapalvelimet, teollisuusohjaimet, sulautetut tietokoneet ja muut laitteistot eri toimialojen laskentatehotarpeisiin. Sirupuolella CPU+GPU+NPU-integraatiosta on tullut prosessorikehityksen suunta monimutkaisemman tekoälyn laskentatehoa varten. Qualcomm julkaisee integroidun Snapdragon X Elite -hermoprosessointiyksikön, joka tukee kymmeniä miljardeja parametritason malleja. Intel Meteor Lake -prosessori yhdistää NPU:n prosessorissa olevan laskentamoottorin AI-toimintoon parantaakseen AI-toimintoja käyttävien PC:n energiatehokkuutta. Kotimaisten AI-sirujen osalta Aixin Yuanzhi julkaisi äskettäin myös "Aixin Tongyuan AI -prosessorin". Operaattorin käskysarja ja tietovirran mikroarkkitehtuuri ottavat käyttöön ohjelmoitavan tietovirran mikroarkkitehtuurin, joka voi tehokkaasti parantaa energiatehokkuutta ja laskentatehoa. Tiheys, joka soveltuu reunalaskennan ja tekoälyn päättelykenttien kehittämiseen.

Reunapuolen energiatehokkuusongelmat ovat näkyviä, ja kevyt kehitys on avainasemassa

Energiatehokkuus on myös avainkysymys, joka on otettava huomioon reunasuurten mallien kehittämisessä. Itse asiassa, jos suuria malleja halutaan ottaa tehokkaasti käyttöön reuna-/päätypuolella verrattuna pilveen, energiatehokkuusongelmat ovat näkyvämpiä. Intelin johtaja ja Network and Edge -divisioonan johtaja Sachin Katti sanoi kirjoittajan haastattelussa, että kun puhutaan laskentatehosta, laskentatehon optimoinnin, ohjelmistoekologian jne. lisäksi keskeinen kysymys on virrankulutus, varsinkin kun se on käytössä reunassa. Reunakäyttöisten laitteiden energiankulutus voi olla noin 200 W, pilvikäytön energiankulutus voi olla 1k–2kW, ja yksikerroksisen telineen energiankulutus datakeskuksessa voi olla jopa 100 kW. Jos koko konesalin energiankulutus lasketaan yhteen, se voi nousta 50-100 GW:iin.

Edge-laitteilla on usein rajallinen laskentateho ja muisti, ja suuret mallit vaativat huomattavia resursseja korkean suorituskyvyn päättelyyn. Tästä syystä resurssien käytön optimointi ja energiankulutuksen vähentäminen samalla, kun varmistetaan mallin tarkkuus ja vastausnopeus, on noussut avainkysymykseksi. Vastauksena tähän trendiin asiaankuuluvat valmistajat ovat edistäneet kevyitä kehityskehyksiä ja kiihdytyskirjastoja, kuten AMD:n julkaisemaa Ryzen AI -mallin käyttöönottomoottoria, Intelin OpenVINO-päätelmäkiihtyvyyskirjastoa, NVIDIAn TensorRT-suuren suorituskyvyn päättelykiihdytyskirjastoa jne. yhdistettynä kohdennettuihin Kevyet sulautettujen ja mobiilipäätelaitteiden kehityskehykset (kuten PyTorch Mobile, TensorFlow Lite, Paddle Lite jne.) voivat edistää tekoälyn laajaa leviämistä mobiililaitteissa, esineiden internetissä ja muissa reunalaskentaskenaarioissa.

Lisäksi teollisuus on myös alkanut ottamaan laajalti käyttöön nestejäähdytystekniikkaa palvelimien jäähdyttämiseen, ja sitä käytetään vähitellen datakeskuksissa ja suurissa malliasetuksissa. Ymmärretään, että nykyisellä nestejäähdytystekniikalla voidaan jo jäähdyttää 100 kW:n kalusto, ja sen odotetaan kasvavan 300 kW:iin tulevaisuudessa.

Kun tutkit tekoälysovelluksia, kuka on tulevaisuuden "tähtikohtaus"?

Kun ihmiset korostavat yhä enemmän suurten mallien voimaa teollisuuden sovelluksissa, sopivien "tähtikohtausten" löytämisestä on tullut avainkysymys, joka määrää alan onnistumisen tai epäonnistumisen. Tällä hetkellä tekoälymatkapuhelimista, tekoälytietokoneista ja autonomisesta ajamisesta on tullut lupaavimmat sovellusmarkkinat suurille malleille.

Markkinatutkimusyhtiö IDC:n uusin tutkimus osoittaa, että tekoälymatkapuhelinmarkkinat saavuttavat 234,2 miljoonan kappaleen toimitukset vuonna 2024, mikä on 363,6 % kasvua vuoden 2023 50,5 miljoonasta yksiköstä, ja niiden osuus älypuhelimien kokonaismäärästä on 19 %. markkinoille tänä vuonna. Vuonna 2028 tekoälymatkapuhelintoimitukset saavuttavat 912 miljoonaa yksikköä vuonna 2028, ja vuotuinen kasvuvauhti on 78,4 %. Anthony Scarsella, IDC:n Worldwide Quarterly Mobile Phone Trackingin tutkimusjohtaja, sanoi, että kustannukset pysyvät keskeisenä esteenä, kun tekoälypuhelimet julkaistaan, koska monet tehokkaat sirut ja NPU:t ovat kalliita ja myydään pääasiassa huippuluokan markkinoilla. Ajan myötä ja kilpailun kiristyessä uskomme kuitenkin, että nämä komponentit löytävät tiensä keskihintaisiin ja edullisempiin malleihin.

Tekoälytietokoneet kypsyvät nopeammin kuin alun perin odotettiin, ja niiden odotetaan tuovan korvauksia maailmanlaajuiselle PC-teollisuudelle. Canalysin ennusteen mukaan AI PC:n globaali levinneisyysaste nousee 19 %:sta 71 %:iin vuodesta 2024 vuoteen 2028, ja toimitukset kasvavat 51 miljoonasta yksiköstä 208 miljoonaan yksikköön, ja vuosikasvu on 42,11 %. Morgan Stanley ennustaa, että tekoälytietokoneiden osuus PC:n kokonaismarkkinoista on tänä vuonna 2 %, ja ensi vuonna 16 %, vuonna 2026 28 %, vuonna 2027 48 % ja vuonna 2028 64 %.

Suurten mallien käyttö autoissa on kuitenkin vielä alkuvaiheessa. Älykkyyden käsitteen juurtuessa ihmisten sydämiin on kuitenkin tullut yksimielisyys, että autoista tulee lopulta "käveleviä mobiilipäätteitä". suuret AI-mallit autoissa myös "ottavat pikajunaa". Suurille malleille on kaksi pääsuuntaa: yksi on astua ohjaamoalueelle älykkäämmän ihmisen ja tietokoneen välisen vuorovaikutuksen saavuttamiseksi, toinen on yhteistyö automaattisen ajojärjestelmän kanssa älykkäiden ajoratkaisujen parantamiseksi. Zhang Chi, Maichi Intelligent Technology Co., Ltd.:n tekninen johtaja, sanoi, että suuret mallit nopeuttavat autonomisen ajon siirtymistä moottoriteiltä monimutkaisempiin kaupunkiskenaarioihin ja edistävät myös päästä päähän -havainnointi- ja ohjausintegraatiota. Liu Jianwei, yksi Aixin Yuanzhin perustajista ja varapuheenjohtaja, sanoi, että Aixin Yuanzhi ennusti Transformerin puhkeamisen vuonna 2022 ja otti johtoaseman Aixin Tongyuan AI -prosessorilla varustetun sirun lanseerauksessa. Aixin Yuanzhin älykkäät ajosirut, kuten M55H ja M76H, on asennettu nykyisiin kuumaan myyntiin.

uutiset

Mitä jää jäljelle reunalle laskeutuneesta suuresta mallista?

Johdanto

yhteystietoni