uutiset

Kun suuret mallit tunkeutuvat alalle, skenaariot ovat avain toteutukseen |

2024-08-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


"Teollisuuden on teknologiana käytettävä suuria malleja, ja niiden on ratkaistava alan käytännön ongelmia, ennen kuin se voi käyttää todellista arvoaan Guo Wei, Intel Corporationin markkinointiryhmän varapuheenjohtaja ja Intel China's Networkin johtaja." Edge and Channel Data Center Division, keskusteli kanssa Se on huomautettu monta kertaa viestinnässä TMTpost Media APP:n kanssa.

ChatGPT:n julkaisusta on kulunut melkein kaksi vuotta. Alle kahdessa vuodessa suuret tekoälymallit tunkeutuvat kaikille elämänaloille ennennäkemättömällä nopeudella. Varsinkin tästä vuodesta lähtien sekä suuret mallivalmistajat että Party A -yritykset ovat siirtäneet painopisteensä malliparametrien koosta siihen, kuinka suuret mallit ratkaisevat alan kipupisteitä, yrittäen löytää yhden tai useamman suuren mallin, joka voi ratkaista omat alan toteutusskenaariot .

Yleisestä teollisuuteen skenaariot ovat avain suurten mallien toteuttamiseen

Jos suurten valmistajien suurten mallien kilpailu jakautuu kahteen puolikkaaseen, ensimmäisellä puoliskolla suuret valmistajat tuovat markkinoille yleisiä suuria malleja peräkkäin ja osoittavat vahvuutensa jatkuvasti parantamalla mallien parametreja toisella puoliskolla, jolloin AI suuri mallit hyväksytään useammilla toimialoilla Kun sivuyritykset kiinnittävät huomiota, syntyy yhä enemmän pienparametrimalleja ja teollisuuden sovellusskenaariot ovat luonnollisesti nousseet osapuolen A yritysten ja puolueen B suurten mallitoimittajien huomion kohteeksi kysymys siitä, voidaanko suuria malleja todella toteuttaa tässä vaiheessa. Avain "kaupallistamiseen" alan puolella.

Tässä suhteessa Guo Wei kertoi TMTpost Media APP:lle, että Intel uskoo, että AI-suurten mallien teknologian tunkeutuessa vähitellen alalle, mallit muuttuvat vähitellen yleisistä suurista malleista alakohtaisiksi suuriksi malleiksi malli muuttuu ehdottomasti "Samalla toimialamalli yhdistää enemmän toimialakohtaista tietoa ja keskittyy yhteen tai useampaan erityiseen skenaarioon."

Sattumalta Cao Peng, JD Groupin teknisen komitean puheenjohtaja ja JD Cloud Divisionin puheenjohtaja, totesi äskettäin myös julkisesti JD Cloud Summitissa, että "yleiset suuret mallit luottavat laskentatehoon, kun taas suuret teollisuusmallit luottavat siellä liiketoimintaan." Wan Jingdongilla on jo yli 35 omaa toimitushenkilöstöä, yli 200 000 kauppiasta, yli 30 000 lääkäriä, yli 20 000 hankinta- ja myyntitoimintoa sekä yli 10 000 T&K-henkilöstöä. Se käyttää suuria mallipohjaisia ​​sovelluksia yli 100 tekoälyn skenaariossa.

"2024 Global Digital Economy White Paper" osoittaa, että suurten tekoälymallien määrä maailmassa on saavuttanut 1 328, joista Kiinan osuus on 36%. Toisaalta IDC:n tiedot osoittavat, että Kiinan generatiivisen tekoälyn osuus kaikista tekoälymarkkinoiden investoinneista vuonna 2022 on 4,6 prosenttia. Generatiivisen tekoälyteknologian nopean kehityksen myötä generatiivisten tekoälyinvestointien osuus nousee 33,0 prosenttiin vuonna 2027, investointien mittakaava ylittää 13 miljardia dollaria ja viiden vuoden yhdistelmäkasvu (CAGR) on 86,2 prosenttia.

Ilmeisesti iso malli on aivan kuten edellinen pilvitekniikan aikakausi Pelkästään teknologian osalta Kiina saattaa olla vielä hieman jäljessä maailman ensiluokkaisesta tasosta, mutta skenaarioihin keskittyessä Kiinassa on runsaasti sovellusskenaarioita, ja nämä. skenaariot Tämä on avain aidosti "lentämään tavallisten ihmisten koteihin" suurilla tekoälymalleilla.

Miten suuria malleja voidaan käyttää paremmin pilvestä reunaan?

Kun suuret mallit siirtyvät vähitellen yleisten suurten mallien suurista parametreista toimialakohtaisten mallien pieniin parametreihin, myös suuret mallit osoittavat suuntausta siirtyä pilvestä laitepuolelle. IDC:n tiedot osoittavat, että vuoteen 2026 mennessä 80 prosenttia maailmanlaajuisista yrityksistä käyttää generatiivista tekoälyä ja 50 prosenttia maailmanlaajuisista reunaratkaisuista sisältää tekoälyn.

Sachin Katti, Intelin Network and Edge -divisioonan johtaja ja johtaja, sanoi kerran, että tekoälyn tulevaisuus riippuu avoimesta ekosysteemistä ja tekoälyn soveltaminen on siirtymässä datakeskuksista reunalaskentaan.

Intel Corporationin varatoimitusjohtaja ja Kiinan verkko- ja reunadivisioonan johtaja Chen Wei kertoi myös TMTpost Media APP:lle, että tämän vuoden kehitystrendeistä päätellen Intelin asiakkaat yksin tutkivat suurten reunamallien käyttöönottoa tänä vuonna. Ratkaisulle on tullut enemmän asiakkaita. Tänä vuonna voidaan sanoa, että yli puolet asiakkaista tutkii isoihin reunamalleihin perustuvia ratkaisuja, ja käytännön tapauksia on paljon huomautti edelleen.

Kun suuret mallit siirtyvät kohti reunaa, yritysten on otettava käyttöön monia tekijöitä, kuten latenssivaatimukset, käytännöllisyys, säädettävä mikrodatan optimointi ja tietoturvavaatimukset.

Suurien mallien reunapuolen käyttöönotto on kuitenkin vielä kehitysvaiheessa, ja markkinoilla on tällä hetkellä näkyvissä monia käyttöönottomalleja. ”Intelin havaintojen perusteella näemme, että monet asiakkaat rakentavat laitteisto- ja ohjelmistoratkaisuja Yleiset suuret mallit Suorituskyvyn optimointi on nopeasti kehittyvä malli", Chen Wei vastasi Titanium Media APP:n esittämään kysymykseen, kuinka suuria malleja voidaan soveltaa paremmin asiakaspuolella.

Puhuessaan Kiinan suurten mallien trendeistä ja näkymistä alalla, Guo Wei kertoi TMTpost Media APP:lle, että tästä vuodesta lähtien yhä useammat alan käyttäjät ovat ottaneet käyttöön monia alan suuria malleja "Viime vuonna kyse oli todennäköisesti enemmän kertomisesta Tänä vuonna olemme nähneet alalla yhä enemmän käyttöönottotapauksia, ja ne ovat kaikki skenaarioita, jotka voivat tehokkaasti ratkaista alan kipukohdat", Guo Wei sanoi.

Tämänhetkisen sovelluksen perusteella mallin parametrit ovat paljon pienempiä kuin yleisen suuren mallin parametrit Tällä hetkellä mallin parametrit ovat pääosin 7B ja 10B välillä vaikea tehtävä. Nykyinen valtavirran malli on syöttää tietoihin toimialakohtaista tietoa samalla kun sitä pakkaamme, mikä tunnetaan yleisesti progressiivisen karsinnan teknisenä ratkaisuna.

Tältä osin JD Cloudin tekninen johtaja kertoi Titanium Media APP:lle, että miehittämättömän logistiikkaajoneuvon skenaario esimerkkinä, suuruuden pienentämisen ja hermoverkkohaun avulla on mahdollista pakata noin kaksinkertainen määrä parametreja vähentämättä itse mallia. Suorituskyky, se voi myös vähentää latenssia noin kaksinkertaisesti.

Samaan aikaan Guo Wei jakoi Titanium Media APP:lle analyysinsä ja arvionsa Kiinan suurten teollisuusmallien kehittämismahdollisuuksista Hän huomautti, että Kiina voi kehittyä nopeammin kolmella tavalla.

Ensinnäkin itse mallin kehittäminen teollisuuden sovelluksissa. Kuten edellä mainittiin, "Pelkästään tekniikan suhteen Kiina saattaa silti olla kaukana maailman ensiluokkaisesta tasosta, mutta Kiinalla on runsaasti sovellusskenaarioita, mitä tulee teollisuuden käyttöön, erityisesti sovellusten integrointiin Guo Wein mukaan." , Kiina Voi mennä nopeammin, "Yksi Kiinan markkinoiden erityispiirteistä on sovellusten nopea kehitys ja kyky nopeasti tutkia tehokkaita tapoja ratkaista alan kipupisteitä."

Toiseksi mallin päättelykykyä parannetaan. Kun suuria malleja todella sovelletaan teollisuudessa, pelkkä mallikoulutukseen luottaminen ei riitä. Alan kipupisteiden ratkaisemiseksi on erityisen tärkeää parantaa mallin päättelykykyä Guo Wein mielestä kyvykkyyteen tulee myös tänä vuonna merkittäviä parannuksia.

Kolmanneksi Guo Wein näkemyksen mukaan, kun suuria malleja otetaan käyttöön teollisuudessa, on tarpeen koordinoida laskentatehon jakautumista pilven, laitepuolen ja reunan välillä , suuria malleja voidaan käyttää pääasiassa pilvessä, mutta teollisuuden käyttöönoton vuoksi tekoälyn laskentatehoa jaetaan väistämättä reuna- ja terminaalipuolelle, Guo Wei kertoi TMTpost Media APP:lle.

Monet kohtaukset on toteutettu

Kuten Guo Wei sanoi, tästä vuodesta lähtien monia suurten teollisuusmallien sovellusskenaarioita on otettu käyttöön laitepuolella.

Koulutuksen osalta Seewo lanseerasi yhdessä Intelin teknologiaan perustuvan "AI + Education" -ratkaisun Intel® Core™ Ultra -prosessorien avulla Seewo voi suorittaa suurten tekoälyn opetusmalleja paikallisesti ilman pilvilaskentaresursseja. parantaa siten järjestelmän vastenopeutta ja vakautta ja varmistaa sujuvan kokemuksen opetusprosessin aikana.

Vähittäiskaupan alalla Tous Les Jours on luonut älykkäitä myymäläratkaisuja reunalaskentateknologian avulla. Tällä ratkaisulla voidaan hyödyntää liikkeen olemassa olevia audio- ja videokeräyslaitteita ja dataintegroinnin ja optimoinnin hallintaalustan kautta eri myymälöiden tarpeiden ja ominaisuuksien mukaan luoda niille sarja eksklusiivisia digitaalisia älykkäitä myymälämalleja, jotka tarjoavat tuotteiden esittelyn. ja myymäläpalvelut , myymälähygienia, työntekijöiden normit, joukkotiedot ja asiakasvirtanäkymät, jotka ovat parantaneet Tous Les Jours -myymälätoimintojen eriytettyä hallintaa, parantaneet hallinnan tehokkuutta, vähentäneet manuaalisten myymälätarkastusten kustannuksia ja vahvistaneet työntekijöiden normeja, mikä nopeuttaa leipomoalan älykästä kehitystä.

Lääketieteellisen terveyden osalta JD Health on käynnistänyt JD Yanxin suureen malliin perustuvan "Jingyi Qianxun" -lääketieteellisen suuren mallin, joka yhdistää suuren määrän kliinisen käytännön ohjeita, lääketieteellistä kirjallisuutta ja asiantuntijatietoa ja voi nopeasti saattaa päätökseen erilaisten skenaariot lääketieteen ja terveydenhuollon alalla. "Beijing Medical Qianxun" -suurmalliin perustuen se on tuonut markkinoille joukon ratkaisuja harjoittaville lääkäreille, mukaan lukien pilviklinikat, diagnoosin jälkeinen seuranta, asiantuntijoiden yhteinen konsultaatio, kliininen tieteellinen tutkimus, lääkärin IP-brändin inkubaatio ja " älykäs lääkäriassistentti" -työkalut. , joka ei ainoastaan ​​optimoi lääkäreiden online-diagnoosin ja -hoidon tehokkuutta ja laatua, vaan myös parantaa käytännön turvallisuutta.

Turvallisuuden osalta monet tietoturvatoimittajat, mukaan lukien 360, Qi'anxin, Tencent Cloud, Sangfor jne., ovat tuoneet markkinoille suuria mallituotteita tietoturvateollisuudessa, jotka perustuvat suuriin malliominaisuuksiin, tai ovat integroineet suurten tekoälymallien ominaisuudet alkuperäisiin Tekoälyn aikakauden yhä ankarampien turvallisuushaasteiden joukossa olemme saavuttaneet tavoitteen "päihittää tekoäly tekoälyllä".

Toimistotyössä monet valmistajat ovat ehdottaneet AIPC-konseptia ja keskittyvät toimiston tekoälyavustajaan. AI ​​Chatbot -skenaariossa suuret mallit voidaan ottaa nopeasti käyttöön Intel Core Ultra AI -tietokoneissa, ja käyttäjät voivat käyttää sujuvasti tehokkaita. suurten mallien tekstin luominen, ohjelmointi, matemaattiset laskelmat ja loogiset päättelyominaisuudet ja nauti kätevästä ja turvallisesta paikallisesta älykkäästä vuorovaikutteisesta kokemuksesta.

Asiakirjojen käsittelyssä käyttäjät voivat käyttää AI PC:tä sähköpostien tehokkaaseen käsittelyyn, tietojen muodostamiseen, työasiakirjojen automaattiseen luomiseen ja työn tehokkuuden parantamiseen. He voivat myös laatia nopeasti sopimusasiakirjoja ja käyttää tekoälyä oikeudenkäyntitapausten älykkääseen analysointiin tarjoamalla ammattimaista dokumenttien kirjoittamista kykyjä.

Yllä olevat ovat vain muutamia skenaarioita, joissa tekoälyn suuret mallisovellukset ovat tällä hetkellä suosittuja. Lisäksi teollisuuden suuria malleja käytetään laajasti myös monilla aloilla, kuten rahoitus, valmistus ja tutkimus. Eri toimialojen aikakausi, joka hyödyntää suurten tekoälymallien kykyjä liiketoiminnan vahvistamiseksi, on alkanut.

Data on edelleen väistämätön aihe

Kuten me kaikki tiedämme, data on suurten mallien nopean kehityksen "ravintoaine", olipa kyseessä sitten yleinen suuri malli tai teollisuuden suuri malli, jos haluat toteuttaa todellista arvoa ja vähentää "illuusioita", data on välttämätöntä. keskustelun aihe.

Alan osalta alan suuret mallit vaativat massiivisia ja runsaita toimialakohtaisia ​​tietoja Yrityksille, jotka haluavat käyttää suuria teollisuusmalleja kustannusten alentamiseen ja tehokkuuden lisäämiseen sekä siirtymiseen digitalisaatiosta digitaaliseen älykkyyteen. Hallintovalmiudet asettavat korkeampia vaatimuksia. Nykyisten teollisuuden sovellusten näkökulmasta yrityksen alkuperäiset tiedot eivät riitä täydellisen laajamittaisen yritystason toimialamallin kouluttamiseen. Nykyinen pääratkaisu on synteettisten tietojen käyttö. Seuraavaksi toisaalta yritysten on parannettava omien tietojensa laatua. Toisaalta erinomaisten synteettisten tietojen valitsemisesta on tullut myös vaikea kysymys, joka yritysten on kohdattava.

Toisaalta ero teollisuuden suurten mallien ja yleisten suurten mallien välillä on, että useimmat teollisuuden suuret mallit on otettava käyttöön laitteen puolella tai reunapuolella. Gartner ennustaa, että vuoteen 2025 mennessä yli 50 % yritysten hallinnoimasta tiedosta luodaan ja käsitellään konesalin tai pilven ulkopuolella.

Toisin sanoen vuoteen 2025 mennessä laitepuolen datan määrä ylittää 50 %. Tässä prosessissa, kun reunapuolen datan määrä kasvaa, tiedonsiirron kaistanleveys on myös suuri haaste, joka yritysten on kohdattava "Vaikka Kiina on maailman johtava siirtokaistanleveyden rakentaja koko infrastruktuurille, kun a suuri määrä Kun dataa syntyy reunalla, se voi silti aiheuttaa verkkomyrskyjä, ja meidän on edelleen optimoitava verkonhallintaa ja tiedonsiirtostrategioita", Guo Wei kertoi Titanium Media APP:lle.

Tulevaisuuteen katsoen Sachin Katti kertoi TMTpost Media APP:lle, että vaikka tekoäly ohjaa dataa parantaakseen laatua, nämä tiedot puolestaan ​​tukevat tekoälyn paranemista, mikä lopulta saavuttaa hyvän kierteen.

Ilmeisesti suuret mallit ovat tulleet alan nopeaan kehitykseen. Tämän prosessin aikana yritysten on noudatettava "datavetoinen, skenaario on kuningas" -periaatetta, jotta suuret mallit voidaan ottaa paremmin käyttöön alalla.(Tämä artikkeli julkaistiin ensimmäisen kerran Titanium Media APP:ssa, kirjoittaja | Zhang Shenyu, toimittaja | Gai Hongda)