AI-tähtiyritykset taistelevat kiivaasti pienten mallien kanssa, kustannukset romahtavat ja ne säästävät sähkölaskuja, mikä nopeuttaa AI

AI-tähtiyritykset kilpailevat pienten mallien kanssa, kustannukset romahtavat ja ne säästävät sähkölaskuja, mikä nopeuttaa tekoälyn suosiota

2024-07-22

Älykkäät asiat (julkinen tili:zhidxcom）
Kokoanut Meng Qiang
Toimittaja Yunpeng

Venture Beat -raporttien mukaan viime viikolla Hugging Face, Mistral AI ja OpenAI julkaisivat vastaavat pienet mallinsa (SLM) 16. ja 18. heinäkuuta, ja ne lupasivat tuoda edistyneitä luonnollisen kielen käsittelyominaisuuksia. Aiemmin teknologiayritykset ovat kilpailleet suurempien ja monimutkaisempien hermoverkkojen tavoittelemisesta suurella kielimalliradalla. Venture Beat uskoo, että nämä pienet mallit ovat avanneet uusia polkuja ja voivat myös vaikuttaa siihen, miten yritykset käyttävät tekoälyratkaisuja.

Pienet mallit, kuten nimestä voi päätellä, ovat suhteessa suuriin kielimalleihin (LLM). Niissä on yleensä vähemmän parametreja ja alhaisemmat laskentaresurssit. Verrattuna suuriin kielimalleihin, joiden parametrit ovat usein sadoissa miljardeissa tai jopa biljoonissa, kolmen uuden pienen mallin: SmolLM, Mistral NeMo ja GPT-4o mini parametrit voivat vaihdella sadasta miljoonista kymmeniin miljardeihin koulutuksesta riippuen. energiankulutus on pienempi kuin suurissa kielimalleissa. Vaikka kolme mallia käyttävät eri menetelmiä tekoälyn popularisoimiseen, niillä kaikilla on yhteinen tavoite: tuoda tehokkaat kielenkäsittelyominaisuudet useammille laitteille ja sovelluksille.

1. Kuinka pienet mallit muuttavat reunalaskentaa

Venture Beat uskoo, että Hugging Facen SmolLM on innovatiivisin näistä kolmesta. Se on erityisesti suunniteltu toimimaan mobiililaitteissa, ja siinä on kolme eritelmää: 135 miljoonaa, 360 miljoonaa ja 1,7 miljardia parametria, mikä helpottaa tekoälyn käsittelyä reunalaitteissa ja ratkaisee tietosuojan ja latenssin keskeiset kysymykset.

SmolLM:n merkitys on paljon muutakin kuin tehokkuuden parantaminen. Kun reunalaitteiden sallitaan käyttää tekoälyprosessointia, laitesovellukset voivat toimia alhaisen viiveen ja korkean yksityisyyden suojan perusteella. Aiemmin monia monimutkaisia tekoälytoimintoja ei voitu toteuttaa tietosuoja- tai yhteysongelmien vuoksi.

Lisäksi Mistral AI julkaisi Mistral NeMo -mallin, jossa on 12 miljardia parametria ja jopa 128 000 kontekstiikkuna. Mistral NeMo on suunnattu pöytätietokoneille, ja se on sijoitettu suurten pilvimallien ja erittäin kompaktin mobiilin tekoälyn väliin. Ensimmäinen on laajamittainen tekoälymalli, joka on koulutettu pilvilaskenta-alustalla, kun taas jälkimmäinen on mobiililaite, jolla on rajalliset resurssit (. kuten matkapuhelin ja puettavat laitteet).

Venture Beat sanoi, että Mistral Nemon laskentamenetelmä voi tuoda huomattavia muutoksia yrityskenttään. Mallilla on potentiaalia hyödyntää kuluttajatason laitteistoa monimutkaisten tekoälyominaisuuksien demokratisoimiseksi, jotka olivat aikoinaan teknologiajättien ja hyvin rahoitettujen tutkimuslaitosten omaisuutta. Tämä voi auttaa eri toimialoja popularisoimaan tekoälypohjaisia sovelluksia, kuten optimoimaan asiakaspalvelua ja tarjoamaan kehittyneempiä data-analyysityökaluja.

2. OpenAI:n tehokkaalla pienellä mallilla GPT-4o mini on kaunis hinta

OpenAI liittyi pienten mallien kilpailuun myös lanseeraamalla GPT-4o minin, jota kutsutaan markkinoiden kustannustehokkaimmaksi pienmalliksi. Venture Beat väittää, että GPT-4o mini vähentää huomattavasti tekoälyn integrointirahaston käyttöä.

Tämän lisäksi GPT-4o minin hinnoittelustrategia voi synnyttää uuden tekoälyyn perustuvan innovaation aallon, erityisesti startup- ja pienyritysten keskuudessa. Tämä malli pienentää merkittävästi tekoälyn integroinnin kustannuksia, mikä vähentää tehokkaasti markkinoille pääsyn esteitä tekoälypohjaisten ratkaisujen käyttöönotolle. Ventrue Beat uskoo, että tämä voi nopeuttaa teknologista innovaatiota ja uudistuksia useilla toimialoilla. Lisäksi tämä siirtyminen pienempiin malleihin heijastaa uusia trendejä tekoälyyhteisössä: tutkijat ja kehittäjät keskittyvät yhä enemmän tehokkuuteen, saavutettavuuteen ja niche-sovelluksiin. Tämä suuntaus voi johtaa kohdennettuihin ja tehokkaampiin tekoälyratkaisuihin, jotka on optimoitu tietyille tehtäville ja toimialoille.

3. Pienet mallit edistävät vihreän teknologian innovaatioita ja vähentävät teknologian hiilijalanjälkeä

Siirtyminen pienempiin malleihin liittyy myös kasvavaan huoleen tekoälyn ympäristövaikutuksista. Pienen mallin harjoittelu ja käyttö kuluttavat vähemmän energiaa, mikä saattaa pienentää tekoälytekniikan hiilijalanjälkeä. Koska teknologiayrityksillä on yhä enemmän paineita olla kestävällä pohjalla, Venture Beat uskoo, että pienen mallin alhainen energiankulutus ja alhaiset päästöt voivat muodostua tärkeäksi myyntivaltiksi.

Tämän pienempiin malleihin siirtymisen ympäristövaikutukset voivat olla syvällisiä. Tekoälyn yleistyessä tehokkaampien mallien leviämisen aiheuttamat energiansäästöt voivat olla valtavat. Tämän ansiosta tekoäly voi ottaa johtavan roolin vihreissä innovaatioissa sen sijaan, että se jatkaisi ilmaston lämpenemistä.

Pienten mallien nousussa ei kuitenkaan ole haasteita. Tekoälyn yleistyessä ennakkoluulottomuutta, vastuullisuutta ja eettistä käyttöä koskevat kysymykset tulevat yhä tärkeämmiksi. Jos tekoälyn levittäminen pienten mallien kautta jätetään sääntelemättä, se voi vahvistaa olemassa olevia harhoja tai luoda uusia eettisiä ongelmia. Pienten mallien kehittäjille ja käyttäjille tulee teknisten ominaisuuksien lisäksi asettaa etusijalle myös eettiset asiat.

Johtopäätös: AI-kehityksen tulevaisuus viittaa monipuolistumiseen ja erikoistumiseen

Vaikka pienillä malleilla on etuja tehokkuuden ja yleistettävyyden suhteen, niiden prosessointiteho ei välttämättä vastaa suurten kielimallien käsittelytehoa monissa tehtävissä parametrien lukumäärän rajoitusten vuoksi. Venture Beat sanoi, että tämä osoittaa, että tulevaisuuden tekoälykehitysmaisemassa tulee olemaan erikokoisia kielimalleja ja pienemmillä malleilla on tiettyjä näkökohtia, joissa ne ovat hyviä.

Tulevaisuudessa odotamme AI-mallien kehitystä kukoistavan, olipa kyseessä suuri kielimalli tai pieni malli, yksikokoinen lähestymistapa ei ole suositeltavaa. Tärkeintä on löytää tasapaino mallin koon välillä. suorituskykyä ja erityisiä sovellusvaatimuksia. Yrityksille ja teknisille päättäjille nämä kolme pientä mallia edustavat muutosta kohti tehokkaampia, ammattimaisempia ja käyttöönotettavia tekoälyratkaisuja, jotka tarjoavat uusia mahdollisuuksia tekoälyn integroimiseen yritysympäristöihin. Mitä tulee siihen, voivatko pienet mallit korvata nykyisen suurten mallien dominanssin pilvessä, on vielä liian aikaista tehdä johtopäätöksiä.

Lähde: VentureBeat

uutiset

AI-tähtiyritykset kilpailevat pienten mallien kanssa, kustannukset romahtavat ja ne säästävät sähkölaskuja, mikä nopeuttaa tekoälyn suosiota

Johdanto

yhteystietoni