uutiset

Star AI yksisarvinen Mistral AI esittelee uuden suurten mallien kuninkaan, jolla on ylivoimaiset koodaukset ja matemaattiset kyvyt

2024-07-17

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Zhidixi (julkinen tili: zhidxcom)

Käännetty |

Toimittaja |

Zhidongzhi News 17. heinäkuuta VentureBeatin eilen mukaan ranskalainen tekoälyn startup Mistral AI lanseerasi äskettäin kaksi uutta tekoälymallia, joista toinen on Codestral Mamba 7B, koodin sukupolvimalli ohjelmoijille ja kehittäjille, ja toinen on suunniteltu matematiikkaan AI-malli, joka on suunniteltu asiaankuuluviin päättelyihin ja tieteellisiin löytöihin.

Codestral Mamba 7B:ssä on nopeampi päättely ja pidempi konteksti, mikä tarjoaa nopeat vasteajat jopa pitkällä tekstillä. Samaan aikaan malli pystyy käsittelemään jopa 256 000 merkkiä, kaksi kertaa enemmän kuin GPT-4o.

Mathstral 7B:ssä on 32K kontekstiikkuna ja se käyttää Apache 2.0:n avoimen lähdekoodin lisenssiä. Se voi saavuttaa parempia tuloksia kuin muut matemaattiset päättelymallit, joissa on enemmän päättelyaikalaskelmia.

1. Koodin luontimallit voivat käsitellä pidempiä yhteyksiä

Hyvin rahoitettu ranskalainen tekoälyn startup Mistral AI, joka tunnetaan tehokkaista avoimen lähdekoodin tekoälymalleista, lanseerasi tänään kaksi uutta tuloa kasvavaan suurten kielimallien (LLM) perheeseensä: matemaattiseen malliin ja toisen ohjelmoijille sekä koodin luontimallin. kehittäjät perustuvat Mambaan, uuteen arkkitehtuuriin, jonka muut tutkijat ovat kehittäneet viime vuoden lopulla.

Mamba yrittää parantaa useimpien johtavien LLM-yritysten käyttämän muuntaja-arkkitehtuurin tehokkuutta yksinkertaistamalla huomiomekanismiaan. Mamba-pohjaiset mallit eroavat yleisimmistä Transformer-pohjaisista malleista siinä, että niissä voi olla nopeammat päättelynopeudet ja suuremmat kontekstiikkunat. Muut yritykset ja kehittäjät, mukaan lukien AI21, ovat julkaisseet uusia tekoälymalleja sen pohjalta.

Nyt tämän uuden arkkitehtuurin myötä Mistral AI nimeää sen osuvastiCodestral Mamba 7B , joka tarjoaa nopeat vasteajat, vaikka syöttöteksti olisi pitkää. Codestral Mamba sopii koodin tuottavuuden käyttötapauksiin, erityisesti paikallisempiin koodausprojekteihin.

Mistral AI testasi mallia, joka on saatavilla ilmaiseksi Mistral AI:n Plateforme API:lla ja prosessoi jopa 256 000 tokenin tuloa, kaksi kertaa nopeammin kuin OpenAI:n GPT-4o.

Mistral AI osoittaa, että Codestral Mamba toimii paremmin kuin kilpailevat avoimen lähdekoodin mallit CodeLlama 7B, CodeGemma-1.17B ja DeepSeek vertailuissa, kuten HumanEval.

Kehittäjät voivat muokata ja ottaa käyttöön Codestral Mambaa GitHub-arkistosta ja HuggingFacesta. Se on saatavilla avoimen lähdekoodin Apache 2.0 -lisenssillä.

Mistral AI väittää, että Codestralin varhaiset versiot ovat parempia kuin muut koodigeneraattorit, kuten CodeLlama 70B ja DeepSeek Coder 33B.

Koodin generoinnista ja koodausavustajista on tullut laajalti käytettyjä sovelluksia tekoälymalleille, ja GitHubin Copilotin, Amazonin CodeWhispererin ja OpenAI:n käyttämän Codeniumin suosio on kasvanut.

2. Matemaattisen päättelyn mallilla on erinomaiset ominaisuudet ja myös hienosäätöominaisuudet.

Toinen Mistral AI:n lanseeraama malli onMathstral 7B , tekoälymalli, joka on suunniteltu matematiikkaan liittyvään päättelyyn ja tieteellisiin löytöihin. Mistral AI kehitti Mathstralin Project Numinan kautta.

Mathstralilla on 32 000 kontekstiikkuna ja se käyttää Apache 2.0 avoimen lähdekoodin lisenssiä. Mistral AI sanoo, että malli ylittää kaikki mallit, jotka on suunniteltu matemaattiseen päättelyyn. Se voi saavuttaa "merkittävästi parempia tuloksia" vertailuarvoissa, joissa on enemmän päättelyaikalaskelmia. Käyttäjät voivat käyttää sitä sellaisenaan tai hienosäätää mallia.

Mistral AI sanoi blogiviestissä: "Mathstral on toinen esimerkki erinomaisesta suorituskyvystä, kun rakennetaan malleja tiettyyn tarkoitukseen - kehitysfilosofiaa, jota edistämme aktiivisesti a la Plateformea, erityisesti sen uudella hienosäätötoiminnolla."

Mathstraliin pääsee Mistral AI a la Plataformen ja HuggingFacen kautta.

Mistral AI haluaa tarjota mallinsa saataville avoimen lähdekoodin järjestelmissä, ja yhtiö on kilpaillut muiden tekoälykehittäjien, kuten OpenAI:n ja Anthropicin, kanssa.

Yhtiö keräsi äskettäin 640 miljoonaa dollaria B-sarjan rahoituksesta ja arvioi sen arvoksi lähes 6 miljardia dollaria. Yritys on saanut investointeja myös teknologiajätteiltä, ​​kuten Microsoftilta ja IBM:ltä.

Johtopäätös: Suurten mallien suorituskykytaistelu saavuttaa uusia korkeuksia

Teollisuuden näkökulmasta Mistral AI:n uudet mallit korostavat tekoälytyökalujen muuttumista ammattimaisemmiksi. Tarjoamalla tehokkaita ja helppokäyttöisiä malleja, kuten Mistral 7B ja Codestral Mamba 7B, Mistral AI:sta on tulossa tärkeä toimija tekoälyn alalla innovatiivisten ja käytännöllisten sovellusten kehittäminen.

Nämä mallit korostavat myös avoimen lähdekoodin tekoälyn merkitystä, mikä rohkaisee yhteistyötä ja lisää läpinäkyvyyttä teknologiayhteisössä. Tarjoamalla tehokkaita tekoälytyökaluja laajemmalle yleisölle edistämme entisestään tekoälyn suuren mallikentän nopeaa iteraatiota ja kehitystä.

Lähde: VentureBeat