uutiset

Llama 3.1, "European OpenAI" julkaisee uuden avoimen lähdekoodin mallin Large 2 |

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Kirjoittaja |. Wang Yixin

Toimittaja | Anita Tang

Alle päivä sen jälkeen, kun Meta julkaisi uusimman avoimen lähdekoodin suuren mallin Llama 3.1:n, ranskalainen tekoälystartup Mistral aloitti sen – 24. heinäkuuta Mistral julkaisi uuden lippulaivamallinsa Large 2:n.

Mistral AI on äskettäin perustettu ranskalainen tekoälyyritys. Se on myös tähän mennessä parhaiten rahoitettu ja kilpailukykyisin tekoälyn toimija Euroopassa kuten Lianchuang Mensch. Suurten mallipaperien, kuten Chinchilla, kirjoittajat ovat ehdottaneet ydinteknologioita, kuten skaalauslakeja.

Vain 4 viikkoa perustamisensa jälkeen kesäkuussa 2023 Mistral AI sai 105 miljoonaa euroa rahoitusta kuuden hengen tiimin kanssa. Yritys keskittyy avoimen lähdekoodin suurten mallien tutkimukseen ja kehittämiseen, ja Ranskan presidentti Macron on kehunut sitä "malliksi uuden sukupolven eurooppalaisille start-upeille kilpailemaan amerikkalaisten teknologiajättien kanssa".

Joulukuussa 2023 Mistral julkaisi avoimen lähdekoodin suuren mallin nimeltä Mistral 8x7B, jonka tehokkuus ja suorituskyky ovat verrattavissa LLaMA-65B:hen, ja siitä tuli välitön hitti suurella malliteollisuudella. Lisäksi yritys vertaili ChatGPT:tä ja käynnisti monikielisen keskusteluapulaisen Le Chat (virallisilla verkkosivuilla näkyy, että se on edelleen testausvaiheessa ja vaatii rekisteröitymistä ja testauspätevyyden hakemista) esitelläkseen yrityksen uusimpia teknisiä ominaisuuksia.

Mistral sanoi, että Large 2 ylitti Llama 3.1 405B:n koodin luomisessa, matematiikassa ja päättelykyvyssä käyttämällä alle kolmanneksen Llama 3.1 405B:n parametreista eli 123 miljardia parametria, ja suoritti muita johtavia tekoälymalleja tiiviimpien vastausten luomisessa liian pitkiä kuvauksia. Tämä tarkoittaa, että Large 2:lla on enemmän etuja kustannusten suhteen, ja kehittäjät voivat käyttää sitä paikallisesti nopeammin.

Kuten Meta's Llama 3.1, Large 2:ssa ei ole multimodaalisia ominaisuuksia, mutta dialogivastausten tarkkuuden ja luotettavuuden suhteen sitä voidaan verrata Llaman "pieni on isompi" -malliin. Mistral sanoi, että mallin hallusinaatio-ongelma oli yksi painopisteistä Large 2:n koulutusprosessissa. Lisäksi Large 2 parantaa myös komentojen seuraamista ja keskustelutehtäviä, tarkkojen ohjeiden käsittelyä ja pitkiä, monikäännöksiä.

Large 2:n kontekstipituus on 128 kt, ja se voi vastaanottaa suunnilleen yhtä monta merkkiä kuin 300-sivuinen kirja yhdessä keskustelussa. Lisäksi Large 2 tukee useita kieliä ja pystyy käsittelemään englantia, ranskaa, saksaa, espanjaa, italiaa, portugalia, arabiaa, hindiä, venäjää, kiinaa, japania ja koreaa sekä 80 koodikieltä.


Lähde: Mistralin virallinen verkkosivusto

On syytä huomauttaa, että Mistralin malli ei ole avoimen lähdekoodin malli perinteisessä mielessä ja kaupallinen käyttö vaatii maksua.

Tällä hetkellä Large 2 on tullut Googlen, Amazonin, Azuren ja IBM:n alustoihin käyttäjien käyttöön. Käyttäjät voivat myös kokea sen "mistral-large-2407":n avulla Mistralin La Plateformella (kattava alusta, joka yksinkertaistaa tekoälysovellusten kehitystä ja tarjoaa valmiiksi koulutettuja malleja, tietojenkäsittelytyökaluja ja API-liittymiä), tai testata sitä ilmaiseksi Le Chatissa.

Mistral sai päätökseen B-sarjan rahoituksen tämän vuoden kesäkuussa ja keräsi yhteensä 640 miljoonaa dollaria ja arvostuksen 6 miljardia dollaria. Tätä rahoituskierrosta johti General Catalyst, ja sijoittajia ovat myös Lightspeed Venture Partners, Andreessen Horowitz, Nvidia, Samsung Ventures ja IBM.

Mistral AI työllistää tällä hetkellä noin 60 työntekijää, joista 45 on Ranskassa, 10 Yhdysvalloissa ja viisi Isossa-Britanniassa. Financial Timesin mukaan noin kolme neljäsosaa sen työntekijöistä työskentelee tuotekehityksen ja tutkimuksen parissa.