notizia

Llama 3.1, "European OpenAI" rilascia il nuovo modello open source Large 2 |

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Autore |. Wang Yixin

Redattore|Anita Tang

Meno di un giorno dopo che Meta ha rilasciato l'ultimo modello di grandi dimensioni open source Llama 3.1, la startup francese di intelligenza artificiale Mistral è arrivata a dare il via: il 24 luglio Mistral ha rilasciato il suo nuovo modello di punta Large 2.

Mistral AI è una start-up francese fondata appena un anno fa. È anche l'azienda di intelligenza artificiale più ben finanziata e competitiva in Europa. I suoi membri principali provengono dalle migliori istituzioni di intelligenza artificiale come Google DeepMind come Lianchuang Mensch Autori di grandi documenti modello come Chinchilla hanno proposto tecnologie fondamentali tra cui le leggi di scala.

A sole 4 settimane dalla sua fondazione nel giugno 2023, Mistral AI ha ricevuto un finanziamento di 105 milioni di euro con un team di 6 persone. L'azienda si concentra sulla ricerca e sullo sviluppo di grandi modelli open source ed è stata elogiata dal presidente francese Macron come "un modello per una nuova generazione di start-up europee per competere con i giganti tecnologici americani".

Nel dicembre 2023, Mistral ha rilasciato un modello di grandi dimensioni open source chiamato Mistral 8x7B, che ha 56 miliardi di parametri, la cui efficienza e prestazioni sono paragonabili a LLaMA-65B, ed è diventato un successo immediato nel settore dei modelli di grandi dimensioni. Inoltre, l'azienda ha anche confrontato ChatGPT e lanciato un assistente di conversazione multilingue chiamato Le Chat (il sito ufficiale mostra che è ancora in fase di test e richiede registrazione e richiesta per le qualifiche di test) per mostrare le ultime capacità tecniche dell'azienda.

Mistral ha affermato che Large 2 ha superato Llama 3.1 405B nella generazione di codice, nelle capacità matematiche e di ragionamento utilizzando meno di un terzo dei parametri di Llama 3.1 405B, ovvero 123 miliardi di parametri, e ha sovraperformato altri modelli di intelligenza artificiale leader nel generare risposte troppe descrizioni lunghe. Ciò significa che Large 2 presenta maggiori vantaggi in termini di costi e gli sviluppatori possono eseguirlo localmente più velocemente.

Come Llama 3.1 di Meta, Large 2 non ha capacità multimodali, ma in termini di accuratezza e affidabilità delle risposte ai dialoghi, può essere paragonato a "piccolo è più grande" di Llama. Mistral ha affermato che il problema delle allucinazioni del modello è stato uno dei focus durante il processo di formazione di Large 2. Inoltre, Large 2 migliora anche le attività di comando e di conversazione, gestendo istruzioni precise e conversazioni lunghe a più turni.

Large 2 ha una lunghezza del contesto di 128k e può ricevere approssimativamente tanti caratteri quanto un libro di 300 pagine in una singola conversazione. Inoltre, Large 2 supporta più lingue e può gestire inglese, francese, tedesco, spagnolo, italiano, portoghese, arabo, hindi, russo, cinese, giapponese e coreano, oltre a 80 lingue di codice.


Fonte: sito ufficiale Mistral

Va sottolineato che il modello di Mistral non è un modello open source nel senso tradizionale e l'uso commerciale richiede un pagamento.

Attualmente, Large 2 è entrato nelle piattaforme di Google, Amazon, Azure e IBM affinché gli utenti possano utilizzarlo. Gli utenti possono anche sperimentarlo tramite "mistral-large-2407" su La Plateforme di Mistral (una piattaforma completa che semplifica lo sviluppo di applicazioni AI e fornisce modelli pre-addestrati, strumenti di elaborazione dati e interfacce API), o testarlo gratuitamente su Le Chat.

Mistral ha completato il finanziamento di serie B nel giugno di quest'anno, raccogliendo un totale di 640 milioni di dollari e una valutazione di 6 miliardi di dollari. Questo round di finanziamento è stato guidato da General Catalyst e gli investitori includono anche Lightspeed Venture Partners, Andreessen Horowitz, Nvidia, Samsung Ventures e IBM.

Mistral AI conta attualmente circa 60 dipendenti, di cui 45 in Francia, 10 negli Stati Uniti e cinque nel Regno Unito. Secondo il Financial Times, circa tre quarti dei suoi dipendenti lavorano nello sviluppo e nella ricerca dei prodotti.