notizia

NVIDIA rilascia un nuovo modello di intelligenza artificiale da 8 miliardi di parametri: altamente accurato, efficiente e può essere implementato su workstation RTX

2024-08-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

IT House ha riferito il 23 agosto che NVIDIA ha pubblicato un post sul blog il 21 agosto, rilasciando il modello AI in linguaggio piccolo Mistral-NeMo-Minitron 8B, che presenta i vantaggi di un'elevata precisione ed elevata efficienza di calcolo e può essere utilizzato in dati accelerati da GPU center, cloud ed eseguire il modello sulla workstation.

NVIDIA e Mistral AI hanno rilasciato il mese scorso il modello open source Mistral NeMo 12B. Sulla base di questo, NVIDIA ha lanciato ancora una volta il modello più piccolo Mistral-NeMo-Minitron 8B, con un totale di 8 miliardi di parametri, che può essere eseguito su workstation dotate di NVIDIA. Schede grafiche RTX.

Nvidia ha dichiarato di aver ottenuto Mistral-NeMo-Minitron 8B attraverso la potatura della larghezza (width-pruning) Mistral NeMo 12B e la riqualificazione della luce attraverso la distillazione della conoscenza (distillazione della conoscenza). I risultati rilevanti sono stati pubblicati nel documento "Compact Language Models via Pruning and Knowledge". Distillazione" centrale.

La potatura riduce una rete neurale rimuovendo i pesi del modello che contribuiscono meno alla precisione. Durante il processo di "distillazione", il team ha riqualificato il modello ridotto su un piccolo set di dati per migliorare significativamente la precisione che era stata ridotta dal processo di potatura.

Per le sue dimensioni, il Mistral-NeMo-Minitron 8B è leader con un ampio margine su nove benchmark popolari per i modelli linguistici. Questi parametri di riferimento coprono una varietà di compiti, tra cui la comprensione del linguaggio, il ragionamento basato sul buon senso, il ragionamento matematico, il riepilogo, la codifica e la capacità di generare risposte autentiche. IT Home allega i relativi risultati dei test come segue: