nouvelles

"La fonction la plus puissante et la plus économique" ! OpenAI lance GPT-4o mini pour participer au concours des petits modèles

2024-07-19

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

OpenAI a lancé jeudi "GPT-4o mini", entrant dans la compétition des modèles d'IA "petits mais raffinés". Il a qualifié ce nouveau modèle de "modèle le plus puissant et le moins coûteux" et prévoyait d'intégrer des images, des vidéos et de l'audio. à l'avenir dans ce modèle.

Plus de 60 % moins cher que GPT-3.5 Turbo et les performances de chat sont meilleures que celles des produits concurrents

La société a déclaré que GPT-4o mini est disponible pour les utilisateurs gratuits de ChatGPT, les abonnés ChatGPT Plus et Teams à partir de jeudi, et sera disponible pour les utilisateurs professionnels de ChatGPT la semaine prochaine. GPT-4o mini remplacera l'ancien modèle GPT-3.5 Turbo dans ChatGPT. OpenAI a déclaré que GPT-4o mini coûte 15 cents par million de jetons d'entrée et 60 cents par million de jetons de sortie, ce qui le rend plus de 60 % moins cher que GPT-3.5 Turbo.

La société a également déclaré que le nouveau modèle surpasse actuellement le modèle GPT-4 en termes de préférences de chat et a obtenu un score de 82 % au test massif de compréhension du langage multitâche (MMLU). Selon les médias, MMLU est une référence en matière d'intelligence textuelle et de raisonnement utilisée pour évaluer les capacités du modèle de langage. Un score MMLU plus élevé indique une meilleure compréhension et une meilleure utilisation de la langue dans divers domaines, améliorant ainsi son application dans le monde réel.

Selon les données d'OpenAI, le mini modèle GPT-4o a obtenu un score de 82 %, ce qui est plus élevé que les deux autres concurrents à bas prix, le Gemini Flash de Google a obtenu un score de 77,9 % et Claude Haiku d'Anthropic un score de 73,8 %.

Parmi les modèles plus grands, le GPT-3.5 a obtenu un score de 70 % dans ce test, le GPT-4o un score de 88,7 % et Google affirme que son Gemini Ultra a atteint son score le plus élevé jamais enregistré, soit 90 %.

L’analyse suggère que les modèles de langage plus petits nécessitent moins de puissance de calcul pour fonctionner, ce qui en fait une option plus abordable pour les entreprises disposant de ressources limitées pour déployer l’IA générative.

De plus, ce nouveau modèle léger prendra également en charge les fonctionnalités textuelles et visuelles dans l'API, et OpenAI indique qu'il gérera bientôt toutes les entrées et sorties multimodales telles que la vidéo et l'audio. Grâce à ces capacités, celui-ci pourrait potentiellement agir comme un assistant virtuel plus puissant, capable de comprendre votre itinéraire de voyage et de faire des recommandations. Cependant, ce modèle ne peut actuellement être utilisé principalement que pour des tâches simples.

La concurrence pour les modèles d’IA « petits mais raffinés » est féroce et OpenAI entre enfin dans le jeu

Selon les médias, la valorisation d'OpenAI, soutenue par Microsoft, a dépassé les 80 milliards de dollars. Bien qu'elle occupe toujours une position de leader sur le marché de l'IA générative, l'entreprise est confrontée à une pression concurrentielle croissante. OpenAI doit également trouver des moyens de gagner de l'argent, car l'entreprise dépense beaucoup d'argent en processeurs et en infrastructure pour construire et former ses modèles.

Cependant, de nombreuses entreprises ne peuvent pas se permettre de modèles plus grands et plus chers, de sorte que les modèles légers et moins chers peuvent être plus populaires. Jusque-là, de nombreux développeurs choisiraient Claude 3 Haiku ou Gemini 1.5 Flash plutôt que de payer les coûts de calcul élevés nécessaires pour exécuter les modèles les plus puissants. Par exemple, un modèle plus petit peut être mieux adapté à l’automatisation de tâches de base volumineuses, tandis qu’un modèle plus grand peut gérer des tâches plus complexes. Certains développeurs souhaiteront peut-être utiliser les deux modèles dans une seule application.

Olivier Godement, responsable du produit API d'OpenAI, a expliqué dans une interview aux médias pourquoi la société n'avait pas réussi à lancer des modèles d'IA « petits et raffinés » plus tôt. Il a déclaré que c'était purement une question de « priorité » car OpenAI se concentrait sur la création de modèles d'IA plus grands et meilleurs. les modèles, tels que GPT-4, nécessitent des ressources humaines et informatiques importantes. Au fil du temps, OpenAI a remarqué que les développeurs étaient de plus en plus désireux d'utiliser des modèles plus petits. La société a donc décidé que le moment était venu d'investir des ressources dans le développement de GPT-4o Mini.

"Notre mission est de créer la technologie la plus avancée et de créer les applications les plus puissantes et les plus utiles, et nous espérons certainement continuer à créer des modèles de pointe et à promouvoir le progrès technologique", a déclaré Olivier Godement, responsable du produit API d'OpenAI, dans une interview avec les média. "Mais nous voulons aussi avoir le meilleur petit modèle et je pense qu'il sera très populaire."

« Je pense que GPT-4o Mini incarne véritablement la mission d'OpenAI consistant à rendre l'IA plus accessible. Si nous voulons que l'IA profite à tous les coins du monde, à chaque industrie et à chaque application, nous devons rendre les produits de la plateforme API d'OpenAI plus abordables, Olivier. Godement a déclaré aux médias.

GPT-4o mini aide les employés à se concentrer

Godement a déclaré que certains développeurs avaient testé le modèle au cours de la semaine dernière.

OpenAI a demandé à la startup fintech Ramp de tester le modèle, en utilisant GPT-4o Mini pour créer un outil qui extrait les données de dépenses des reçus. Ainsi, les utilisateurs peuvent télécharger des photos de leurs reçus et le modèle organisera les données pour eux. Le client de messagerie Superhuman a également testé GPT-4o Mini et l'a utilisé pour créer une fonctionnalité qui suggère automatiquement des réponses aux e-mails.

Dans un premier temps, GPT-4o mini sera capable de traiter et de générer du texte et des images. Une fois la version finale terminée, OpenAI affirme qu'elle sera capable de gérer d'autres types de contenu.

OpenAI a également déclaré que GPT-4o mini est le premier modèle d'IA de l'entreprise à utiliser sa nouvelle « hiérarchie d'instructions » de politique de sécurité. Le but de cette approche est de faire en sorte que les systèmes d'IA donnent la priorité à certaines instructions - comme celles des entreprises - afin de rendre plus difficile pour les utilisateurs de faire faire à l'outil quelque chose qu'il n'est pas censé faire.

Analysis estime que le mini modèle GPT-4o fait partie de l'engagement d'OpenAI en faveur de la « multimodalité », c'est-à-dire fournir une large gamme de médias générés par l'IA (tels que du texte, des images, de l'audio et de la vidéo) dans un seul outil : ChatGPT.

L'année dernière, Brad Lightcap, COO d'OpenAI, a déclaré aux médias :

"Le monde est multimodal. Si vous réfléchissez à la manière dont nous, les humains, traitons et interagissons avec le monde, nous voyons des choses, entendons des choses, parlons - le monde n'est pas seulement du texte. Donc, pour nous, il n'y a que du texte et du code comme Une seule modalité, une seule interface, semble toujours incomplète, car la puissance de ces modèles et ce qu’ils peuvent faire est bien plus.