comment o1 « raisonne » comme un humain ? questions et réponses de l'équipe de recherche openai : révélation des détails du modèle, des plans futurs et des conseils pour maximiser les performances o1

2024-09-15

le 13 septembre, openai a annoncé les débuts officiels de la série de modèles o1, marquant une nouvelle ère dans le domaine de l'ia et inaugurant l'ère des grands modèles capables d'effectuer des tâches de raisonnement complexes à usage général. après la publication du modèle, l'équipe de recherche openai a organisé un événement ama (ask me anything) sur la plateforme sociale x, révélant en profondeur de nombreux détails du modèle de la série o1.

source de l'image : plateforme sociale x

assistant ia de niveau « alien »

openai a déclaré que la série o1 comprend deux versions : o1-preview, qui est une première itération du modèle complet, et la o1-mini, plus rapide et légère. contrairement aux modèles précédents,o1 est capable de générer de longues chaînes de processus de pensée cachés avant de donner la réponse finale, démontrant ainsi des capacités de raisonnement semblables à celles des humains.。les chercheurs comparent o1 à un « extraterrestre » doté de super pouvoirs。

source de l'image : plateforme sociale x

au cours du processus de raisonnement,o1 utilise l'apprentissage par renforcement pour atteindre des performances de « raisonnement ». bien qu'il ne soit actuellement pas prévu d'afficher ces jetons de chaîne de pensée aux utilisateurs de l'api ou de chatgpt, les chercheurs ont révélé que les instructions intégrées dans les invites peuvent influencer la façon dont o1 pense. en revanche,gpt-4o ne peut pas atteindre le niveau de performance de la chaîne de pensée de o1 via des invites。

source de l'image : plateforme sociale x

le modèle de la série o1 utilise le même tokenizer que gpt-4o et reste cohérent sur le jeton d'entrée. mais,o1 est capable de gérer des tâches plus longues et plus ouvertes, réduisant ainsi le besoin de segmentation des entrées. à l'avenir, o1 prendra également en charge des fenêtres de contexte d'entrée plus grandes。

o1 a également démontré des capacités impressionnantes de raisonnement et de généralisation, telles que déchiffrer des codes, réfléchir à des questions philosophiques et passer des auto-tests pour évaluer ses capacités.

l'équipe de recherche a également révélé queles performances de o1-preview sur certaines tâches d'écriture personnalisées sont équivalentes ou légèrement supérieures à celles de gpt-4o.

la version mini est-elle encore plus puissante ?

par rapport à o1-preview, o1-mini est optimisé en taille et en vitesse.

source de l'image : plateforme sociale x

même s'il peut y avoir des limites dans certains domaines comme la connaissance du monde,o1-mini démontre ses avantages dans les tâches stem (science, technologie, ingénierie, mathématiques) et les tâches liées au code. aussi,o1-mini peut explorer plus de chaînes de pensée que o1-preview。

source de l'image : plateforme sociale x

o1 prendra bientôt en charge l'intégration d'outils et la compréhension multimodale

bien que o1-preview n'utilise actuellement pas d'outils,openai prévoit d'ajouter des fonctionnalités telles que les appels de fonctions, les interpréteurs de code et la navigation web. la prise en charge des outils, la sortie structurée et les invites système seront également introduites dans les futures mises à jour。

source de l'image : plateforme sociale x

de plus, l'équipe de développeurs openai a déclaré :à l’avenir, les utilisateurs pourront contrôler le temps de réflexion et les limites des jetons d’o1., et a promis de promouvoir activement la mise en œuvre de cette fonction.

openai promeut également activement la prise en charge du streaming et les commentaires sur la progression de l'inférence dans l'api.. aussi,o1 dispose déjà de capacités multimodales intégrées,il devrait atteindre le niveau de l'état de l'art sur les tâches de compréhension multimodale (mmlu).

source de l'image : plateforme sociale x

o1-mini a une limite de 50 invites par semaine

o1-mini est actuellement ouvert aux utilisateurs de chatgpt plus, mais il y a une limite de 50 invites par semaine.tous les pourboires comptent pour le même quota. openai promet,les niveaux d'accès à l'api et les limites de débit seront progressivement augmentés à l'avenir, et des remises sur les prix de volume seront accordées une fois les restrictions assouplies.。

le prix du modèle o1 devrait suivre la tendance des baisses de prix tous les 1 à 2 ans.. aussi,une assistance personnalisée au réglage fin figure sur la feuille de route du produit, mais le calendrier de sortie spécifique n'est pas encore clair.

source de l'image : plateforme sociale x

secrets pour maximiser les performances o1

o1-mini est actuellement formé à l'aide de données datant d'octobre 2023, et les futures itérations utiliseront des ensembles de données plus récents pour élargir sa connaissance du monde.

afin de tirer pleinement parti des avantages du raisonnement de o1,l'équipe recommande aux utilisateurs de fournir des exemples informatifs et concrets couvrant les cas extrêmes lors de la conception des invites, et de spécifier clairement les étapes et le style de raisonnement requis.. mais attention,un contexte non pertinent peut interférer avec le processus d'inférence du modèle。

actualités économiques quotidiennes informations auto-publiques complètes

l'actualité économique quotidienne

rapport/commentaires

nouvelles

comment o1 « raisonne » comme un humain ? questions et réponses de l'équipe de recherche openai : révélation des détails du modèle, des plans futurs et des conseils pour maximiser les performances o1

assistant ia de niveau « alien »

la version mini est-elle encore plus puissante ?

o1 prendra bientôt en charge l'intégration d'outils et la compréhension multimodale

o1-mini a une limite de 50 invites par semaine

secrets pour maximiser les performances o1

introduction

mes coordonnées