"la programmation en tant que métier prend fin aujourd'hui", ce qui fait peur avec le nouveau modèle d'openai o1

"la programmation en tant que métier se termine aujourd'hui", ce qui fait peur à propos du nouveau modèle d'openai o1

2024-09-15

auteur : fanfan, éditeur : odette, photo titre de : ai generation

vous souvenez-vous encore du tremblement de terre d'openai auparavant ?

ce qui a déclenché le licenciement de sam altman, le départ du co-fondateur greg brockman et l'intensification des conflits internes au sein d'openai, c'est un projet appelé q* (prononcer q-star).

selon des personnes proches du dossier, le projet q* avait alors fait des progrès significatifs et pouvait déjà résoudre des problèmes mathématiques de base. contrairement aux calculatrices, qui ne peuvent résoudre qu'un nombre limité d'opérations, et à gpt-4, qui donne à chaque fois des réponses différentes à la même question,q* a peut-être déjà la capacité de généraliser, d’apprendre et de comprendre, ce qui constitue une étape clé vers l’agi.les chercheurs d'openai ont envoyé une lettre au conseil d'administration avertissant que la découverte majeure de q* pourrait menacer toute l'humanité, mais sam altman l'a caché.

openai a subi des changements internes bouleversants, et openai lui-même n'a jamais répondu directement à l'existence de q*.

aujourd'hui, openai a soudainement publié un nouveau modèle, qui est encore une version préliminaire. il s'agit du légendaire q*, plus tard nommé « strawberry », et maintenant openai o1-preview.

un nouveau modèle de raisonnement pour résoudre des problèmes complexes, qui n'est plus la même série que chatgpt｜openai

o, toujours "omini", o global, mais selon openai, ce modèle "représente un nouveau sommet de l'intelligence artificielle" et est très différent du grand modèle précédent en termes de méthodes de travail, donc un nouveau modèle peut être établi séparément. série , en comptant à partir de 1 (gpt5 : je suis vieux !).

quant à savoir si ce modèle « menacera l'humanité » comme le jugent ilya sutskever et d'autres anciens scientifiques rebelles d'openai, poussant l'humanité dans l'ère de l'agi (intelligence générale artificielle) sans contraintes morales parfaites, vous pouvez lire l'article. ensuite, jugez par vous-même.

o1, surpasse tout

le premier est le lien de notation familier.

chaque génération de grands modèles sort et atteint de nouveaux sommets sans précédent, mais cette fois, o1 est fondamentalement différent.

la plupart des grands modèles actuellement populaires se présentent sous la forme de chatbots, dont les cheminements de pensée sont difficiles à expliquer, et leur direction de développement est multimodale (peut parler, voir et écouter), et deviennent de plus en plus humains en termes de ton. et les réactions. o1 est différent d'eux.

tout d’abord, son objectif n’est pas d’aller de plus en plus vite, ni même d’aller de plus en plus lentement.

noam brown, scientifique d'openai, a déclaré qu'actuellement, o1 peut donner des réponses en quelques secondes, mais qu'à l'avenir, il devra être capable de réfléchir pendant des heures, des jours, voire des semaines. ensuite, une photo a été jointe. o1 a diagnostiqué un cas après plus de dix secondes de réflexion. ce que noam brown voulait dire,un temps d'inférence long signifie que le modèle peut construire des chaînes de réflexion plus longues et mener une réflexion plus approfondie.

deuxièmement, o1 brise le talon d'achille des grands modèles de langage précédents, les mathématiques.

l'aime, l'american mathematics invitational examination, est plus simple que l'olympiade et bien plus difficile que le sat. il est généralement utilisé pour sélectionner les meilleurs lycéens en mathématiques aux états-unis. lorsqu'on a demandé à gpt4-o de rédiger les questions du concours sur invitation, il n'a marqué que 12 points, mais o1 a répondu aux questions en une seule fois et a marqué 74 points. si vous échantillonnez 1 000 fois puis réorganisez les 1 000 échantillons avec la fonction de notation (cela reflétera mieux le niveau attendu du modèle), o1 a obtenu 93 points et peut figurer parmi les 500 meilleurs aux états-unis et peut être présélectionné pour l'american olympiade mathématique.

en comparant les performances de o1 et gpt-4o, les progrès mathématiques sont très importants｜openai

let o1 écrit des questions pour l'olympiade internationale d'informatique (ioi) 2024. il a marqué 213 points en 10 heures, chaque question pouvant être soumise jusqu'à 50 fois, se classant parmi les 49 % des meilleurs joueurs humains.si le nombre de candidatures augmente à 10 000, o1 peut marquer 362,14 points, obtenir la médaille d'or de l'ioi et être recommandé à l'université tsinghua.

dans le test actuel, une version affinée de o1 a été utilisée, pas la version prospective que nous pouvons utiliser openai |

de plus, de nombreux tests ne sont pas disponibles. par exemple, au gpqa (un test d’intelligence qui combine physique, chimie et biologie), o1 a surpassé les doctorats dans des domaines connexes sur certaines questions.

en bref,l'involution dans un domaine déjà fort n'est plus depuis longtemps le but de o1. il s'agit de réaliser des percées dans la logique complexe pour lesquelles les grands modèles de langage ne sont pas bons.

un pas en arrière, deux pas en avant

comme mentionné ci-dessus, la vitesse de réaction de o1 a ralenti.

il faut plus de temps pour réfléchir avant de réagir, puis affine le processus de réflexion, essaie différentes stratégies et apprend de ses erreurs. c'est effrayant.

de plus, o1 n'est plus un modèle multimodal. openai a passé deux ans à rendre le grand modèle capable de voir et d'entendre. maintenant, il est revenu à sa nature d'origine. o1 ne peut accepter que la saisie de caractères.

plus lent et monotone, pour o1,c’est un pas en arrière et deux pas en avant. les personnes qui ont déjà utilisé o1 disent que o1 est le modèle le plus intelligent qu’ils aient jamais utilisé, et les conversations avec lui ont dépassé les petits combats précédents.

dans un test, l'utilisateur a posé une question paradoxale : "combien de mots y a-t-il dans la réponse à cette question ?"

o1 a réfléchi pendant dix secondes et a montré son processus de réflexion. tout d'abord, il a pensé qu'il s'agissait d'un paradoxe autoréférentiel, ou d'une question récursive. lorsque la réponse n'est pas déterminée, le nombre de mots dans la réponse ne peut pas être déterminé."éviter les expressions inutiles est important pour des réponses claires et concises". l'étape suivante consiste à compter les mots, où les nombres apparaissant dans la phrase doivent correspondre au nombre de mots dans la phrase. ensuite, il a répertorié de nombreuses phrases et a trouvé l'option de correspondance la plus appropriée. il a constaté que "cela a cinq mots" contient cinq mots, donc après avoir modifié la structure de la phrase en une réponse complète, cinq doit être remplacé par sept.

alors il répondit : « il y a sept mots dans la réponse. »

ce processus de raisonnement n'est pas très différent de mon processus de raisonnement｜x

dans un autre exemple, o1 a mis 5,6 secondes et 631 jetons pour répondre à la question simple « combien y a-t-il de r dans la fraise ?

de l'exemple ci-dessus, on peut voir quela méthode de travail de o1 est fondamentalement différente de chatgpt.désormais, o1 a ajouté des jetons de raisonnement, qui diviseront une question en plusieurs étapes, y réfléchiront séparément, puis supprimeront les jetons de raisonnement pour générer des réponses.

la figure ci-dessous montre comment fonctionne la chaîne d'idées, ce qui explique également pourquoi la vitesse de réponse de o1 est devenue plus lente.

lorsque vous utilisez o1, vous pouvez aussi bien utiliser des problèmes de logique classiques et des problèmes mathématiques pour tester ses capacités.

peut-être que lorsqu'on répond à des questions simples, la différence entre effectuer ou non plusieurs cycles de raisonnement n'est pas évidente, mais s'il est utilisé pour résoudre des problèmes complexes d'écriture de code, de problèmes mathématiques et de sciences, ce type de capacité de réflexion est essentiel.

openai a déclaré dans l'article que désormais, le personnel médical peut utiliser o1 pour annoter les données de séquençage cellulaire, les physiciens peuvent utiliser o1 pour générer les formules mathématiques complexes requises pour l'optique quantique, et les développeurs dans divers domaines peuvent utiliser o1 pour construire et effectuer un travail en plusieurs étapes. . processus.

de plus,c’est le prototype d’un mode de pensée et la première forme de sagesse.

nouveaux modèles, nouvelles habitudes

étant donné que le fonctionnement de o1 est différent de chatgpt, les tutoriels que j'ai vus auparavant et qui vous apprennent à rédiger des invites ne sont plus applicables - dans la situation actuelle, trop de descriptions ne consommeront qu'une grande quantité de jetons, mais ne les obtiendront pas nécessairement. .de meilleurs résultats.

pour que cela soit clair pour tous les utilisateurs, openai a rédigé de nouvelles directives en matière de jetons. dans le guide, openai explique que les meilleures invites dans o1 sont directes et concises. demander au modèle de le faire étape par étape ou donner plusieurs mots d'invite dispersés peut être contre-productif. voici quelques recommandations officielles :

les invites doivent être simples et directes. les modèles réagissent mieux aux instructions brèves et claires qui ne nécessitent pas trop de conseils.

évitez les chaînes de pensées dans les invites. o1 fait son propre raisonnement interne, il est donc inutile de le guider étape par étape et d'expliquer votre cheminement de réflexion.

il est préférable d'utiliser des délimiteurs pour améliorer la clarté. utilisez des délimiteurs tels que "", <> et § pour distinguer clairement les différentes parties des invites afin d'aider le modèle à traiter les problèmes par lots.

limiter la récupération de contexte supplémentaire dans la génération améliorée. fournissez uniquement les informations les plus pertinentes pour éviter de trop réfléchir au modèle.

quand j’ai vu le troisième article, je me suis senti un peu familier avec ce format. les futurs programmeurs utiliseront probablement la programmation en langage naturel. les instructions de base sont toujours les mêmes, mais elles sont devenues vernaculaires. conformément aux dernières directives, une bonne invite ressemblerait à ceci :

ou quelque chose comme ça :

§ hôte § écrivain § propriétaire de bar § peintre à l'huile § travailleur du cuir § orfèvre § chanteur § artiste du tambourin § routard § joue gauche dorée § chevalier français § disciple zen §

laissez le modèle faire le reste.

donnez-moi une minute pour créer un serpent en 3d

il y a une raison pour utiliser le serpent comme exemple. moins d'un jour après la sortie de o1, les utilisateurs ont fait de nombreuses tentatives, notamment 3d snake.

@ammaar reshi sur x a utilisé des invites extrêmement simples pour écrire un serpent 3d en seulement une minute, et o1 lui a également appris à utiliser le code.

avez-vous appris à écrire des invites ? ｜@ammaar reshi

bien que l'effet soit un peu brut, personne ne peut dire que ce n'est pas un serpent gourmand.

et c'est plutôt amusant｜@ammaar reshi

l'internaute @james wade a utilisé o1 pour créer une application d'analyse de données pouvant afficher une brève description et un exemple de chaque distribution. cela n'a pris que 15 minutes, temps de déploiement compris. il a dit : je n'avais jamais pensé à faire quelque chose comme ça auparavant. c'était trop gênant auparavant.

l'effet est comme le montre l'image｜@james wade

un autre ingénieur full-stack @dallas lones, qui travaille depuis 16 ans, a déclaré avec émotion après avoir créé une application de développement full-stack react native en quelques minutes :je n'ai pas démarré mon entreprise le plus tôt possible, mais maintenant ce métier est devenu l'une des larmes de l'époque.il a dit,"la programmation en tant que profession prend officiellement fin aujourd'hui."

il y a plus de gens qui défient les limites du o1, et certains y jouent déjà"voyons quelle question est la plus difficile et peut faire réfléchir o1 le plus longtemps."jeu.

actuellement, o1 est d'abord ouvert aux utilisateurs de chatgpt plus et de team, tandis que l'accès à l'api sera d'abord ouvert aux utilisateurs de niveau 5 qui dépensent plus de 1 000 $ sur l'api openai. dans la prochaine étape, openai ouvrira progressivement la version discrète d'o1-mini aux utilisateurs gratuits.

sera-ce le coucher du soleil de l’humanité ?

nouvelles

"la programmation en tant que métier se termine aujourd'hui", ce qui fait peur à propos du nouveau modèle d'openai o1

introduction

mes coordonnées