openai devday « pas de modèles, pas de nouvelles fonctionnalités », que peuvent attendre les développeurs

openai devday « pas de modèles, pas de nouvelles fonctionnalités », à quoi d'autre les développeurs peuvent-ils s'attendre ?

2024-10-01

image d'en-tête générée par doubao
mots-clés : interaction avec les développeurs, appel api, grand modèle d'ia, cyberpunk, détails haute définition

l'année dernière, openai a organisé une conférence des développeurs (devday 2023) qui a fait sensation dans l'industrie à san francisco, en lançant une série de nouveaux produits et outils, notamment gpt-4 turbo qui prend en charge le contexte 128k, la réduction du prix de l'api, la nouvelle api assistants, et gpt-4 turbo pour les fonctionnalités visuelles, l'api dall·e 3 et un modèle json grandement amélioré, ainsi que les malheureux gpt et la plate-forme de type app store, gpt store.

le pdg sam altman a déclaré avec confiance : « nous espérons que vous pourrez venir l'année prochaine. comparé aux nouveaux résultats que nous construisons soigneusement, ce que nous avons publié aujourd'hui semblera très dépassé », augmentant à nouveau les attentes.

après avoir connu une nouvelle vague de démissions d’équipes de direction, l’événement annuel devday 2024 d’openai approche, et tout le monde a une question en tête : que va-t-il se passer ensuite ?

cependant, l’openai devday de cette année a discrètement changé de ton. premièrement, il a été annoncé que le format de la conférence serait ajusté, passant d'un événement à grande échelle à une série de sessions interactives pour les développeurs de type roadshow.

ce qui est encore plus surprenant, c'est que, selon les spoilers officiels, openai ne publiera pas son modèle phare de nouvelle génération lors du devday, mais se concentrera sur les mises à jour des api et des services de développement.

en bref : le modèle nouvelle génération est encore en train de rôtir au four, alors n’en parlons pas du tout.

devday n'est plus une conférence modèle, cette fois c'est vraiment une conférence "développeurs".

sans gpt-5 devday, à quoi d'autre les développeurs s'attendent-ils ?

bien qu'openai ait annoncé qu'elle ne lancerait pas de nouvelle génération de modèles phares lors du devday cette année, l'industrie a encore de nombreuses attentes pour cette conférence des développeurs. selon les spéculations, openai pourrait se concentrer sur le lancement de nouvelles capacités d'api telles que le raisonnement à long terme et l'appel de fonctions, tout en améliorant les capacités d'agent du modèle pour offrir aux développeurs plus d'autonomie et la possibilité d'intégration avec d'autres api.

l'api du mode vocal 4o est également très attendue

silicon star a également communiqué avec plusieurs développeurs pour comprendre leurs besoins réels en matière d'api. la multimodalité et les performances sont devenues le centre d'attention.

talkme est un produit toc d'apprentissage des langues destiné aux marchés étrangers, jia zijian, pdg, a déclaré à silicon star que les développeurs d'ia qui partent à l'étranger choisissent généralement l'api d'openai et qu'un petit nombre d'entre eux utilisent gemini et claude. la principale api utilisée par talkeme est openai, ainsi que l'assistance gemini.

"gpt-3.5 turbo a été pratiquement éliminé et tout le monde passera à 4o-mini ou 4o pour améliorer la logique métier. pour les produits tob saas plus complexes, vous pouvez envisager gpt-4, qui a des capacités plus puissantes et est relativement plus cher."

o1 est également actuellement à l'étude par talkme, mais en raison de son coût élevé, il est actuellement limité à la pré-recherche sur les fonctions expérimentales et ne peut pas être mis en production formelle d'applications toc.

"les capacités d'o1 sont en effet très fortes, mais d'un point de vue technique, utiliser o1 pour certains, 4o pour certains et 4omini pour certains peut essentiellement couvrir le scénario de développement."

concernant les attentes concernant l'api openai, jia zijian a déclaré qu'il y avait trois points principaux :

le premier est la faible latence.

la seconde concerne les capacités multimodales à faible latence. « une partie de nos capacités multimodales utilise actuellement 4o et certaines utilisent gemini. »

le troisième point est une sortie json plus stable. "la publication d'openai n'est pas encore aussi rigoureuse. elle est plus susceptible d'être dominée par les algorithmes des scientifiques. en conséquence, la sortie json d'openai n'est pas très stable. dans de nombreux scénarios, il est préférable d'écrire vos propres règles régulières. pour analyser le contenu du texte de sortie. dans cette dimension, google est pire qu'openai. si c'est bien fait, ce sera plus bénéfique pour les développeurs s'il y a une sortie json stable.

en termes de prix, « à l'exception de o1, les autres prix sont relativement bon marché ».

chen yang, directeur des opérations du moteur cocos et directeur de lao cai miao, a mené une analyse du point de vue des produits nationaux d'ia. il a déclaré à silicon stars qu'en termes de capacités actuelles et de vitesse de réponse, openai est toujours le plus puissant. d'un autre côté, les développeurs nationaux envisagent davantage de conformité et de retour sur investissement, tandis que les modèles nationaux qwen, doubao, minimax, tels que wenxin, rattrapent également leur retard. et le rapport prix/performance de certains produits après remises n'est pas plus faible qu'openai.

il a déclaré : « la demande future doit être multimodale. les requêtes http post traditionnelles seront progressivement éliminées. doubao national a pris les devants dans l'utilisation de webrtc et openai webrtc est sur le point d'être ouvert. par conséquent, en plus de la qualité du modèle , le futur marché doit considérer l'effet global, la combinaison d'asr, tts, webrtc, etc., de ce point de vue, les produits nationaux ont de plus grands avantages en matière d'intégration, et il y a une chance d'obtenir un avantage dans la guerre des prix.

yuhe technology cible les applications de scénarios d'entreprise. le partenaire technique chi guangyao espère que la mise à jour de l'api openai pourra apporter des améliorations sous deux aspects : des capacités d'ingénierie intégrées pour réduire ou détecter les hallucinations pour o1, fournir des options d'utilisation plus flexibles, permettant aux utilisateurs de spécifier ; si utiliser des capacités de raisonnement complexes dans cette requête.

agi peut attendre, mais si vous manquez d’argent, vous ne pouvez pas attendre.

le changement d’orientation de devday s’aligne sur la stratégie récente d’openai consistant à prendre des mesures plus progressives dans le développement de l’ia générative.

l'entreprise optimise actuellement ses modèles phares gpt-4o et gpt-4o mini, face au défi de garder une longueur d'avance sur la technologie dans la course à l'ia générative. selon certains benchmarks, openai semble avoir perdu son avance technologique absolue.

l'une des raisons est la difficulté d'obtenir des données de formation de haute qualité. selon les données d'originality.ai, plus de 35 % des 1 000 plus grands sites web au monde ont interdit le robot d'exploration d'openai.

une étude du data provenance project du mit a révélé qu'environ 25 % des données provenant de sources « de haute qualité » ont été interdites d'utilisation dans la formation de modèles d'ia.

pour relever ces défis en matière d'acquisition de données, openai a signé une série d'accords de licence importants avec des éditeurs et des courtiers de données.

un autre aspect de la pression vient du coût d'exploitation de l'entreprise. selon reuters, openai s'attend cette année à un chiffre d'affaires de 3,7 milliards de dollars et à une perte de 5 milliards de dollars, qui serviront principalement à payer les coûts des services d'exploitation et les salaires des employés. et le loyer des bureaux. il n’inclut pas d’autres dépenses importantes telles que les incitations à l’équité pour les employés.

afin de résoudre le problème de financement, openai promeut un nouveau cycle de financement. début septembre, des informations financières ont été publiées selon lesquelles openai pourrait recevoir un investissement de 6,5 milliards de dollars pour une valorisation de 150 milliards de dollars. selon des sources, cette valorisation dépend de la capacité d'openai à transformer sa structure d'entreprise en un modèle de profit similaire à ses concurrents anthropic et xai.

cependant, aux dernières nouvelles, apple a décidé de ne pas participer au dernier tour de table de 6,5 milliards de dollars. en outre, le départ du directeur de la technologie, du directeur de la recherche et du vice-président de la recherche la semaine dernière a également ajouté de l'incertitude à openai.

bien que sarah friar, directrice financière d'openai, ait révélé aux investisseurs le 27 septembre que ce tour de financement avait été sursouscrit et devrait se clôturer avant la fin du mois, les négociations de financement ne sont pas encore finalisées et les participants et les montants spécifiques peuvent encore changer. .

l’accent mis sur les api peut être lié à la pression financière à laquelle openai est confronté.

selon les rapports de recherche et les données associées publiés par futuresearch, le chiffre d'affaires annuel d'openai s'élève à 3,4 milliards de dollars américains, dont 76 % proviennent des utilisateurs payants de chatgpt (abonnements chatgpt plus, chatgpt enterprise et chatgpt team), et les services d'interface api contribuent à 15 % du chiffre d'affaires de l'entreprise. chiffre d'affaires, environ 510 millions de dollars américains.

le modèle de service basé sur les api a autrefois aidé des plateformes comme aws à se développer rapidement. alors que de plus en plus d'entreprises utilisent les api d'amazon pour développer de nouveaux produits ou services, générant ainsi des effets de réseau, la valeur de son écosystème continue de croître.

bien que les revenus directs actuels d’openai provenant des api ne soient pas élevés, dans le contexte du ralentissement de chatgpt et du fait qu’openai prend des mesures plus progressives pour développer l’ia générative, il peut être possible de fournir de meilleures api pour l’entreprise. l’entreprise ouvre de nouvelles opportunités de marché et favorise la collaboration avec d’autres entreprises. .

sans gpt-5, les dirigeants sont partis et se sont transformés en une entreprise à but lucratif. cette série d'événements indique que la commercialisation est devenue un problème urgent que sam altman doit résoudre davantage que la réalisation de l'agi.

pendant longtemps, sam altman a utilisé de superbes compétences pour manipuler l'opinion publique tout en dirigeant sa propre entreprise, faisant de lui le leader parmi les pdg du secteur technologique.

mais ne soyez pas surpris si vous l’entendez parler des projets d’openai de passer à un « modèle de profit » lors de l’openai devday à san francisco.

nouvelles

openai devday « pas de modèles, pas de nouvelles fonctionnalités », à quoi d'autre les développeurs peuvent-ils s'attendre ?

introduction

mes coordonnées