nachricht

alibaba cloud senkt erneut die preise. warum haben große modelle es immer noch nicht eilig, „abrechnungen zu begleichen“?

2024-09-19

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

„kostenlos“ und „preissenkung“... am 19. september stellte alibaba cloud auf der yunqi-konferenz 2024 eine reihe von produkten vor und kündigte eine neue runde von preissenkungen an: „alibaba cloud wird hart daran arbeiten, die kosten weiter zu senken.“ wu yongming, ceo der alibaba group, vorsitzender und ceo der alibaba cloud intelligence group, sagte dies.
dahinter steckt für cloud-anbieter die branche noch im anfangsstadium der agi-revolution, und die „preissenkungswelle“ großer modelle zeigt kein ende.
„in der vergangenen zeit sind die kosten für die modellinferenz exponentiell gesunken und liegen weit über dem mooreschen gesetz. im vergangenen jahr ist der aufrufpreis der tongyi qianwen api auf alibaba cloud bailian um 97 % gesunken, und die aufrufkosten für eine million token.“ ist auf die niedrigsten 5 cent gefallen“, verriet wu yongming in seiner rede am morgen des 19. september.
am nachmittag desselben tages wurden die mindestanrufkosten von alibaba cloud qwen-turbo für eine million token erneut auf 30 cent erhöht. zhou jingren, chief technology officer der alibaba cloud intelligence group, gab den preis von qwen-turbo bekannt sanken um 85 %, die preise für qwen-plus und qwen-max wurden um 80 % bzw. 50 % gesenkt und alibaba cloud startete eine neue runde von preissenkungen.
gleichzeitig veröffentlichte alibaba cloud auch eine neue generation des open-source-modells qwen2.5. sein visuelles sprachmodell qwen2-vl-72b ist ebenfalls offiziell open source. es kann bilder mit unterschiedlichen auflösungen und seitenverhältnissen erkennen und videos länger verstehen 20 minuten. das flaggschiffmodell von alibaba cloud tongyi, qwen-max, habe ebenfalls ein rundum-upgrade erhalten, sagte zhou jingren, dass seine leistung nahe an gpt-4o liege. die hintergrundmodelle der offiziellen tongyi-website und der tongyi-app seien auf qwen-max umgestellt worden um allen nutzern kostenlose dienste anzubieten. „erbringen von diensten“. darüber hinaus kündigte zhou jingren ein umfassendes upgrade von tongyi wanxiang an und veröffentlichte ein neues videogenerierungsmodell. dieses ki-videoproduktionstool ist völlig kostenlos und „die app kann jeden tag unbegrenzt genutzt werden“.
ein phänomen hinter der aktionsreihe von alibaba cloud ist, dass es in der großen modellbranche immer noch die norm ist, geld zu zahlen, um traffic anzuziehen und neue kunden zu gewinnen.
„open source und preissenkung basieren alle auf der gleichen logik, wie man das ökosystem entwickelt“, sagte zhou jingren in einem interview mit reportern. er sagte, dass alibaba cloud sich seit letztem jahr fest für open source engagiert habe. im vergangenen jahr habe alibaba cloud gesehen, dass die ökologische konstruktion von modellen die erwartungen übertroffen habe und große modelle nicht mehr überlegen seien. bis mitte september 2024 überstiegen die kumulierten downloads des open-source-modells tongyi qianwen die 40-millionen-marke.
zhou jingren sagte, dass jede preissenkung von alibaba cloud sehr ernsthafte interne diskussionen durchlaufen habe. neben den kosten müssen cloud-anbieter auch die entwicklung der gesamten branche sowie das feedback von entwicklern und unternehmensanwendern abwägen und durch skaleneffekte, technologischen fortschritt und ressourcenplanung weitere kostensenkungen in der zukunft erreichen. aus einer langfristigen entwicklungsperspektive müssen die fähigkeiten großer modelle für jedermann erschwinglich sein, um so mehr innovationen auf industrieller ebene anzuregen. wu yongming sagte in seiner rede auch, dass die kosten für die modellinferenz ein schlüsselfaktor für die explosionsartige zunahme der anwendungen seien.
„es gibt ein sprichwort, dass die heutige ki dem internet um 1996 entspricht, das heißt, in der bbs-ära waren die internetzugangsgebühren damals sehr teuer. später, mit der entwicklung des internets, einschließlich der entwicklung des mobilen internets, die betreiber investierten kräftig in den aufbau der infrastruktur und die verkehrsraten sanken. zhang qi, vizepräsident von alibaba cloud, sagte, dass alibaba cloud auch hektisch die ki-infrastruktur aufbaut als langfristiges ziel betrachtet alibaba cloud mehr: „anstatt zu sagen, dass wir heute ein konto erstellen müssen und wie viel geld wir sofort verdienen können.“
da die preissenkung bei großen modellen den bruttogewinn schmälert oder sogar negativ ist, stellt sich die frage, was das endergebnis der preissenkung bei großen modellen ist. in diesem zusammenhang sagte zhou jingren, dass die preissenkung von alibaba cloud hauptsächlich auf die optimierung der technologie zurückzuführen sei. nicht nur die schnelle iteration des modells selbst, sondern auch die inferenzeffizienz des modells und die strukturoptimierung würden gleichzeitig durchgeführt, um eine weitere reduzierung des modells zu fördern inferenzkosten alibaba cloud wir müssen die dividenden der technologie auf unternehmenskunden übertragen, um die entwicklung der gesamten branche zu fördern.
„wir sind uns auch darüber im klaren, dass sich die anwendung heutiger modelle, einschließlich verschiedener modellinnovationen, noch in einem frühen stadium befindet. wenn wir die argumentation des modells zu diesem zeitpunkt in ein teures stadium versetzen, werden viele entwickler dazu nicht in der lage sein.“ um effektiv zu sein, wird der einsatz in chargen oder in großem maßstab auch die aufmerksamkeit aller (auf die agi-reform) in gewissem maße beeinträchtigen“, sagte zhou jingren.
(dieser artikel stammt von china business news)
bericht/feedback