Conversa com Huoshan Tandai: Hoje a indústria cobra com base em tokens, mas este modelo não será o único no futuro

Conversa com Huoshan Tandai: Hoje a indústria cobra com base em tokens, mas esse modelo não será o único no futuro.

2024-08-06

Texto｜Anita Tang

Editor｜Su Jianxun

Fonte da capa | Fornecida pela empresa

A emergência é um fenómeno chave na onda da IA generativa: quando a escala do modelo se expande até um ponto crítico, a IA mostrará uma sabedoria semelhante à humana e poderá compreender, aprender e até criar. A "emergência" também acontece no mundo real - a civilização baseada no silício está prestes a eclodir. Empreendedores e criadores no campo da IA estão usando sua sabedoria e inteligência para iluminar a longa jornada para realizar a AGI. Na transição entre a antiga e a nova produtividade, “Smart Emergence” lança uma nova coluna “Emergência de 36 Pessoas”. Registraremos o novo pensamento nesta fase por meio de conversas com figuras-chave do setor.

O Volcano Engine em 2024 mudou de seu perfil discreto anterior e agora está aparecendo no mercado de modelos de grande porte em um ritmo rápido.

Não muito tempo atrás, em maio, Huoshan acaba de realizar uma conferência de imprensa atraente, que baixou o preço do modelo para o “preço mínimo” de uma só vez. O preço do modelo principal da Doubao, Doubao Pro-32k, foi reduzido para 0,0008 yuan/mil Tokens, uma redução média da indústria de 99,3% ano a ano. Por um tempo, toda a indústria ficou em alvoroço e os fabricantes seguiram o exemplo.

Mas dois meses depois, a Volcano Engine, que havia “virado a mesa” em termos de preço, não estava mais disposta a falar mais sobre preço. “Agora, com 1 bilhão de tokens custando apenas 1.000 yuans, não faz mais sentido baixar o preço. O que importa é o quanto a capacidade do modelo é melhorada com o mesmo preço.” disse "Emergência Inteligente".

Até certo ponto, a tempestuosa "grande semana de promoção" de maio - além de Huoshan, Alibaba, Tencent, iFlytek e outros grandes e pequenos fabricantes anunciaram cortes de preços para modelos grandes, o que é um símbolo da entrada do grande campo de modelos em um novo palco. O consenso por trás disso é que, embora os modelos grandes já sejam deslumbrantes, o novo bolo de IA que eles trazem ainda é muito pequeno – o poder da computação é muito caro e os usuários não têm incentivo para inovar. Portanto, os fabricantes também poderiam partilhar os lucros.

O efeito também é imediato. O uso médio diário de tokens do Doubao Big Model agora ultrapassa 500 bilhões. Antes da redução de preços, esse número era de 120 bilhões.

Em comparação com termos como guerra de preços e receita, Tan Dai está mais preocupado com quantos usuários trouxe e quantas coisas eles fizeram com modelos grandes. “Não olhamos muito para as receitas de curto prazo, mas sim para quantos clientes estabelecemos uma cooperação mais profunda e para quantos problemas os ajudamos a resolver.

As pessoas tendem a prever o futuro seguindo o caminho do passado. Grandes modelos e computação em nuvem são considerados negócios com modelos semelhantes: pesados investimentos técnicos e pesquisa e desenvolvimento de engenharia na fase inicial, mas o Efeito Matthew é extremamente alto na fase posterior. Mas a premissa é que a escala dos negócios deve crescer para uma escala muito grande antes de poder realmente atingir efeitos de escala.

Os grandes modelos deste ano estão a desenvolver-se neste caminho - os fabricantes estão a baixar os preços um após o outro, tornando o poder de computação dos grandes modelos mais inclusivo e tornando-se uma infra-estrutura como água, electricidade e carvão.

Tan Dai acredita que, no futuro, a implementação de grandes modelos será mais rápida do que a computação em nuvem. Produtos como o ChatGPT já permitiram ao mundo saber que a IA é o futuro, ao contrário da computação em nuvem que passou por um longo “sermão”. Mas para permitir que todos inovem sem preocupações, a redução de preços é apenas o primeiro passo.

A explosão de aplicações de IA exige investimento contínuo na superação de diversas dificuldades técnicas nos modelos: ilusões de controle, textos longos, etc. "Não acho que os desenvolvedores estejam ansiosos. É muito cedo para falar sobre o Killer App agora." Ele disse que o grande modelo atual ainda está na era do "Big Brother", "levará muitos anos até que o iPhone apareça."

Em 2021, Huoshan entrou oficialmente no mercado de nuvem. Agora está lotado há apenas três anos e ainda é uma nova força no mercado de computação em nuvem. Portanto, a IA não é apenas uma passagem para uma nova era para o Volcano Engine, mas também uma oportunidade de ultrapassagem nas curvas – esta é também a razão pela qual o Volcano Engine investe pesadamente em IA. Em 2023, 70% das grandes empresas nacionais usarão os serviços de poder de computação do Volcano Engine e este ano, MaaS (Modelo como Serviço) será o próximo campo de batalha;

A seguir está uma transcrição da conversa entre "Intelligence Emergence" e Tan Dai, compilada e editada:

Depois que o preço “virou a mesa”

"Emergência de Inteligência": A coisa mais discutida recentemente sobre Huoshan é que você é o primeiro entre os grandes fabricantes a lançar uma onda de cortes de preços. As pessoas dizem que você "virou a mesa". Qual foi o pensamento por trás disso?

Tan Dai:Nossa principal consideração é construir um ecossistema de aplicativos.

"Emergência de Inteligência": Foi uma decisão difícil para você reduzir o preço? Há quanto tempo você está pensando nisso?

Tan Dai: Não é nada difícil. Depois de o lançarmos oficialmente em agosto do ano passado, o custo deve ter sido particularmente elevado. Temos feito otimização de engenharia desde então e a utilizamos extensivamente internamente. Após cerca de um ano de otimização de engenharia, começamos a considerar reduções de preços.

"Emergência de Inteligência":Por que esta decisão não é difícil?

Tan Dai: Estamos pensando: o que há de mais importante nesse assunto? Ou seja, queremos tornar próspero o ecossistema empresarial.

Existem vários limites por trás disso. A primeira é a capacidade do modelo. Os sacos de feijão já foram fabricados. Na nossa conferência 515, todos viram que quando introduzimos o modelo grande, não mencionamos o nosso próprio conjunto de avaliação, nem falamos sobre os resultados da avaliação.

Porque acho que pode ser usado por todos. Quanto à avaliação, existem muitas avaliações de terceiros, incluindo Zhiyuan, OpenCompass, etc., e todas dizem que o pufe é muito eficaz.

A segunda é que o custo é demasiado elevado, por isso temos primeiro de baixar o preço e torná-lo um preço sustentável. Como somos um negócio To B, se o preço não puder sustentar o lucro bruto ou o lucro no longo prazo, será insustentável.

A terceira é a praticidade de implementação, incluindo plug-ins, cases, etc., que exige a montagem de muitas coisas. Reduzimos custos através da otimização da engenharia. É isso que a Huoshan, um fornecedor de nuvem, tem que fazer.

"Emergência de Inteligência":Como o vulcão reduziu o preço a um preço tão baixo?

Tan Dai:Ao otimizar continuamente a estrutura do nosso modelo e otimizar a engenharia de inferência, podemos reduzir custos e liberar esse dividendo para a indústria.

Como serviço, os modelos grandes devem ser maiores em escala e com menor custo. Com uma escala grande, você pode ter cargas diferentes e fazer escalonamento de pico e agendamento misto. O mesmo se aplica à computação em nuvem, tornando-a mais barata.

Em segundo lugar, quando a escala for suficientemente grande, com um pouco de optimização, os benefícios serão suficientemente grandes, e só então poderá haver orçamento suficiente para construir uma boa equipa técnica.

"Emergência de Inteligência": Este é um processo que se reforça mutuamente. Primeiro, é mais barato e a escala é maior. Depois você pode otimizar e os benefícios serão maiores.

Tan Dai: Isso também se deve ao aumento de ligações para o APP Doubao. Todos podem ver pelos dados anteriores de terceiros que os produtos de IA e o Doubao APP ficaram em primeiro lugar. Dentro de Douyin, mais de 50 cenários e linhas de negócios estão sendo amplamente utilizados, e também há muitos clientes externos convidados, o que tem apoiado a escala.

Após o anúncio da redução de preço no dia 15 de maio, nossa escala de chamadas aumentou mais rapidamente e neste momento vimos mais pontos que poderiam ser otimizados.

"Emergência de Inteligência":Depois que a redução de preço foi anunciada oficialmente, qual foi o efeito?

Tan Dai: Em primeiro lugar, todos já não têm qualquer ónus para inovar em IA e a escala está a crescer rapidamente. Muitas startups usam mais de 1 bilhão de Tokens todos os dias. Quanto custa 1 bilhão de Tokens agora? Apenas 1.000 yuans. Em comparação com quando o modelo foi lançado em 15 de maio, o uso médio diário de Tokens por cliente aumentou de 20 a 30 vezes.

E há muitos cenários de uso nos quais não pensamos. Vejamos o volume diário original de chamadas de Doubao, que era de mais de 120 bilhões de Tokens. Após a redução de preço, agora ultrapassou 500 bilhões de Tokens.

Em segundo lugar, quando anunciámos a redução de preços, algumas pessoas disseram que o preço não era importante, mas lentamente muitos fabricantes começaram a seguir o exemplo.

"Emergência de Inteligência": Seu modelo principal Beanbao Pro 128k custa 0,005 yuans/mil tokens, o que é 95,8% menor que o preço da indústria, enquanto o modelo 32k custa 0,0008 yuans/mil tokens, o que representa uma redução de 99,3%. Este preço pode ser considerado um “preço mínimo”. Como foi determinado?

Tan Dai: Primeiro definimos o objectivo e precisamos de libertar os dividendos a um preço sustentável. Não é uma perda, mas não preciso ganhar muito. Inicialmente pensei que fosse uma queda de 90% em comparação com a média do setor, mas não esperava que a comparação posterior mostrasse uma queda de 99%.

"Emergência de Inteligência":Haverá espaço para redução de preços no futuro?

Tan Dai: Nessa perspectiva, o preço não é mais o gargalo. Depois que cair para um nível tão baixo, não importa o quanto caia ainda mais, o ganho para os usuários será realmente pequeno. O que é mais importante agora é que, ao mesmo preço, é mais significativo melhorar as capacidades do modelo.

"Emergência de Inteligência": Isso é um pouco como a onda anterior de inovação em IA em CV (reconhecimento visual)? É importante aumentar a precisão de 70% para 90%, mas no final, passar de 95% para 98% significa pouco e os clientes podem aceitar isso.

Tan Dai: Pode não ser capaz de fazer 98%. Mas devemos olhar ao contrário. Costumava ser 5% de Bad Case (resultado não alinhado com as expectativas), mas agora passou para 2% e o efeito duplicou.

"Emergência de Inteligência": Há também muitos comentários na indústria dizendo que começou uma guerra de preços na China, o que é prejudicial para a indústria. Como treinar modelos grandes é caro, ninguém consegue ganhar dinheiro.

Tan Dai: Eu não concordo com essa visão. Do ponto de vista da indústria, isto permitiu que a IA da China florescesse, o que é bom.

O mesmo se aplica à computação em nuvem. A nuvem entrou numa guerra de preços anteriormente, o que é positivo. A transformação digital das empresas tornou-se mais fácil e os custos foram reduzidos.

"Emergência de Inteligência":No passado, no contexto da Internet, a “guerra de preços” tinha uma conotação demasiado depreciativa.

Tan Dai: Acho que há uma diferença. No passado, o modelo de negócio da To C Internet era diferente. A lã vem do porco. Mas na guerra de preços To B, a própria empresa depende disso para cobrar e, se continuar a fornecer esse preço, todos serão beneficiados no final.

"Emergência de Inteligência": Esta é definitivamente uma boa notícia para os desenvolvedores. Mas e internamente? Alguns colegas de vendas da Cloud Factory nos disseram que não têm motivação para vender IA porque a IA não pode vender a um preço alto. Como considerar esta questão?

Tan Dai: Esta é uma pergunta muito boa. Sinto que não há nada a perder para nós.

Em primeiro lugar, Huoshan é uma plataforma em nuvem, e os clientes não desejam apenas um modelo grande; eles realmente desejam uma solução abrangente, que inclua grandes modelos, nuvens e produtos de dados.

A receita unitária do grande modelo em si diminuiu, mas ao ajudar os clientes a resolver mais problemas através do grande modelo, você terá mais oportunidades de fazer mais negócios com eles no futuro. Se o grande modelo estiver pronto, os clientes até nos dirão, não, a minha arquitetura de TI precisa ser reconstruída, e então faremos isso com base em vulcões.

"Emergência de Inteligência": Como entender a reconstrução da arquitetura de TI? Onde estão os espaços e oportunidades presentes?

Tan Dai:No passado, muitas coisas nos gastos com TI não eram resolvidas por meio da nuvem, mas pela superposição de funções de software - tudo era feito por mão de obra e muitas coisas não podiam ser convertidas em poder computacional.

Mas com o modelo grande, muitos cenários, seja usando Copilot ou Autopilot, muitos cenários de IA podem ser atendidos pelo modelo grande, e a camada inferior do modelo grande é a nuvem. Mercados que antes eram inacessíveis à nuvem tornaram-se agora mercados acessíveis.

"Emergência de Inteligência": Até que ponto os clientes reconhecem a IA agora? Quando a computação em nuvem foi lançada, muitos usuários corporativos equipararam a computação em nuvem ao conceito de “avançado” e depois optaram pela digitalização. Os modelos grandes alcançaram tal efeito agora?

Tan Dai:As empresas não estão dizendo que após a adoção da IA, todos os ambientes de TI serão imediatamente removidos pela IA. Isso definitivamente não é possível. Em vez disso, elas primeiro identificam certos cenários onde a IA pode ser usada para melhorar a eficiência.

Por exemplo, vimos que para alguns clientes, uma vez que o modelo é chamado em volume, os serviços upstream e downstream entrarão em colapso. Eles transformarão essas arquiteturas baseadas em nuvem nativa para suportar a carga.

"Emergência de Inteligência":Até que ponto estes casos se reflectirão nos rendimentos?

Tan Dai: Nem tudo é do ponto de vista da receita e não estamos muito focados no curto prazo no momento. Também analisamos com quantos clientes estabelecemos uma cooperação mais profunda através deste assunto e quantos problemas os ajudamos a resolver. No final, os resultados virão naturalmente.

"Emergência de Inteligência":Se você não foca na renda no curto prazo, qual indicador você mais valoriza agora?

Tan Dai: A quantidade de Tokens usados pelas empresas, mas não acho que será apenas esse modelo no futuro. Certa vez conheci um amigo que escrevia romances, mas depois “abandonou a escrita e começou a escrever poesia”. Eu pergunto: por que você fez essa escolha? Ele disse que escrever poesia se paga por linha e escrever romances por palavra - o preço é diferente para as mesmas 100 palavras.

O modelo de negócios do grande modelo mudará definitivamente, e o modelo econômico final será um modelo mais ponta a ponta. Por exemplo, se houver um Agente, você pagará tanto quanto a quantidade de problemas que ele te ajudar a resolver. Pelas mesmas 100 palavras, quem o produz será diferente.

As aplicações de IA não explodiram, mas a essência ainda é um problema de capacidades do modelo

"Emergência de Inteligência": No início deste ano, a indústria discute agora um termo muito antigo: Killer App. Todo mundo está se perguntando por que ainda não existe um aplicativo matador. Como importante fornecedor de infraestrutura, Huoshan, o que você acha do período atual de aplicação de IA?

Tan Dai: Acho que agora existe um aplicativo Killer, e ChatGPT é ele. Independentemente do número de usuários e da receita, é mais rápido que todos os produtos da Internet, TikTok e Douyin. Este já é um sinal forte.

Agora, falando sobre o Killer App, acho que ainda vejo esse assunto da perspectiva To C. Modelos grandes certamente rodarão muito rápido em cenários do lado C, porque a área de teste é muito ampla, como aplicativos de bate-papo e companhia emocional, agora todos rodam muito rápido.

Em segundo lugar, não precisamos apenas olhar para o Killer App, porque existem muitos cenários de produtividade no lado empresarial, como o atendimento ao cliente de IA. Nestes cenários, o conceito de Killer App não se aplica e não o discutimos com indicadores como DAU.

Os serviços empresariais não falam sobre o Killer App. ERP (software de sistema de gerenciamento empresarial) é um aplicativo matador. Toda empresa deve tê-lo, mas ninguém fala sobre esse conceito.

"Emergência de Inteligência": Globalmente, exceto o ChatGPT que atingiu o nível do Killer App, outros produtos estão muito atrás. Por exemplo, o companheirismo emocional e o fazer amigos ainda estão centrados num grupo relativamente pequeno de pessoas e o grau de homogeneidade ainda é elevado.

Tan Dai: Acho que depende do tempo. Por exemplo, o Killer App na era do PC era um mecanismo de busca, mas os mecanismos de busca só apareceram muito tarde. Mas depois que surgiram mais desses sites, os mecanismos de pesquisa surgiram novamente.

Inclusive quando a Internet móvel estava apenas começando, aplicativos como Douyin e Meituan só foram lançados vários anos depois.

"Emergência de Inteligência": Você tem experiência em computação em nuvem. Comparado com a computação em nuvem, o que você acha desta rodada de popularização da tecnologia de IA? Irá seguir o mesmo caminho que a popularidade da computação em nuvem?

Tan Dai: A computação em nuvem é bastante complicada de entender, mesmo se você for um técnico, e não é necessária apenas uma pessoa para configurá-la facilmente. Trabalhei no Alibaba de 2010 a 2011. Naquela época, a AWS era provavelmente a única no mundo que havia descoberto o que era a nuvem, e o Google também não havia descoberto.

Mas a IA é diferente. Como indivíduo, você pode experimentar facilmente suas funções e saber rapidamente se ela é boa ou ruim. Se você quiser saber o que é IA, basta pegar um pufe. Desta perspectiva, não é como a computação em nuvem, que exige um evangelismo muito complicado.

"Emergência de Inteligência":Esse caminho de popularização afetará a lógica de tomada de decisão e compra dos negócios To B?

Tan Dai: Toda empresa tem inércia e os negócios To B se tornarão mais lentos. Mas pelo menos quando você entender se o produto é bom ou não, a experiência do cliente mudará.

Uma grande mudança trazida pela IA é que ela torna os negócios To B visíveis e acessíveis, e o tempo para POC (verificação de protótipo) será muito menor. No passado, a tomada de decisões e o uso eram separados. Os tomadores de decisão faziam escolhas, mas os usuários achariam isso uma droga.

Mas a IA suavizou bastante essas lacunas. No passado, os clientes tinham que assistir PPTs, fazer tours e dar entrevistas. No final, os tomadores de decisão só podiam assistir à demonstração e a experiência não era tão completa. Agora, quando converso com um cliente, ele vai nos contar sobre o pufe que costumo usar. Se ele quiser ajustar algo na demonstração, ele pode alterá-lo em segundo plano e será ajustado imediatamente. Você pode até fazer isso sozinho antes das vendas, e não há necessidade de voltar antes das vendas para que a P&D faça alterações.

É por isso que nossos To C e To B são da mesma marca, ambos pufes.

"Emergência de Inteligência":No que diz respeito aos grandes modelos nacionais, você acha que há uma grande diferença agora?

Tan Dai:A diferença de preço é enorme.

"Emergência de Inteligência":Todo mundo não caiu muito?

Tan Dai: Na verdade, os fabricantes nacionais não seguiram completamente. Nosso modelo principal, que é o mais forte, também foi reduzido para 0,0008 yuan/mil Tokens. No entanto, a maioria dos fabricantes não reduz o modelo mais forte, mas reduz o segundo modelo mais forte, ou reduz. a Modelos pequenos são gratuitos. Se você for ver quanto custam os principais modelos de alguns fabricantes rivais, eles serão pelo menos dezenas de vezes diferentes do preço dos pufes.

Usar modelos de código aberto para medir custos também é mais caro do que usar pufes. Se você usar o Llama de código aberto para fazer isso, terá que fazer a otimização da engenharia sozinho e não há vantagem de escala. Com o mesmo efeito, fazer você mesmo a otimização da engenharia é várias vezes mais caro do que usar a nuvem diretamente.

"Emergência de Inteligência":Além do preço, quais são as outras diferenças?

Tan Dai: O modelo ainda está evoluindo rapidamente e ainda existem muitas capacidades que ainda não foram desenvolvidas. Ainda haverá muitas diferenças no futuro e ficará cada vez melhor. Mas olhando para o mundo, pode haver apenas três ou quatro empresas que estão a ter um desempenho muito bom, pelo menos não tantas como as dez empresas na China.

"Emergência de Inteligência":Em quais setores os clientes da Huoshan estão atualmente concentrados?

Tan Dai: Existe em milhares de indústrias. Os fabricantes de telefones celulares que se saem relativamente bem incluem Samsung, Xiaomi, OPPO, vivo e Honor. Também fazemos muito com fabricantes de automóveis, e são todas empresas muito grandes. Existem também alguns casos em bancos financeiros.

Mas o ângulo de entrada será diferente. Por exemplo, em telefones celulares e carros, o que fazemos é um cenário relativamente completo de interação humano-computador. Mas para muitas grandes empresas estatais ou bancos, podem tentar fazê-lo primeiro a partir de um pequeno ponto.

Portanto, a vantagem de fazer IA é que você pode começar aos poucos e não há necessidade de cortar o núcleo do sistema assim que começar.

"Emergência de Inteligência": Os perfis de clientes de cada plataforma de grande modelo são muito diferentes? Muitas das empresas que constroem grandes modelos são fornecedores de nuvem, e os grupos de clientes dos fornecedores de nuvem também terão diferenças no setor.

Tan Dai: Há diferença quando a escala de negócios do modelo grande é pequena, mas não há diferença quando a escala é grande. Definitivamente, há agora mais clientes de pequeno e médio porte, mas se olharmos para a distribuição da indústria, pode não haver necessariamente uma diferença particularmente grande.

"Emergência de Inteligência":Do lado C e do lado B, qual lado você acha que o grande modelo surgirá primeiro?

Tan Dai: Nosso volume atual é quase o mesmo, mas o efeito Matthew no lado C é muito forte. Talvez os principais clientes tenham contribuído com muito DAU. Esta lógica aplica-se ao lado C, mesmo quando não é IA, mas o desenvolvimento do lado B é de muito longo prazo.

"Emergência de Inteligência": O que os grandes modelos podem fazer agora é relativamente simples. Por exemplo, todos sentem que a definição de Agente nem sequer está alinhada. Por que a execução de grandes modelos agora só pode ficar em cenários tão simples?

Tan Dai:A capacidade do modelo não é forte o suficiente.

"Emergência de Inteligência":Quais são os pontos-chave a serem superados?

Tan Dai: Existem alguns. A habilidade do modelo deve ser forte e a inteligência deve ser forte. Não foi no vestibular há algum tempo? Doubao finalmente “passou” no curso de artes liberais, mas ainda não foi admitido na Universidade de Tsinghua e na Universidade de Pequim, e nem passou no curso de ciências. óbvio, e seu nível não é suficiente. Mas não tem problema, temos confiança suficiente.

Em segundo lugar, ainda existem muitos problemas complexos que não foram resolvidos, como a memória de longo prazo. Isto requer definitivamente alguma inovação na estrutura do modelo e a multimodalidade precisa de ser melhorada. Os custos também devem ser controlados. Depois de adicionar esses recursos, não é certo aumentar muito os custos.

Acho que ainda é muito cedo para grandes modelos. A revolução das comunicações móveis já dura 30 ou 40 anos. Desde as décadas de 1970 e 1980, a história do desenvolvimento da IA é mais longa do que isso. Quando ainda usávamos telefones celulares na década de 1990, poderíamos pensar no atual iPhone? Estas são mudanças nas últimas décadas.

"Emergência de Inteligência":O atual volume de negócios do Modelo Huoshan, seja em número de clientes ou receita, atende às suas expectativas?

Tan Dai: Acho que está tudo bem e atende às expectativas. Esperamos ver um ecossistema próspero e agora alcançámos de facto os resultados que desejávamos. E não somos só nós que estamos subindo, vemos que nossos amigos também estão subindo.

"Emergência de Inteligência":Você tem um valor estimado em mente?

Tan Dai: Por exemplo, existe uma meta para o número total de tokens, que é total e escalonado. Por exemplo, o número de usuários cujo número de tokens excede um determinado nível deve atingir um determinado nível. Esperamos que os clientes formem uma distribuição em forma de fuso ou funil. Se a quantidade total de tokens for muito alta, mas houver apenas dez clientes com mais de 100 milhões de tokens, isso também não é saudável.

"Emergência de Inteligência":Como é agora?

Tan Dai:Ainda não tem o formato de pirâmide invertida e a cintura do usuário pode ser um pouco mais grossa.

"Emergência de Inteligência": Obviamente, após a redução de preços dos grandes modelos, a IA tornou-se mais inclusiva e pode fazer mais coisas. Você acha que há uma tendência clara entre os primeiros adotantes hoje em dia de se tornarem uma “empresa individual”?

Tan Dai: Hoje em dia, há menos “empresas unipessoais” e mais “empresas de dez pessoas”. Vejo no exterior que muitas coisas podem ser feitas com apenas duas ou três pessoas.

Costumávamos brincar que para começar um negócio bastava um programador, mas agora não precisamos mais dele. Alguns usuários entrevistados disseram que, como não tenho código, esta demonstração não pode ser usada para verificação de protótipo (POC), mas agora pode. No futuro, se o modelo grande for melhor, a IA poderá resolver tudo de 0 a 100.

A OpenAI originalmente discutiu quando surgiria uma empresa unicórnio com apenas uma pessoa na empresa (avaliada em mais de US$ 1 bilhão) e se isso levaria cinco anos ou mais.

Nesse caso, não devemos olhar apenas para o Killer App, pois muitas ideias de startups são para resolver problemas muito verticais.

É mentiroso pregar que “usar IA ajudará seu negócio a crescer”

"Emergência de Inteligência":Você está se concentrando mais no lado da tecnologia agora ou no lado do cliente?

Tan Dai: quase. No curto prazo, os dois lados são inseparáveis. A IA não é tão madura quanto a computação em nuvem. A melhoria do modelo de IA, a melhoria do produto e a forma como os clientes a utilizam exigem um processo de feedback.

"Emergência de Inteligência":Em quais aspectos das necessidades ou dúvidas atuais dos clientes estão mais focados?

Tan Dai:Existem muitas maneiras inesperadas.

Por exemplo, no cenário educacional, algumas pessoas pensavam: só posso resolver o problema para você. Mas em muitos cenários atuais, os clientes precisam que você desempenhe o papel de professor e me diga como fazer isso, em vez de apenas me dizer qual é a resposta. Isso requer mais do que apenas capacidades de modelo.

"Emergência de Inteligência":Você acha que este é um problema no nível do produto?

Tan Dai:Você pode pensar nisso como uma questão de produto ou de demanda, mas por trás disso também estão questões técnicas.

"Emergência de Inteligência": Do lado do cliente, haverá mais cenários “obrigatórios” agora? Por exemplo, agora, as empresas pensam que a IA é algo dispensável, ou podem considerar a redução de custos e o aumento da eficiência.

Tan Dai: Todo mundo já tem um consenso de que a IA é a próxima grande novidade, então definitivamente não vai faltar. Agora não precisamos mais educar as empresas sobre o uso de IA, mas precisamos discutir com elas quais cenários são adequados para o uso de IA. Às vezes as pessoas subestimam as capacidades da IA e às vezes a superestimam.

"Emergência de Inteligência":Portanto, em comparação com a era anterior de digitalização, a IA trouxe uma nova atualização ao conceito de digitalização.

Tan Dai: Talvez. No passado, ao fazer a digitalização, um passo muito importante era transformar dados não estruturados em dados estruturados e fazer com que as pessoas entendessem os dados estruturados. Agora a IA resolveu tudo para ele e o limiar para a digitalização foi reduzido.

"Emergência de Inteligência": As empresas veem a IA e a digitalização da mesma perspectiva? No passado, quando as empresas se tornaram digitais, o chefe achava que isso poderia melhorar um pouco a eficiência, mas muitos ainda consideravam isso um custo. Quando as empresas perguntam se a digitalização vai crescer, a sua contribuição é, na verdade, muito fraca. A IA pode mudar esta situação?

Tan Dai: Acho que é um processo de tomada de decisão em diferentes dimensões. A tecnologia trata apenas de melhorar o negócio. Por um lado, o chefe quer ver o meu modelo de negócio e, por outro lado, como melhorar a eficiência do meu negócio através da digitalização.

Suponha que um varejista me pergunte como conseguir o crescimento do negócio? Meu primeiro ponto definitivamente não é dizer a ele que você deseja entrar na IA. Eu definitivamente digo: você inicia o comércio eletrônico Douyin. Depois, vamos falar sobre onde podemos ajudá-lo a melhorar a eficiência por meio da IA. Se você disser “você pode crescer com IA” desde o início, acho que é um mentiroso.

"Emergência de Inteligência": Tenho um amigo que tinha dificuldade em vender nuvens em Huoshan, mas ele saiu por volta de 2022. Depois de ver o modelo grande, ele sentiu que isso dava ao vulcão uma oportunidade particularmente grande. O que você acha?

Tan Dai: Só vamos lançar a nuvem no final de 2021. Claro que vai ser difícil fazer isso no primeiro ano, que é o mais difícil. Ele pode simplesmente continuar por mais um ano. Na verdade, nosso crescimento tem sido bastante rápido nos últimos anos e somos os mais rápidos do setor.

Acho que os tempos fazem heróis. Se não houver novos clientes e nenhum novo cenário para os clientes, mesmo que você faça o melhor, de que adianta? A anterior era de ouro da computação em nuvem deveu-se à ascensão da Internet móvel e à maturidade gradual da digitalização em todas as esferas da vida. A computação em nuvem não cresceu tão rapidamente.

Mas a próxima era é a IA. Sinto que a cada dez anos ou mais, um novo ponto surgirá, e devemos aproveitar este novo ponto para manter a nossa liderança tecnológica.

"Emergência de Inteligência":Você acha que os desenvolvedores com quem você entra em contato agora estão ansiosos?

Tan Dai: Pessoalmente, sinto que ninguém está particularmente ansioso. por que? Veja bem, os modelos atuais são muito bons e os preços são muito baixos, então experimente mais e não há nada com que se preocupar. Pode ser que os investidores estejam mais ansiosos. (rir)

"Emergência de Inteligência":Alguns desenvolvedores estão ansiosos porque embora os modelos sejam baratos agora, eles eram muito bons no início e ainda poderiam ganhar dinheiro, mas quando começarem a expandir sua escala e investir em tráfego, o ROI não será correto e os usuários reais retidos será raro.

Tan Dai: Acho que é um problema de tráfego, não de IA. Se você não usar IA, ainda estará errado se usar outras coisas. Por exemplo, jogadas curtas são muito populares. Algumas jogadas curtas podem gerar dinheiro, enquanto outras não.

"Emergência de Inteligência":Qual é o cenário de aplicação de IA mais interessante que você viu recentemente?

Tan Dai: Existem alguns, por exemplo, algumas crianças usam pufes para aprender inglês diretamente. Outro cliente corporativo nosso queria usar um modelo grande, então realizou um hackathon de IA dentro da empresa. Os funcionários desenvolveram mais de 100 produtos com base nas necessidades de negócios que normalmente encontravam, e talvez dois ou três deles tenham obtido sucesso.

Estamos agora a cooperar com alguns fabricantes de automóveis, que até convidam os seus utilizadores a participar em todo o design. Quando os usuários participam do design, eles podem compreender melhor seus próprios pontos fracos.

"Emergência de Inteligência":Para as empresas que você atende, quanto mudou agora a proporção entre treinamento e poder de computação de inferência?

Tan Dai: Ainda haverá mais treinamento. Mas a inferência está agora a aumentar muito rapidamente, dezenas de vezes mais do que no ano passado, enquanto a formação cresceu menos de duas vezes. Originalmente, tínhamos uma previsão de que a inferência excederia o treinamento até 2025, e parece ser o caso agora.

"Emergência de Inteligência":Quando você acha que os aplicativos de IA explodirão?

Tan Dai: Em primeiro lugar, este ano não é uma grande explosão, mas é definitivamente uma pequena explosão. Mas penso que haverá uma grande explosão no próximo ano. Mesmo de uma perspectiva global, está definitivamente nos estágios iniciais da aplicação da IA. No futuro, preços mais acessíveis garantirão efeitos de modelo ideais. Somente quando as aplicações de IA florescerem e as reações químicas continuarem a ocorrer é que o ecossistema poderá ser construído.

"Emergência de Inteligência":Desde 2023, você tem enfatizado que não fará grandes modelos básicos. Fará isso no futuro?

Tan Dai: Nunca mais. O grande modelo Doubao está sendo desenvolvido por uma equipe dedicada da ByteDance. Não há necessidade de Huoshan fazer o modelo sozinho, desde que a nuvem e o MaaS sejam bem feitos.

As pessoas que fazem computação em nuvem e aquelas que fazem modelos grandes são definitivamente completamente diferentes. Todos os principais fabricantes do mundo fazem seu trabalho separadamente. O modelo da Amazon é Claude, e a nuvem é feita pelo Google Cloud do Google e o Gemini não é feito pelo mesmo grupo de pessoas.

Nós da Huoshan nos concentramos em fazer bem a nuvem, mas o MaaS é uma parte muito importante da nuvem. Para que o MaaS seja bem-sucedido, nosso serviço MaaS fornecerá o melhor modelo aos nossos clientes. Isso nunca mudou.

Bem vindo ao grupo

Bem-vindo a comunicar

notícias

Conversa com Huoshan Tandai: Hoje a indústria cobra com base em tokens, mas esse modelo não será o único no futuro.

Introdução

minhas informações de contato