notícias

OpenAI lança novos recursos que permitem às empresas personalizar os modelos de IA mais poderosos com base em seus próprios dados

2024-08-21

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

TencentScience and Technology News, 21 de agosto, terça-feira, horário local dos Estados Unidos,IA abertaLançou um novo recurso que permitirá que clientes corporativos personalizem este produto usando os dados de suas próprias empresasIA (IA) O modelo mais poderoso para startupsGPT-4o

A OpenAI planeja lançar recursos de personalização, comumente conhecidos na indústria de inteligência artificial como nudges, na terça-feira. O ajuste fino permite que os modelos de IA existentes sejam treinados com informações adicionais sobre uma tarefa ou área temática específica.

Por exemplo, uma empresa que fabrica skates pode ajustar um modelo de IA para que possa ser usado como um chatbot de atendimento ao cliente capaz de responder a perguntas sobre os detalhes das rodas e cuidados com o skate.

No atual contexto de concorrência acirrada entre start-ups na área de produtos de inteligência artificial, e as empresas precisam urgentemente demonstrar o retorno do investimento em inteligência artificial, o ajuste fino dos recursos mais recentes do modelo emblemático da OpenAI é particularmente importante.

É importante notar que esse recurso foi introduzido pela primeira vez no GPT-4o e seus antecessores, e a OpenAI já forneceu aos usuários permissões de ajuste fino para vários tipos de modelos, incluindo GPT-4o mini, fornecendo aos usuários mais opções econômicas.

Diante dos serviços de personalização de modelos de muitas empresas de tecnologia no mercado, o diretor de produtos OpenAI API, Olivier Godement, enfatizou que a OpenAI está comprometida em simplificar e acelerar os ajustes dos clientes aos seus modelos de topo, estabelecendo processos de parceria direta com empresas para evitar que os usuários recorram a recursos externos. serviços ou alternativas mais fracas.

Ele também destacou: “Estamos sempre comprometidos em diminuir o limite técnico e reduzir as barreiras operacionais, reduzindo assim a carga do usuário para iniciar e ajustar modelos”.

Quando os clientes realizam o ajuste fino do modelo, eles precisam transmitir dados para o servidor OpenAI. De acordo com John Allard, engenheiro de software de trabalho personalizado da OpenAI, esse processo leva em média cerca de uma ou duas horas. Inicialmente, o ajuste fino será limitado a dados de texto, sem suporte para imagens ou outros formatos de mídia.

À medida que a OpenAI emite tokens gratuitos, ela enfrenta desafios deGoogleAntrópicoe outros fornecedores de modelos proprietários e Nous Research Hermes 3.Meta Guerras ferozes de preços para modelos de código aberto, como o Llama 3.1.

No entanto, a vantagem de usar OpenAI e modelos proprietários/de código fechado semelhantes é que os desenvolvedores não precisam assumir as tarefas de hospedagem do servidor de inferência ou treinamento de modelo. Eles podem utilizar recursos do servidor OpenAI ou conectar perfeitamente seus servidores preferidos por meio de APIs.

No entanto, a investigação mostra que o ajuste fino de um modelo pode trazer riscos, incluindo desvios das barreiras de segurança originais e das garantias de desempenho, o que, por sua vez, afecta a sua eficácia global. Se as empresas estão dispostas a assumir esse risco precisa ser avaliada por elas mesmas. Mas a OpenAI claramente acredita que vale a pena investir e incentiva os usuários a considerar o ajuste fino como uma opção de otimização.

Separadamente, a OpenAI disse na terça-feira que apresentará conteúdo de marcas como Vogue, The New Yorker e Wired em seus produtos. O acordo também permite que a OpenAI use o conteúdo da Condé Nast para ajudar a treinar seus modelos de inteligência artificial, que requerem grandes quantidades de dados para serem aprendidos.

O anúncio marca o esforço crescente da OpenAI para fechar acordos com empresas de mídia, em vez de brigar com elas sobre como usar artigos de notícias e outros conteúdos em suas ferramentas de IA. As partes não divulgaram o valor da transação do acordo.

A seguir está o texto completo da notícia oficial divulgada pela OpenAI:

Hoje estamos lançando o ajuste fino do GPT-4o, um dos recursos mais solicitados pelos desenvolvedores. A partir de 23 de setembro, também forneceremos a cada empresa 1 milhão de tokens de treinamento gratuitamente todos os dias.

Os desenvolvedores agora podem ajustar o GPT-4o usando seus conjuntos de dados exclusivos para obter maior desempenho com menor custo para casos de uso específicos. A tecnologia de ajuste fino dá ao modelo a capacidade de ajustar com flexibilidade a estrutura e o tom das respostas e até mesmo seguir instruções de domínio complexas e altamente especializadas. Requer apenas um pequeno número de amostras de treinamento (como dezenas de exemplos) para trazer resultados significativos. o aplicativo.

Da codificação à escrita criativa, a função de ajuste fino cobre uma ampla gama de campos, afetando e melhorando profundamente o desempenho geral do modelo. Este é apenas o começo e continuaremos investindo na expansão de nossas opções de personalização de modelos para desenvolvedores.

A partir de agora, a função de ajuste fino do GPT-4o está totalmente aberta a todos os desenvolvedores pagantes. Visite diretamente o painel de ajuste fino, clique no botão "criar" e selecione "GPT-4o -2024-08-06" na lista suspensa do modelo básico para iniciar o processo de ajuste fino. Em relação aos custos, os custos de treinamento de ajuste fino do GPT-4o são fixados em US$ 25 por milhão de Tokens, enquanto os custos de inferência são de US$ 3,75 por milhão de Tokens de entrada e US$ 15 por milhão de Tokens de saída.

Além disso, a função de mini ajuste fino do GPT-4o também está aberta a todos os desenvolvedores pagantes. Você só precisa selecionar "GPT-4o-mini-2024-07-18" como modelo básico no painel de ajuste fino. Oferta especial: Para comemorar o lançamento, oferecemos aos miniusuários GPT-4o até 2 milhões de tokens de treinamento gratuitamente todos os dias. Esta oferta é válida até 23 de setembro.

Ajustando histórias de sucesso

Nos últimos meses, trabalhamos com vários parceiros confiáveis ​​para ajustar e testar o GPT-4o e entender seus casos de uso. Aqui estão alguns exemplos de sucesso:

1.Cosine teve um desempenho incrível no teste de benchmark SWE-bench

Cosseno de inicializaçãoGênioÉ um assistente de engenharia de software de inteligência artificial que pode identificar e reparar vulnerabilidades de forma independente, construir funções e colaborar de forma eficiente com os usuários para refatorar o código. Ele também pode raciocinar sobre problemas técnicos complexos e fazer alterações no código com maior precisão e menos requisitos de token.

O Genie é alimentado por um modelo GPT-4o ajustado que incorpora a experiência do mundo real de engenheiros de software reais, permitindo que o modelo aprenda a responder de maneiras específicas. Além disso, o modelo também domina a formatação da saída em formatos específicos, como patches, que podem ser facilmente integrados à base de código, melhorando ainda mais a eficiência do trabalho.

Os resultados do teste de benchmark de verificação SWE divulgados na última terça-feira mostraram que o Genie alcançou um desempenho de 43,8%.SOTAA pontuação é excelente, especialmente no teste Completo. Sua pontuação SOTA chega a 30,08%, o que representa um salto significativo em relação à melhor pontuação anterior de 19,27%, marcando um grande avanço na história deste teste de benchmark. SWE-Bench é um teste que avalia as capacidades de engenharia de software de inteligência artificial.

2.Distyl ocupa o primeiro lugar no benchmark BIRD-SQL

A Distyl, parceira de soluções de IA para empresas Fortune 500, ficou recentemente em primeiro lugar no benchmark BIRD-SQL, o principal benchmark de texto para SQL. O GPT-4o ajustado da Distyl atinge uma precisão de execução de 71,83% no placar e tem um bom desempenho em tarefas como reformulação de consultas, classificação de intenções, encadeamento de pensamentos e autocorreção, e é particularmente notável na geração de SQL.

Privacidade e segurança de dados

O modelo de ajuste fino está totalmente sob controle do usuário, que possui propriedade absoluta dos dados de negócios, cobrindo todas as entradas e saídas. Isso garante que os dados de um usuário nunca sejam compartilhados ou usados ​​para treinar outros modelos.

Além disso, implantamos mecanismos de proteção de segurança em várias camadas para modelos ajustados para evitar abusos. Por exemplo, executamos continuamente avaliações de segurança automatizadas em modelos ajustados e monitoramos o uso para garantir que os aplicativos cumpram nossas políticas de uso.

Estamos ansiosos para ver o que você criará com o ajuste fino do GPT-4o. Se você deseja explorar mais possibilidades de personalização de modelos, não hesite em entrar em contato com nossa equipe e teremos prazer em lhe fornecer suporte e assistência! (Compilado/Cervo Dourado)