notícias

Sistema de liberação antrópica solicita modelo Claude AI

2024-08-27

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

IT House News em 27 de agosto, informou a mídia de tecnologia Techcrunch ontem (26 de agosto),A Anthropic divulgou os “avisos do sistema” do modelo ClaudeAI.

Alerta do sistema

Para permitir que o modelo de IA entenda melhor as instruções humanas, o projeto de prompt contém, na verdade, duas camadas de conteúdo principal, prompts do usuário e prompts do sistema:

  • Palavras de prompt do usuário: palavras de prompt inseridas pelo usuário e, em seguida, o modelo de IA gera respostas com base nas palavras de prompt do usuário.

  • Palavras de prompt do sistema: são prompts gerados pelo sistema que normalmente são usados ​​para definir o contexto de uma conversa, fornecer orientação ou ditar regras.

Nota da página inicial de TI: normalmente, as palavras de prompt do sistema permitirão que o modelo entenda suas qualidades básicas, bem como o que deve ou não fazer.

Prática comum na indústria

Cada fornecedor de IA generativa, da OpenAI à Anthropic, usa prompts do sistema para evitar (ou pelo menos tentar evitar) o mau comportamento dos modelos e para orientar o tom geral e o sentimento das respostas do modelo.

Por exemplo, uma palavra de prompt do sistema pode dizer ao modelo que ele deve ser educado, mas nunca se desculpar, ou admitir honestamente que não pode saber tudo.

No entanto, os fabricantes podem manter essas palavras de aviso do sistema em segredo por motivos como concorrência e para evitar que usuários mal-intencionados contornem a proteção de segurança após obterem essas informações.

Anthropic opta por divulgar palavras de alerta do sistema

No entanto, a Anthropic tem trabalhado arduamente para se apresentar como um fornecedor de IA mais ético e transparente e revelou o sistema para seus modelos mais recentes (Claude 3.5 Opus, Sonnet e Haiku) nos aplicativos Claude iOS e Android e na web dica .

Alex Albert, chefe de relações com desenvolvedores da Anthropic, disse em um post no X que a Anthropic planeja publicar essas informações regularmente à medida que atualiza e ajusta os prompts do sistema.