noticias

Avisos del sistema de lanzamientos antrópicos para el modelo Claude AI

2024-08-27

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

IT House News el 27 de agosto, informó el medio tecnológico Techcrunch ayer (26 de agosto),Anthropic ha revelado las "indicaciones del sistema" del modelo ClaudeAI.

Aviso del sistema

Para permitir que el modelo de IA comprenda mejor las instrucciones humanas, el proyecto de aviso en realidad contiene dos capas de contenido principal, avisos del usuario y avisos del sistema:

  • Palabras de solicitud del usuario: solicita las palabras ingresadas por el usuario y luego el modelo de IA genera respuestas basadas en las palabras de solicitud del usuario.

  • Palabras de indicaciones del sistema: son indicaciones generadas por el sistema que normalmente se utilizan para establecer el contexto de una conversación, proporcionar orientación o dictar reglas.

Nota de IT Home: Normalmente, las palabras de aviso del sistema permitirán que el modelo comprenda sus cualidades básicas, así como lo que debe y no debe hacer.

Práctica común en la industria.

Todos los proveedores de IA generativa, desde OpenAI hasta Anthropic, utilizan indicaciones del sistema para evitar (o al menos intentar evitar) que los modelos se comporten mal y para guiar el tono general y el sentimiento de las respuestas de los modelos.

Por ejemplo, una palabra de aviso del sistema podría decirle al modelo que debe ser cortés pero nunca pedir disculpas, o admitir honestamente que no puede saberlo todo.

Sin embargo, los fabricantes pueden mantener en secreto estas palabras de aviso del sistema por motivos como la competencia y para evitar que los malos usuarios eludan la protección de seguridad después de conocer esta información.

Anthropic elige revelar palabras de aviso del sistema

Sin embargo, Anthropic ha estado trabajando duro para presentarse como un proveedor de IA más ético y transparente, y ha presentado el sistema para sus últimos modelos (Claude 3.5 Opus, Sonnet y Haiku) en las aplicaciones Claude para iOS y Android y en la web. .

Alex Albert, jefe de relaciones con desarrolladores de Anthropic, dijo en una publicación en X que Anthropic planea publicar esta información regularmente a medida que actualiza y afina las indicaciones del sistema.