Η Anthropic κυκλοφορεί τις προτροπές του συστήματος για το Claude AI model

Η Anthropic εκδίδει προτροπές συστήματος για το μοντέλο Claude AI

2024-08-27

IT House News στις 27 Αυγούστου, ανέφεραν χθες (26 Αυγούστου) τα τεχνολογικά μέσα Techcrunch.Η Anthropic αποκάλυψε τις «προτροπές συστήματος» του μοντέλου ClaudeAI.

Προτροπή συστήματος

Προκειμένου να επιτραπεί στο μοντέλο AI να κατανοήσει καλύτερα τις ανθρώπινες οδηγίες, το έργο προτροπής περιέχει στην πραγματικότητα δύο επίπεδα βασικού περιεχομένου, προτροπές χρήστη και προτροπές συστήματος:

Λέξεις προτροπής χρήστη: εισαγωγή λέξεων προτροπής από τον χρήστη και, στη συνέχεια, το μοντέλο AI παράγει απαντήσεις με βάση τις λέξεις προτροπής χρήστη.
Λέξεις προτροπής συστήματος: Πρόκειται για προτροπές που δημιουργούνται από το σύστημα και χρησιμοποιούνται συνήθως για να ορίσουν το πλαίσιο μιας συνομιλίας, να παρέχουν καθοδήγηση ή να υπαγορεύουν κανόνες.

Σημείωση από το IT Home: Κανονικά, οι λέξεις προτροπής συστήματος επιτρέπουν στο μοντέλο να κατανοήσει τις βασικές του ιδιότητες, καθώς και τι πρέπει και τι δεν πρέπει να κάνει.

Κοινή πρακτική στον κλάδο

Κάθε παραγωγός προμηθευτής τεχνητής νοημοσύνης από το OpenAI έως το Anthropic χρησιμοποιεί προτροπές συστήματος για να αποτρέψει (ή τουλάχιστον να προσπαθήσει να αποτρέψει) την κακή συμπεριφορά των μοντέλων και να καθοδηγήσει τον συνολικό τόνο και το συναίσθημα των απαντήσεων του μοντέλου.

Για παράδειγμα, μια προτρεπτική λέξη του συστήματος μπορεί να πει στο μοντέλο ότι πρέπει να είναι ευγενικό αλλά ποτέ να απολογείται ή να παραδεχτεί ειλικρινά ότι δεν μπορεί να ξέρει τα πάντα.

Ωστόσο, οι κατασκευαστές ενδέχεται να κρατούν μυστικές αυτές τις προτροπές του συστήματος για λόγους όπως ο ανταγωνισμός και για να εμποδίσουν τους κακούς χρήστες να παρακάμψουν την προστασία ασφαλείας αφού μάθουν αυτές τις πληροφορίες.

Η Anthropic επιλέγει να αποκαλύψει τις προτρεπτικές λέξεις του συστήματος

Ωστόσο, η Anthropic εργάζεται σκληρά για να εμφανιστεί ως ένας πιο ηθικός και διαφανής προμηθευτής τεχνητής νοημοσύνης και έχει αποκαλύψει το σύστημα για τα πιο πρόσφατα μοντέλα της (Claude 3.5 Opus, Sonnet και Haiku) στις εφαρμογές Claude iOS και Android και στον ιστό .

Ο Alex Albert, επικεφαλής των σχέσεων προγραμματιστών της Anthropic, δήλωσε σε μια ανάρτηση στο X ότι η Anthropic σχεδιάζει να δημοσιεύει αυτές τις πληροφορίες τακτικά καθώς ενημερώνει και βελτιώνει τις προτροπές του συστήματος.

νέα

Η Anthropic εκδίδει προτροπές συστήματος για το μοντέλο Claude AI

Εισαγωγή

Τα στοιχεία επικοινωνίας μου