Όταν οι Πράκτορες αρχίσουν να δημιουργούν οι ίδιοι, η έκρηξη προϊόντων τεχνητής νοημοσύνης θα είναι ακόμα ένα μακρινό όνειρο;

2024-08-21

TencentΟ συγγραφέας τεχνολογίας Hao Boyang

Συντάκτης Zheng Kejun

2024,Όλα συμπεριλαμβάνονται Το πιο καυτό θέμα στον τομέα είναι αναμφίβολα ο Πράκτορας.

“μεγάλο μοντέλοΩραίο, αλλά τι μπορώ να το κάνω; «Αυτή είναι η ετήσια ερώτηση εφαρμογής AI το 2023. Μέχρι το 2024, οι πράκτορες έχουν γίνει το πιο πολλά υποσχόμενο αντίδοτο σε αυτό το πρόβλημα.

Οι ευφυείς πράκτορες μπορούν να χρησιμοποιηθούν μέσω πολύπλοκων διαδικασιών και εργαλείων, επιτρέποντας σε μεγάλα μοντέλα να χειρίζονται πιο σύνθετες και προσαρμοσμένες εργασίες, παράγοντας τελικά οντότητες λογισμικού ή φυσικές οντότητες με αυτονομία, αντίληψη, λήψη αποφάσεων και δυνατότητες δράσης. Οι Ng Enda, Jim Fan και άλλα μεγάλα ονόματα του κλάδου έχουν ενταχθεί για να αποδείξουν την αποτελεσματικότητα του ευφυούς πράκτορα.

Ο καθηγητής Ng Enda πρότεινε στο blog του τον Μάρτιο του τρέχοντος έτους ότι θα έπρεπε να χρησιμοποιηθεί στο σύνολο δεδομένων HumanEval GPT-3.5Η ακρίβεια δοκιμής (μηδενικής βολής) είναι 48,1%. GPT-4(Μηδενική βολή) είναι 67,0%. Σε συνεργασία με τη ροή εργασίας Agent, το GPT-3.5 πέτυχε ποσοστό ακρίβειας 95,1%.

(Σημείωση εικόνας: τα πειράματα του Ng Enda, υπό την τεχνολογία ευφυών πρακτόρων,GPT Η απόδοση 3,5 υπερβαίνει κατά πολύ την αρχική GPT4)

Ως εκ τούτου, κατά τη διάρκεια του περασμένου έτους, όλοι, από μεγάλες εταιρείες έως ιδιωτικούς ειδικούς κατασκεύαζαν έξυπνα σώματα. αρκετά μεγάλοMicrosoftΤο Copilit, ανόητες μάντεις τεχνητής νοημοσύνης, εργαλεία για τη δημιουργία ευφυών πλαισίων πρακτόρων όπως το Langchain, το Coze και το Dify έχουν επίσης εμφανιστεί σαν μανιτάρια μετά τη βροχή και η δημοτικότητά τους συνεχίζει να αυξάνεται.

(Σημείωση εικόνας: Εταιρείες που σχετίζονται με πράκτορες και διαδικασίες αυτοματισμού τεχνητής νοημοσύνης που συγκεντρώθηκαν από την INSIGHT)

Ο Andrew Karpathy, πρώην επιστήμονας στο OpenAI, είπε κάποτε ότι οι απλοί άνθρωποι, οι επιχειρηματίες και οι geeks είναι λιγότερο πιθανό να δημιουργήσουν πράκτορες AI απόOpenAIΤέτοιες εταιρείες έχουν ακόμη και ένα πλεονέκτημα.

Έρχεται μια νέα εποχή διαχειριστών προϊόντων που βασίζονται στη ροή εργασιών του πράκτορα AI; Όχι απαραίτητα, γιατί η τεχνητή νοημοσύνη μπορεί να είναι καλύτερη στην κατασκευή ευφυών πρακτόρων από τους ανθρώπους.

Αυτοματοποιημένη λογική βρόχου

Στις 19 Αυγούστου, τρεις ερευνητές από το Πανεπιστήμιο της Βρετανικής Κολομβίας δημοσίευσαν μια εργασία με τίτλο «Αυτοματοποιημένος Σχεδιασμός Συστημάτων Πρακτόρων». Σε αυτό το άρθρο, σχεδίασε ένα σύστημα που επιτρέπει στην τεχνητή νοημοσύνη να ανακαλύπτει και να δημιουργεί πράκτορες από μόνη της, και μπορεί να επαναλάβει μόνη της.

Θυμηθείτε τον κλασικό ορισμό του OpenAI για έναν πράκτορα.

Όταν χρησιμοποιούμε τη ροή εργασίας για τη δημιουργία πρακτόρων, χρησιμοποιούμε επίσης την υπάρχουσα γνώση (γνώση σχετικά με τη μορφή των πρακτόρων) για να σχεδιάσουμε μόνοι μας (διαδικασίες κατασκευής) και χρησιμοποιούμε εργαλεία (πρόσβαση σε API) για να εκτελέσουμε τελικά το αποτέλεσμα ο ίδιος ο πράκτορας.

Γιατί λοιπόν να μην δημιουργήσετε έναν πράκτορα που να μπορεί αυτόματα να ανακαλύψει και να σχεδιάσει πράκτορες;

Ο συγγραφέας της εργασίας ακολουθεί αυτή την ιδέα και αποκαλεί τον σχεδιαστή μετα-πράκτορα, από τον οποίο ζητά να σχεδιάσει νέους πράκτορες. Προσθέστε τον σχεδιασμένο παράγοντα στη βάση δεδομένων ως δεδομένα και επαναλάβετε συνεχώς νέες και ισχυρότερες εκδόσεις του πράκτορα.

Όλο αυτό το σύνολο μεθόδων το ονομάζουν ADAS (Αυτοματοποιημένος Σχεδιασμός Ευφυών Συστημάτων).

Λοιπόν, πώς ακριβώς τίθεται σε ισχύ αυτό το σύστημα;

Αφήστε την αλυσίδα να γυρίσει

Η διαδικασία δημιουργίας νέων πρακτόρων στα συστήματα ADAS μπορεί να χωριστεί σε τρία μέρη:

Το πρώτο μέρος δημιουργεί τον χώρο αναζήτησης, ο οποίος μπορεί να γίνει κατανοητός ως χρήση ορισμένων βασικών εργαλείων και κανόνων για το σχεδιασμό πιθανών νέων πρακτόρων.

Το δεύτερο μέρος είναι να εκτελέσετε την αναζήτησηαλγόριθμος, το οποίο ορίζει πώς ο μετα-πράκτορας χρησιμοποιεί τον χώρο αναζήτησης και χρησιμοποιεί τα στοιχεία του για να δημιουργήσει συγκεκριμένα νέους πράκτορες.

Το τελευταίο μέρος είναι η εκτέλεση της συνάρτησης αξιολόγησης, η οποία θα αξιολογήσει τον κατασκευασμένο παράγοντα με βάση την απόδοση και άλλους στόχους.

Οι ερευνητές εξηγούν βήμα προς βήμα πώς να δημιουργήσουν τα παραπάνω τρία βασικά μέρη στο έγγραφο.

Αρχικά, πρέπει να καθοριστούν τα βασικά στοιχεία για την κατασκευή του χώρου αναζήτησης Οι ερευνητές πιστεύουν ότι η καλύτερη μέθοδος είναι ο κώδικας.

Αυτό συμβαίνει επειδή ο κωδικός είναι πλήρης Turing και μπορεί να εκφράσει όλες τις πιθανότητες. Έτσι, θεωρητικά, οι μετα-πράκτορες μπορούν να ανακαλύψουν οποιαδήποτε πιθανά δομικά στοιχεία (όπως υποδείξεις, χρήση εργαλείων, ροές ελέγχου) και συστήματα πρακτόρων που συνδυάζουν αυτά τα δομικά στοιχεία με οποιονδήποτε τρόπο.

Το πιο σημαντικό είναι ότι οι διάφορες ροές εργασίας που υπάρχουν ήδη σε ιστότοπους όπως το Langchain για κατασκευαστικούς πράκτορες έχουν κωδικοποιηθεί. Επομένως, τα σχετικά δεδομένα είναι στα χέρια σας και δεν χρειάζεται να τα μετατρέψετε ξανά. Οι κλήσεις εργαλείων, όπως το RAG (ανάκτηση επαυξημένης παραγωγής) και άλλα στοιχεία δυνατοτήτων έχουν ήδη μια πολύ επαρκή βάση κώδικα.

Η χρήση κώδικα για τη δημιουργία του χώρου αναζήτησης σημαίνει επίσης ότι οι πράκτορες που δημιουργούνται από το ADAS μπορούν να εκτελεστούν απευθείας για τη διόρθωση σφαλμάτων και την εκτέλεση βαθμολογιών χωρίς μη αυτόματη παρέμβαση.

Αφού ορίσουν τον χώρο αναζήτησης, οι ερευνητές αρχίζουν να σχεδιάζουν αλγόριθμους αναζήτησης, οι οποίοι επιτρέπουν στον μετα-πράκτορα να εξερευνήσει πιθανούς τρόπους για να ολοκληρώσει την εργασία. Αυτή η διαδικασία ουσιαστικά ολοκληρώνεται βασιζόμενη στο έργο της άμεσης λέξης.

Το πρώτο είναι να του δώσετε μια σειρά από λέξεις που προτρέπουν το σύστημα.

Στη συνέχεια, βάλτε τα βασικάΤαχύςΟι αναφερόμενες πληροφορίες δίνονται στον μετα-πράκτορα, συμπεριλαμβανομένων

1. Βασική περιγραφή της εργασίας.

2. Ο πιο βασικός κώδικας πλαισίου, όπως προτροπές μορφοποίησης, ενθυλάκωση και άλλα ονόματα λειτουργιών, καθώς και η δυνατότητα κλήσης άλλων βασικών μοντέλων (FM) και API.

(Σημείωση εικόνας: μέρος του κώδικα πλαισίου)

3. Μορφή και παραδείγματα εισόδου και εξόδου εργασιών.

4. Μια βιβλιοθήκη δειγμάτων που σχηματίζεται από ορισμένους παράγοντες που δημιουργήθηκαν στην αρχική επανάληψη, συμπεριλαμβανομένων των βασικών αποτελεσμάτων δοκιμής τους.

(Σημείωση εικόνας: Ένα παράδειγμα σε μια ευφυή βιβλιοθήκη πρακτόρων)

Με βάση αυτές τις βασικές υποδείξεις, το ADAS μπορεί να αρχίσει να λειτουργεί και να δημιουργήσει έναν έξυπνο πράκτορα για να λύσει ένα συγκεκριμένο πρόβλημα.

Σε αυτή τη διαδικασία, ο μετα-πράκτορας θα πραγματοποιήσει δύο γύρους αναστοχασμού για να διασφαλίσει ότι ο παράγοντας που δημιουργείται είναι νέος και σωστός. Ελέγχει εάν το πλαίσιο κώδικα που δημιουργήθηκε πρόσφατα έχει σφάλματα και εάν είναι αρκετά καινοτόμο σε σύγκριση με προηγούμενα αποτελέσματα στη βιβλιοθήκη παραδειγμάτων πράκτορα.

Ο μετα-πράκτορας πρέπει επίσης να διεξάγει μια προκαταρκτική αξιολόγηση του παραγόμενου παράγοντα με βάση την «κατανόησή» του των πρακτικών δυνατοτήτων απόδοσης για να προσδιορίσει εάν αποδίδει καλύτερα από τον προηγούμενο παράγοντα.

Όταν ορισμένες από αυτές τις προϋποθέσεις δεν πληρούνται, ο μετα-πράκτορας πρέπει είτε να τροποποιήσει τον παράγοντα που δημιουργείται είτε απλώς να τον ξαναδημιουργήσει.

(Προτροπή για τον πρώτο γύρο προβληματισμού)

Μετά από δύο γύρους προβληματισμού και τροποποίησης, ο μετα-πράκτορας θα στείλει τον νέο παράγοντα που αισθάνεται ότι είναι νέος και καλός στο σύστημα αξιολόγησης στο τρίτο βήμα.

Το σύστημα αξιολόγησης θα δώσει μια αντικειμενική βαθμολογία στην ικανότητα του πράκτορα με βάση το βασικό τεστ και στη συνέχεια θα την επιστρέψει στη βιβλιοθήκη παραδειγμάτων πράκτορα.

Ο μετα-πράκτορας θα συνεχίσει να βελτιστοποιεί την επόμενη επανάληψη με βάση τα προηγούμενα αποτελέσματα βαθμολόγησης και προηγούμενα παραδείγματα στη βιβλιοθήκη παραδειγμάτων για να επιτύχει υψηλότερη βαθμολογία απόδοσης εργασίας.

Μια ολόκληρη πλήρως αυτοματοποιημένη αλυσίδα γεννήθηκε σε αυτή τη διαδικασία. Για να δημιουργήσετε έναν εξαιρετικά αποτελεσματικό παράγοντα, μπορεί να χρειαστούν περισσότερα από διψήφια επαναλήψεις.

Πέρα από την ευφυΐα που τρίβει τα χέρια

Πόσο πολύπλοκοι μπορεί να είναι οι έξυπνοι πράκτορες που λαμβάνονται με την αυτοματοποίηση των διαδικασιών μέσω των μεθόδων ADAS; Η παρακάτω εικόνα είναι ένα πλαίσιο πράκτορα που δημιουργήθηκε μετά από 14 επαναλήψεις.

Υπάρχουν πέντε αλυσίδες σκέψης στη δομή αυτού του παράγοντα που δίνουν προκαταρκτικές απαντήσεις. Μετά από σχόλια από τρία μοντέλα ειδικών ειδικών και ένα μοντέλο που μιμείται την ανθρώπινη αξιολόγηση, οι απαντήσεις τροποποιούνται και βελτιώνονται τρεις φορές κατά το στάδιο της διαδικασίας βελτιστοποίησης. Τέλος, τρία αποτελέσματα εξετάστηκαν μετά από αξιολόγηση και συνδυάστηκαν για να δώσουν την τελική απάντηση.

Εάν ένας άνθρωπος επρόκειτο να χειριστεί αυτό το επίπεδο πολυπλοκότητας, θα χρειαζόταν πιθανώς μια εβδομάδα. Αυτή είναι ακριβώς η ώρα για να γράψετε προτροπές και να σχεδιάσετε την αρχιτεκτονική, για να μην αναφέρουμε τη δοκιμή και την οριζόντια σύγκριση.

Φυσικά, αυτό είναι επίσης το αποτέλεσμα της συνεχούς επανάληψης στο σχεδιασμό του μετα-πράκτορα.

Κατά τη διάρκεια της επαναληπτικής διαδικασίας, η ικανότητά του να δημιουργεί ευφυείς παράγοντες αυξάνεται επίσης γρήγορα με τον αριθμό των επαναλήψεων. Στην τρίτη επανάληψη, ο μετα-πράκτορας έμαθε από μόνος του τη στρατηγική αλυσίδας πολλαπλής σκέψης και στην τέταρτη επανάληψη έμαθε να χρησιμοποιεί δυναμική μνήμη για τη βελτιστοποίηση των απαντήσεων. Την 14η φορά, ο παράγοντας που παρήγαγε έφτασε στην πολυπλοκότητα που αναφέρθηκε παραπάνω.

Τελικά, η ικανότητα της βέλτιστης λύσης του βελτιώθηκε περισσότερο από 250% σε σύγκριση με το αρχικό μοντέλο απλής μεγάλης γλώσσας και βελτιώθηκε κατά 75% σε σύγκριση με τον χειροκίνητο πράκτορα με την καλύτερη απόδοση COT-SC (απάντηση αλυσίδας πολλαπλών σκέψεων) μέθοδος.

Όχι μόνο το ARC, οι πράκτορες που δημιουργούνται στη λειτουργία ADAS είναι σημαντικά πιο ισχυροί σε όλες τις πτυχές από όλους τους τρέχοντες ισχυρότερους βασικούς παράγοντες που τρίβονται με το χέρι, όπως το COT, το LLM Debate και το Self-Refine. Και όσο πιο πολύπλοκες εργασίες και εφαρμογές μεταξύ τομέων υποβάλλονται σε επεξεργασία, τόσο ισχυρότεροι είναι οι έξυπνοι πράκτορες που δημιουργούνται από το ADAS.

Επιπλέον, αυτοί οι ίδιοι οι παραγόμενοι παράγοντες έχουν ορισμένες δυνατότητες μετανάστευσης. Για παράδειγμα, οι πράκτορες που μπορούν να λύσουν επιστημονικά προβλήματα μπορούν επίσης να επιτύχουν καλά αποτελέσματα στα μαθηματικά. Επομένως, ένα βέλτιστο πλαίσιο είναι πιθανό να είναι σε θέση να λύσει σχετικά προβλήματα σε πολλούς τομείς.

Αν και η εποχή των πρακτόρων που τρίβουν τα χέρια πλησιάζει στο τέλος της, η εποχή της ανακάλυψης των παραδειγμάτων πρακτόρων μπορεί να συνεχιστεί. Στη συνολική δοκιμή, η ADAS δεν ανακάλυψε νέες μεθόδους κατασκευής εκτός του τρέχοντος παραδείγματος κατασκευής ευφυών πρακτόρων, αλλά αναδιοργάνωσε και χρησιμοποίησε αυτές τις μεθόδους.

Ωστόσο, για τον μέσο προγραμματιστή AI Agent, αυτό είναι αρκετό για να αντικαταστήσει την εργασία του.

Ωστόσο, η δημοτικότητα του ADAS μπορεί να χρειαστεί ακόμα να ξεπεράσει ένα εμπόδιο, και αυτό είναι το ζήτημα του κόστους.

Σύμφωνα με τους ερευνητές, το OpenAI API κοστίζει περίπου $500 για μια αναζήτηση και αξιολόγηση στο ARC και περίπου $300 για μια μεμονωμένη εκτέλεση στον τομέα της συλλογιστικής και της επίλυσης προβλημάτων. Αυτό είναι περίπου 20 $ ανά επανάληψη. Σε σύγκριση με τόσο υψηλό κόστος, το ανθρώπινο δυναμικό εξακολουθεί να έχει ορισμένα πλεονεκτήματα σε αυτό το στάδιο.

Αλλά οι ερευνητές είπαν επίσης ότι επειδή το μελέτησαν νωρίς, χρησιμοποίησαν το μοντέλο "gpt-3.5-turbo-0125". Το τελευταίο μοντέλο GPT-4 "gpt-4o-mini" είναι λιγότερο από το ένα τρίτο της τιμής του "gpt-3.5-turbo-0125" και έχει καλύτερες επιδόσεις. Επιπλέον, τα πειράματα δείχνουν ότι ένας παράγοντας που επαναλαμβάνεται με δυνατότητες GPT 3.5 θα εισέλθει σε ένα σημείο συμφόρησης απόδοσης μετά από έναν ορισμένο αριθμό επαναλήψεων και όλες οι επαναλήψεις μετά από δεκατέσσερις φορές είναι χαμένες. Επομένως, σχέδια με καλύτερη αξιολόγηση και διαχείριση πόρων μπορούν επίσης να μειώσουν σημαντικά το κόστος.

Προφανώς, το πλεονέκτημα τιμής της εργασίας δεν μπορεί να διατηρηθεί για πολύ.

Έχει πραγματικά ξεκινήσει η έκρηξη της νοημοσύνης;

Γιατί είναι τόσο σημαντική αυτή η αυτοματοποιημένη τεχνολογία;

Στην εποχή του Διαδικτύου για κινητά, ανθίζουν διάφορες εφαρμογές για διάφορα κομμάτια, που μαζί δημιουργούν μια εποχή τεχνολογικής ευημερίας. Ωστόσο, επειδή τα νέα εργαλεία εκείνη την εποχή απαιτούσαν μάθηση, η ανάπτυξη εφαρμογών για κινητά πέρασε επίσης από ένα μακρύ στάδιο διείσδυσης προτού επιτέλους φιλοξενηθούν αρκετοί προγραμματιστές.

Σε παλαιότερες εποχές, αυτό ήταν πιο αργό. Σύμφωνα με τη θεωρία «διασχίζοντας το χάσμα» που προτάθηκε από τον Geoffrey Moore με βάση την εμπειρία του προσωπικού υπολογιστή στη δεκαετία του 1990, στα πρώτα χρόνια της εμφάνισης της τεχνολογίας, μόνο το 13,5% περίπου των πρώτων υιοθέτητων θα χρησιμοποιούσε αυτή την τεχνολογία .

Ως εκ τούτου, η έλλειψη προγραμματιστών μπορεί να είναι ένα σημαντικό εμπόδιο στην προώθηση της τεχνολογίας.

Φυσικά, η ταχύτητα ανάπτυξης και διείσδυσης της κατασκευής έξυπνων πρακτόρων μπορεί να είναι πολύ πιο γρήγορη. Επειδή είναι πολύ πιο απλό από την προηγούμενη ανάπτυξη λογισμικού. Για παράδειγμα, το Wordware, το οποίο έγινε δημοφιλές πριν από λίγο καιρό, επιτρέπει στους απλούς χρήστες να ολοκληρώσουν την κατασκευή έξυπνων πρακτόρων χρησιμοποιώντας φυσική γλώσσα, γεγονός που μειώνει το όριο.

Ωστόσο, σχέδια όπως οι αλυσίδες σκέψης και οι βρόχοι πολλαπλών βημάτων εξακολουθούν να είναι πολύ περίπλοκα και χρειάζονται όλο και περισσότερα εργαλεία στη διαδικασία. Επομένως, δεν υπάρχουν πολλοί άνθρωποι που μπορούν πραγματικά να αφοσιωθούν στην ανάπτυξη ευφυών πρακτόρων και να κάνουν καλή χρήση αυτού του εργαλείου.

Ο Zuckerberg είπε κάποτε σε μια συνομιλία με τον Huang Renxun ότι ακόμα κι αν η τεχνολογία μοντέλων μεγάλης κλίμακας δεν αναπτύσσεται πλέον, θα χρειαστούν πέντε χρόνια για να κατανοήσουμε πλήρως τις δυνατότητες των ευφυών πρακτόρων.

Επομένως, σε σύγκριση με την τεχνολογία, οι προγραμματιστές μπορεί να είναι το βασικό σημείο συμφόρησης για ευφυείς πράκτορες που δεν έχουν ακόμη εκραγεί. Υπάρχουν ακόμα πολύ λίγοι άνθρωποι που μπορούν να το κάνουν αυτό.

Ωστόσο, υπάρχουν πολλοί Πράκτορες.

Εάν αυτή η τεχνολογία αυτόματης παραγωγής πρακτόρων συντονισμού υιοθετηθεί και βελτιστοποιηθεί από περισσότερες εμπορικές εταιρείες, η συμφόρηση του πρώιμου τεχνικού προσωπικού φυσικά δεν θα υπάρχει πλέον. Η ταχύτητα με την οποία οι πράκτορες μπορούν να εξερευνήσουν την κάλυψη και το βάθος των δυνατοτήτων σε διάφορους τομείς θα αυξηθεί σημαντικά.

Ίσως τον επόμενο χρόνο θα κυκλοφορήσει η πρώτη εφαρμογή Killer AI στην ανθρώπινη ιστορία και ο συγγραφέας είναι AI.

νέα