νέα

Ο πρώτος επιστήμονας AI στον κόσμο! Παρέδωσε 4 κορυφαίες ανακοινώσεις σε επίπεδο συνεδρίου με μια ανάσα, αλλά θα «εξαπατήσει» κρυφά και θα άλλαζε το σενάριο

2024-08-14

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


έξυπνα πράγματα
Συγγραφέας Li Shuiqing
Συντάκτης Yunpeng

Κάθε φορά που η τεχνητή νοημοσύνη σημειώνει σημαντική πρόοδο, οι ερευνητές συχνά αστειεύονται: «Πότε θα αφήσουμε την τεχνητή νοημοσύνη να γράψει χαρτιά για εμάς;»

Τώρα,Η τεχνητή νοημοσύνη δημιουργεί επιστημονικές ερευνητικές εργασίεςέχει γίνει πραγματικότητα και το κόστος γραφής είναι τόσο χαμηλό όσο περίπου.$15

Wisdom News στις 14 Αυγούστου, στις 13 Αυγούστου, η ομάδα Sakana AI της Ιαπωνίας συνεργάστηκε με ερευνητές από το Πανεπιστήμιο της Οξφόρδης και το Πανεπιστήμιο της Βρετανικής Κολομβίας για να ξεκινήσει μιαΟ επιστήμονας της AI, που είναι ένας αυτοματοποιημένος πράκτορας επιστημονικής έρευνας (Agent) που βασίζεται σε ένα μεγάλο μοντέλο.

Δώστε του ένα ευρύ ερευνητικό πεδίο και μπορεί να δημιουργήσει μια εργασία στον τομέα της τεχνητής νοημοσύνης όπως ακριβώς ένας άνθρωπος.

Προγραμματιστής AI«Οι δεξιότητες προγραμματισμού είναι μόνο μέρος της ικανότητας για τους επιστήμονες της τεχνητής νοημοσύνης.Καταιγισμός ιδεών, εκτέλεση κώδικα, σύνοψη πειραματικών αποτελεσμάτων, οπτικοποίηση, αυτόματη αναθεώρησηΔεν είναι μεγάλη υπόθεση.

Για παράδειγμα, η ακόλουθη εργασία με τίτλο "Διπλής κλίμακας διάχυση: Προσαρμοστική εξισορρόπηση χαρακτηριστικών για μοντέλα παραγωγής χαμηλών διαστάσεων" γράφτηκε από επιστήμονες AI. Σε πειράματα που ολοκληρώθηκαν ανεξάρτητα από επιστήμονες τεχνητής νοημοσύνης και αξιολογήθηκαν από συναδέλφους, οι εργασίες που ολοκλήρωσαν έχουν επιτύχει εξαιρετικά εμπειρικά αποτελέσματα και μπόρεσαν να επιτύχουνΗ μηχανική μάθηση πληροί το κριτήριο της «ασθενούς αποδοχής».


Διεύθυνση χαρτιού: https://sakana.ai/assets/ai-scientist/adaptive_dual_scale_denoising.pdf

Η ομάδα ανέφερε διάφορα μοντέλα αιχμής στο έργο του AI scientist, όπως π.χGPT-4o και Σονέτοκ.λπ. μοντέλα κλειστού κώδικα, καιDeepSeek και Llama 3και άλλα μοντέλα ανοιχτού κώδικα.

Αναφέρεται ότι οι επιστήμονες της τεχνητής νοημοσύνης έχουν κυρίως τα ακόλουθα σημεία:

1. Αυτό είναι έναΠλήρως τροφοδοτείται από AIαυτοματοποιημένο σύστημα επιστημονικής έρευνας, με επίκεντροΠεδίο μηχανικής μάθησηςέρευνα.

2. ΠραγματοποιείταιΜελετήστε την αυτοματοποίηση ολόκληρης της αλυσίδας, από την έμπνευση, τη σύνταξη κώδικα και το τρέξιμο μέχρι τη σύνοψη και την οπτικοποίηση των πειραματικών αποτελεσμάτων και τέλος τη συγγραφή μιας ολοκληρωμένης επιστημονικής εργασίας.

3. Εισάγει καινοτόμαΑυτοματοποιημένος μηχανισμός αξιολόγησης από ομοτίμους, που χρησιμοποιείται για την αξιολόγηση των εγγράφων εξόδου, την παροχή ανατροφοδότησης και τη συνεχή βελτιστοποίηση των αποτελεσμάτων,Η ακρίβεια της αξιολόγησης είναι κοντά στο ανθρώπινο επίπεδο

4. Αυτή η αυτοματοποιημένη επιστημονική ερευνητική διαδικασίαΣυνεχής κύκλος, να ανοίγουν και να συσσωρεύουν συνεχώς γνώση και να προσομοιώνουν το μοντέλο λειτουργίας της ανθρώπινης επιστημονικής κοινότητας.

5. Σε προκαταρκτικές δοκιμές, έχει εμπλακεί στη μηχανική μάθησηΕπίτευξη αποτελεσμάτων σε πολλά πεδία, όπως στοΜοντέλο διάχυσης, αρχιτεκτονική μετασχηματιστή και GrokkingΣυνεισφορές έχουν γίνει και σε άλλους τομείς.

Διεύθυνση χαρτιού επιστήμονας AI: https://arxiv.org/abs/2408.06292/
Διεύθυνση ανοιχτού κώδικα και πειραματικών αποτελεσμάτων AI scientist: https://github.com/SakanaAI/AI-Scientist


▲ Η εργασία "AI Scientist: Moving to Fully Automated Open Scientific Discovery"

1. Ολοκληρώστε την επιστημονική ερευνητική εργασία σε 4 βήματα και ανταποκριθείτε στα πρότυπα αποδοχής του AI ​​Summit

Έχω ακούσει για ποιητές τεχνητής νοημοσύνης, ζωγράφους τεχνητής νοημοσύνης, προγραμματιστές τεχνητής νοημοσύνης και τώρα εμφανίστηκαν και επιστήμονες τεχνητής νοημοσύνης.

Το AI Scientist είναι ένα πλήρως αυτοματοποιημένο σύστημα παραγωγής χαρτιού που κάνει πλήρη χρήση μοντέλων αιχμής μεγάλων διαστάσεων.

τοΞεκινήστε με μια βασική αρχική βάση κώδικα, όπως ο έτοιμος ερευνητικός κώδικας ανοιχτού κώδικα στο GitHub, εφόσονδίνεται αΕυρεία ερευνητικά πεδία, οι επιστήμονες της τεχνητής νοημοσύνης μπορούν να ολοκληρώσουν την εργασία απόΔημιουργική σύλληψη, βιβλιογραφική έρευνα, πειραματικός σχεδιασμός, πειραματική επανάληψη, παραγωγή γραφημάτων, συγγραφή χαρτιού για προκαταρκτική αναθεώρησηΗ όλη διαδικασία της εργασίας πραγματοποιείται για την παραγωγή ακαδημαϊκών εργασιών πλούσιων σε βαθιές γνώσεις.

Αυτό που είναι ακόμα πιο εκπληκτικό είναι ότι οι επιστήμονες της τεχνητής νοημοσύνης μπορούνΣυνεχής λειτουργία σε ανοιχτό κύκλο, μαθαίνει συνεχώς προηγούμενες ιδέες και σχόλια για να βελτιστοποιήσει τις μετέπειτα ερευνητικές ιδέεςΠροσομοιώνει το μοντέλο λειτουργίας της ανθρώπινης επιστημονικής κοινότητας


▲ Διάγραμμα μοτίβου επιστήμονα AI

Η ροή εργασίας ενός επιστήμονα AI περιλαμβάνει κυρίωςΤέσσερις κύριοι σύνδεσμοι

Η δημιουργικότητα φυτρώνει:Ξεκινώντας από το δεδομένο πρότυπο εκκίνησης, οι επιστήμονες της τεχνητής νοημοσύνης θα ξεκινήσουν τη λειτουργία "καταιγισμού ιδεών" και θα ανακαλύψουν μια σειρά από νέες ερευνητικές κατευθύνσεις γύρω από υπάρχοντα θέματα. Αυτό το πρότυπο όχι μόνο περιέχει το βασικό πλαίσιο κώδικα, αλλά συνοδεύεται επίσης από έναν φάκελο LaTeX που περιέχει αρχεία στυλ και προεπιλογές τίτλων κεφαλαίων, θέτοντας τα θεμέλια για την επόμενη σύνταξη χαρτιού. Στη διαδικασία της δωρεάν εξερεύνησης, οι επιστήμονες της τεχνητής νοημοσύνης θα χρησιμοποιήσουν επίσης την ακαδημαϊκή μηχανή αναζήτησης Semantic Scholar για να εξασφαλίσουν την πρωτοτυπία των προτεινόμενων ιδεών.

Επανάληψη πειράματος:Μόλις καθοριστεί η κατεύθυνση της έρευνας, οι επιστήμονες της τεχνητής νοημοσύνης εισέρχονται στο πειραματικό στάδιο. Εκτελεί αυτόματα πειραματικά σχέδια, συλλέγει δεδομένα και δημιουργεί γραφήματα για την οπτική εμφάνιση των πειραματικών αποτελεσμάτων. Ταυτόχρονα, οι επιστήμονες της τεχνητής νοημοσύνης θα καταγράφουν τα περιεχόμενα κάθε διαγράμματος λεπτομερώς για να διασφαλίσουν ότι οι πειραματικές σημειώσεις και τα γραφικά υλικά μπορούν να παρέχουν ολοκληρωμένη υποστήριξη για την επόμενη γραφή χαρτιού.

Συγγραφή χαρτιού:Μετά την ολοκλήρωση του πειράματος, ο επιστήμονας AI θα χρησιμοποιήσει τη μορφή LaTeX για να γράψει μια εργασία με σαφή δομή και λεπτομερές περιεχόμενο για να δείξει στους αναγνώστες τα ερευνητικά τους αποτελέσματα. Κατά τη διάρκεια της διαδικασίας συγγραφής, θα χρησιμοποιήσει επίσης το Semantic Scholar για αυτόματη αναζήτηση και αναφορά βιβλιογραφίας σε συναφή πεδία για να ενισχύσει την ακαδημαϊκή και έγκυρη φύση της εργασίας.

Αυτόματος έλεγχος:Προκειμένου να βελτιωθεί η ποιότητα των εργασιών, η ομάδα ανέπτυξε ειδικά ένα αυτοματοποιημένο σύστημα αξιολόγησης βασισμένο σε ένα μεγάλο γλωσσικό μοντέλο. Το σύστημα είναι σε θέση να αξιολογεί αντικειμενικά τα έγγραφα που δημιουργούνται με σχεδόν ανθρώπινη κρίση και να κάνει προτάσεις για βελτίωση. Αυτή η ανατροφοδότηση όχι μόνο βοηθά τους επιστήμονες της τεχνητής νοημοσύνης να βελτιστοποιήσουν τα τρέχοντα έργα, αλλά παρέχει επίσης πολύτιμη αναφορά για μελλοντική έρευνα. Μέσω αυτού του συνεχούς βρόχου ανάδρασης, οι επιστήμονες της τεχνητής νοημοσύνης μπορούν συνεχώς να βελτιώνουν και να βελτιώνουν συνεχώς το επίπεδο και τον αντίκτυπο των ερευνητικών αποτελεσμάτων.

Όταν συνδυάζονται με τεχνολογία αιχμής LLM, οι επιστήμονες της τεχνητής νοημοσύνης μπορούν ακόμη και να γράφουνΚριτήρια «ασθενούς αποδοχής» για κορυφαία συνέδρια μηχανικής μάθησηςδιατριβή και πέρασεΤο αυτοματοποιημένο σύστημα αναθεώρησης κερδίζει αναγνώριση

2. Παρουσίαση εργασιών από επιστήμονες τεχνητής νοημοσύνης: που καλύπτουν μοντέλα διάχυσης, μοντελοποίηση γλώσσας και άλλα πεδία

Στην ανακοίνωση, η ομάδα παρουσίασε μια σειρά εργασιών στον τομέα της μηχανικής μάθησης που δημιουργήθηκε από επιστήμονες AI, επιδεικνύοντας τις επιστημονικές ερευνητικές της ικανότητες σε τομείς όπως τα μοντέλα διάχυσης, η μοντελοποίηση γλώσσας και το Grokking.

1. Μοντέλο διάχυσης: "Διπλής κλίμακας διάχυση: προσαρμοστική εξισορρόπηση χαρακτηριστικών μοντέλων παραγωγής χαμηλής διάστασης"


Διεύθυνση χαρτιού: https://sakana.ai/assets/ai-scientist/adaptive_dual_scale_denoising.pdf
Διεύθυνση κώδικα: https://github.com/SakanaAI/AI-Scientist/tree/main/example_papers/adaptive_dual_scale_denoising

2. Μοντελοποίηση γλώσσας: "StyleFusion: Προσαρμοστική παραγωγή πολλαπλών στυλ σε μοντέλα γλώσσας σε επίπεδο χαρακτήρων"


Διεύθυνση χαρτιού: https://sakana.ai/assets/ai-scientist/multi_style_adapter.pdf
Διεύθυνση κώδικα: https://github.com/SakanaAI/AI-Scientist/tree/main/example_papers/multi_style_adapter

Μοντελοποίηση γλώσσας: "Εφαρμογή του προσαρμοστικού ρυθμού μάθησης του Transformer μέσω Q-Learning"


Διεύθυνση χαρτιού: https://sakana.ai/assets/ai-scientist/rl_lr_adaptation.pdf
Διεύθυνση κώδικα: https://github.com/SakanaAI/AI-Scientist/tree/main/example_papers/rl_lr_adaptation

3. Grokking: "Unlocking Grokking: A Comparative Study of Weight Initialization Strategies in Transformer Models"


Διεύθυνση χαρτιού: https://sakana.ai/assets/ai-scientist/weight_initialization_grokking.pdf
Διεύθυνση κώδικα: https://github.com/SakanaAI/AI-Scientist/tree/main/example_papers/layerwise_lr_grokking

3. Ανεπαρκής ικανότητα «σχεδίασης» και δυσκολία στην ακριβή σύγκριση των μεγεθών δύο αριθμών

Περιορισμένοι από το τρέχον επίπεδο ανάπτυξης μεγάλων μοντέλων, οι επιστήμονες της τεχνητής νοημοσύνης εξακολουθούν να έχουν ελλείψεις.

Επί του παρόντος, οι επιστήμονες της τεχνητής νοημοσύνης εξακολουθούν να είναιΔεν υπάρχουν δυνατότητες οπτικής επεξεργασίας, επομένως δεν μπορεί να διορθώσει αυτόματα οπτικά στοιχεία ή προβλήματα διάταξης διαγράμματος στο χαρτί σας.

Για παράδειγμα, τα γραφήματα που δημιουργεί μερικές φορές δεν είναι σαφή, οι πίνακες μπορεί να υπερβαίνουν τα όρια της σελίδας και η συνολική διάταξη σελίδας είναι συχνά ακατάστατη. Η εισαγωγή πολυτροπικών βασικών μοντέλων αναμένεται να λύσει θεμελιωδώς αυτό το πρόβλημα.

Επιπλέον, όταν οι επιστήμονες της τεχνητής νοημοσύνης εφαρμόζουν ιδέες ή πραγματοποιούν συγκρίσεις βασικής γραμμής, μπορούνΠαραπλανητικά αποτελέσματα λόγω ακατάλληλης λειτουργίας

Ταυτόχρονα, μπορεί περιστασιακά να κάνει πιο σοβαρά λάθη κατά τη συγγραφή και την αξιολόγηση των αποτελεσμάτων, όπως π.χΔυσκολία ακριβούς σύγκρισης δύο αριθμών, που είναι γνωστό ελάττωμα των μεγάλων μοντέλων. Για να μετριαστεί αυτό το πρόβλημα, η ομάδα έχει διασφαλίσει ότι όλα τα πειραματικά αποτελέσματα είναι αναπαραγώγιμα και ότι όλα τα αρχεία εκτέλεσης έχουν αποθηκευτεί σωστά.

Στην έκθεση, η ομάδα παρείχε μια εις βάθος ανάλυση των σημερινών περιορισμών των επιστημόνων της τεχνητής νοημοσύνης και των προκλήσεων που ενδέχεται να αντιμετωπίσουν στο μέλλον.

4. Οι επιστήμονες της τεχνητής νοημοσύνης «παίζουν έξυπνα»: τροποποιούν τα σενάρια από μόνοι τους, προκαλώντας κινδύνους για την ασφάλεια της τεχνητής νοημοσύνης

Η ομάδα παρατήρησε επίσης ότι οι επιστήμονες της τεχνητής νοημοσύνης μερικές φορές προσπαθούν να αυξήσουν τις πιθανότητες επιτυχίας μέσω κάποιας «λίγης εξυπνάδας», όπως π.χ.Τροποποιήστε και εκτελέστε το σενάριο μόνοι σας. Στο έγγραφο, η ομάδα συζήτησε σε βάθος τους κινδύνους ασφάλειας της τεχνητής νοημοσύνης που μπορεί να επιφέρει αυτή η συμπεριφορά.

Για παράδειγμα, κατά τη διάρκεια μιας εκτέλεσης, στην πραγματικότηταΕπεξεργάστηκε τον κώδικα, που εκτελείται σε έναν άπειρο βρόχο μέσω κλήσεων συστήματος.

Μια άλλη φορά, ένα πείραμα διήρκεσε πολύ και επρόκειτο να υπερβεί το όριο χρονικού ορίου που είχε ορίσει η ομάδα, ωστόσο, αντί να βελτιστοποιηθεί ο κώδικας για τη βελτίωση της αποτελεσματικότητας, προσπάθησε να περάσειΤροποποιήστε τον κωδικό για να παρατείνετε το χρονικό όριο

Ακολουθούν ορισμένα συγκεκριμένα παραδείγματα των προσπαθειών του να τροποποιήσει τον κώδικα:



Αυτά τα προβλήματα μπορούν να αμβλυνθούν με sandboxing στο λειτουργικό περιβάλλον των επιστημόνων AI. Στην πλήρη αναφορά, η ομάδα συζητά σε βάθος την ασφαλή εκτέλεση κώδικα και το sandboxing.

Συμπέρασμα: Οι επιστήμονες της τεχνητής νοημοσύνης κάνουν το ντεμπούτο τους και οι ικανότητές τους ανατρεπτικής καινοτομίας πρέπει να επαληθευτούν

Κοιτάζοντας το μέλλον, η Sakana AI είπε ότι στόχος της είναι να εφαρμόσει επιστήμονες τεχνητής νοημοσύνης σε συστήματα κλειστού βρόχου με ανοιχτά μοντέλα για την προώθηση της συνεχούς αυτοβελτίωσης της τεχνητής νοημοσύνης. Οι επιστήμονες της τεχνητής νοημοσύνης θα φέρουν έναν νέο κόσμο της επιστήμης που καθοδηγείται πλήρως από την τεχνητή νοημοσύνη.

Αλλά η Sakana AI δεν πιστεύει ότι η θέση των ανθρώπινων επιστημόνων θα αποδυναμωθεί ως αποτέλεσμα. Αντίθετα, με την εμφάνιση των νέων τεχνολογιών, οι ρόλοι των επιστημόνων θα διαφοροποιηθούν και θα περάσουν σε υψηλότερα επίπεδα στον τομέα της επιστημονικής έρευνας. Η αυτοματοποίηση της διαδικασίας ανακάλυψης της επιστημονικής έρευνας και η ενσωμάτωση μηχανισμών ανασκόπησης με γνώμονα την τεχνητή νοημοσύνη ανοίγουν κυρίως τον δρόμο για καινοτομία και λύσεις στα πιο δύσκολα προβλήματα στον τομέα της επιστήμης και της τεχνολογίας.

Η τρέχουσα έκδοση των επιστημόνων της τεχνητής νοημοσύνης έχει δείξει την εξαιρετική ικανότητα καινοτομίας με βάση τις ώριμες τεχνολογίες, όπως τα μοντέλα διάχυσης και οι μετασχηματιστές, ωστόσο, χρειάζεται ακόμη χρόνος για να επαληθευτεί εάν τέτοια συστήματα μπορούν πραγματικά να δημιουργήσουν νέες ανατρεπτικές ιδέες.

Πηγή: Sakana AI