μελέτη: η επαναλαμβανόμενη χρήση περιεχομένου που δημιουργείται από τεχνητή νοημοσύνη για την εκπαίδευση της τεχνητής νοημοσύνης μπορεί να προκαλέσει "κατάρρευση μοντέλου"

μελέτη: η επαναλαμβανόμενη χρήση περιεχομένου που δημιουργείται από ai για την εκπαίδευση της τεχνητής νοημοσύνης μπορεί να προκαλέσει "κατάρρευση μοντέλου"

2024-09-05

it house news στις 5 σεπτεμβρίου. στις 4 σεπτεμβρίου, τοπική ώρα, σύμφωνα με το forbes, ο δρ ilya shumelov του πανεπιστημίου της οξφόρδης και η ομάδα του ανακάλυψαν ότι όταν το λογισμικό παραγωγής τεχνητής νοημοσύνης βασίζεται μόνο στο περιεχόμενο, η ποιότητα των απαντήσεων αρχίζει να υποβαθμίζεται. η έρευνα δημοσιεύτηκε στο περιοδικό nature.

μετά τις δύο πρώτες ερωτήσεις, οι απαντήσεις σταδιακά απομακρύνθηκαν από την ακρίβεια, στο πέμπτο ερώτημα η ποιότητα έπεσε σημαντικά και στο ένατο συνεχόμενο ερώτημα οι απαντήσεις είχαν εκφυλιστεί τελείως σε ανούσιες ασυναρτησίες. οι ερευνητές αναφέρονται σε αυτήν την κυκλική υπερβολική χρήση του παραγωγικού περιεχομένου ai ως «κατάρρευση μοντέλου», κατά την οποία η έξοδος ai σταδιακά αποκλίνει από την πραγματικότητα και τελικά γίνεται άχρηστη αφού μολύνει συνεχώς το δικό της σύνολο εκπαίδευσης.

"είναι εκπληκτικό το πόσο γρήγορα και ανεπαίσθητα συμβαίνει η κατάρρευση του μοντέλου", είπε ο shumelov "αρχικά, επηρεάζει έναν μικρό αριθμό δεδομένων - αυτά που υποεκπροσωπούνται. στη συνέχεια, επηρεάζει την ποικιλομορφία της παραγωγής, οδηγώντας σε μειωμένη μεταβλητότητα. μερικές φορές θα παρατηρήσετε. μικρές βελτιώσεις στην πλειονότητα των δεδομένων, αλλά αυτή η βελτίωση καλύπτει μια επιδείνωση της απόδοσης του μοντέλου σε μια μειοψηφία δεδομένων."

οι ερευνητές εντόπισαν την ύπαρξη «κατάρρευσης μοντέλου» χρησιμοποιώντας μια προεκπαιδευμένη wikipedia με τεχνητή νοημοσύνη και στη συνέχεια αφήνοντας το μοντέλο ai να ενημερώνεται με βάση το περιεχόμενο που παρήγαγε. η επίδραση των μολυσμένων δεδομένων προκαλεί σταδιακά τη διάβρωση του αρχικού σετ εκπαίδευσης και οι πληροφορίες εξόδου γίνονται δυσνόητες. για παράδειγμα, μετά τον ένατο κύκλο ερωτημάτων, το υπό μελέτη λήμμα της wikipedia άλλαξε κωμικά από κάτι σχετικά με ένα αγγλικό καμπαναριό εκκλησίας του 14ου αιώνα σε ένα χαρτί για κουνέλια κουνέλια διαφόρων χρωμάτων.

σύμφωνα με αναφορές, σύμφωνα με μια άλλη μελέτη που κυκλοφόρησε από την ομάδα υπηρεσιών web της amazon τον ιούνιο, περίπου το 57% του διαδικτυακού κειμένου έχει μεταφραστεί από αλγόριθμους ai. εάν τα δεδομένα που δημιουργούνται από τον άνθρωπο στο διαδίκτυο αντικαθίστανται γρήγορα από περιεχόμενο φιλτραρισμένο με ai και εάν τα ευρήματα της έρευνας του shumeilov είναι αληθινά, τότε η τεχνητή νοημοσύνη μπορεί να «αυτοκαταστρέφεται» — και ταυτόχρονα να καταστρέφει το διαδίκτυο.

η μελέτη κατέληξε στο συμπέρασμα ότι ο μόνος τρόπος για να επιτευχθεί μακροπρόθεσμη βιώσιμη ανάπτυξη της τεχνητής νοημοσύνης είναι να διασφαλιστεί ότι έχει πρόσβαση σε υπάρχον περιεχόμενο που δεν δημιουργείται από τεχνητή νοημοσύνη και συνεχίζει να εισάγει νέο περιεχόμενο που δημιουργείται από τον άνθρωπο.

νέα

μελέτη: η επαναλαμβανόμενη χρήση περιεχομένου που δημιουργείται από ai για την εκπαίδευση της τεχνητής νοημοσύνης μπορεί να προκαλέσει "κατάρρευση μοντέλου"

εισαγωγή

τα στοιχεία επικοινωνίας μου