Τα ChatGPT ρυπαίνουν τον ακαδημαϊκό κύκλο

Τα ChatGPT μολύνουν τον ακαδημαϊκό κύκλο

2024-08-01

έξυπνα πράγματα
Συντάχθηκε από τον Chen Junda
EditPanken

Σύμφωνα με μια έκθεση από το κορυφαίο ακαδημαϊκό περιοδικό Nature χθες, η χρήση της γενετικής τεχνητής νοημοσύνης στην ακαδημαϊκή γραφή έχει γνωρίσει εκρηκτική ανάπτυξη. Σχετική έρευνα δείχνει ότι το 10% των περιλήψεων των εργασιών στο PubMed, τη μεγαλύτερη βάση δεδομένων στον βιοϊατρικό τομέα, είναι ύποπτα ότι γράφτηκαν από AI, κάτι που ισοδυναμεί με τη συμμετοχή του AI σε 150.000 εργασίες κάθε χρόνο.

Έρευνα από το Πανεπιστήμιο Εφαρμοσμένων Επιστημών του Βερολίνου στη Γερμανία δείχνει ότι η μέση ακρίβεια των βασικών εργαλείων ανίχνευσης AIGC είναι μόνο 50%, και είναι εύκολο να προσδιοριστεί ότι το περιεχόμενο ανθρώπινης γραφής δημιουργείται από AI. Ωστόσο, πολλά έγγραφα που δημιουργούνται από την τεχνητή νοημοσύνη μπορούν εύκολα να κρυφτούν μέσω παράφρασης, αντικατάστασης συνωνύμων κ.λπ. Επιπλέον, η χρήση εργαλείων τεχνητής νοημοσύνης από φυσικούς αγγλόφωνους είναι πιο δύσκολο να εντοπιστεί.

Παρόλο που τα εργαλεία τεχνητής νοημοσύνης έχουν χρησιμοποιηθεί ευρέως στον ακαδημαϊκό χώρο στο παρελθόν, η χρήση της γενετικής τεχνητής νοημοσύνης για την απευθείας έξοδο εγγράφων ή γραφής ghostwrite εξακολουθεί να είναι αμφιλεγόμενη. Τα εργαλεία τεχνητής νοημοσύνης διευκολύνουν τη λογοκλοπή και μπορεί να οδηγήσουν σε κακή χρήση περιεχομένου που προστατεύεται από πνευματικά δικαιώματα.

Η γραφή με τη βοήθεια τεχνητής νοημοσύνης δεν είναι χωρίς τα πλεονεκτήματά της. Πολλά περιοδικά επιτρέπουν τη χρήση εργαλείων δημιουργίας τεχνητής νοημοσύνης, αλλά απαιτούν από τους συγγραφείς να αποκαλύπτουν τη χρήση τους λεπτομερώς στις εργασίες τους.

1. Η τεχνητή νοημοσύνη μπορεί να εμπλέκεται στη σύνταξη 150.000 περιλήψεων και είναι πιο πιθανό να ανακαλυφθούν οι μη μητρικοί ομιλητές της αγγλικής γλώσσας

Από την κυκλοφορία του ChatGPT στα τέλη του 2022, η χρήση του AI στην ακαδημαϊκή γραφή έχει εκραγεί. Έρευνα από το Πανεπιστήμιο του Tübingen στη Γερμανία δείχνει ότι το πρώτο εξάμηνο του 2024, τουλάχιστον το 10% των περιλήψεων σε βιοϊατρικές εργασίες θα γράφονται με χρήση τεχνητής νοημοσύνης, που ανέρχεται σε περίπου 150.000 εργασίες ετησίως σε ετήσια βάση.

Αυτή η ερευνητική ομάδα ανέλυσε τις περιλήψεις 14 εκατομμυρίων εργασιών στη βάση δεδομένων βιοϊατρικού πεδίου PubMed από το 2010 έως το 2024. Διαπίστωσαν ότι μετά την εμφάνιση των εργαλείων τεχνητής νοημοσύνης που εκπροσωπούνται από το ChatGPT, η χρήση συγκεκριμένων στιλιστικών λέξεων αυξήθηκε ασυνήθιστα. Η ερευνητική ομάδα χρησιμοποίησε τη συχνότητα αυτών των λέξεων για να υπολογίσει την αναλογία των περιλήψεων που γράφτηκαν με χρήση τεχνητής νοημοσύνης.

Οι ερευνητές ανακάλυψαν επίσης ότι η χρήση εργαλείων γραφής AI διέφερε επίσης από χώρα σε χώρα. Τα δεδομένα τους δείχνουν ότι οι εργασίες από χώρες όπως η Κίνα και η Νότια Κορέα χρησιμοποιούν εργαλεία γραφής τεχνητής νοημοσύνης πιο συχνά από ότι έγγραφα από αγγλόφωνες χώρες.

▲ Η χρήση του στυλιστικού λεξιλογίου στην ακαδημαϊκή γραφή έχει αυξηθεί (Πηγή: "Nature")

Σύμφωνα με την ανάλυση της ερευνητικής ομάδας, η συχνότητα χρήσης της τεχνητής νοημοσύνης από συγγραφείς σε αγγλόφωνες χώρες μπορεί να είναι παρόμοια με αυτή σε άλλες χώρες, αλλά ο τρόπος που τη χρησιμοποιούν μπορεί να είναι πιο δύσκολος να εντοπιστεί.

Στην πραγματικότητα, πριν εμφανιστεί αυτό το κύμα γενετικής τεχνητής νοημοσύνης, η τεχνητή νοημοσύνη είχε ήδη χρησιμοποιηθεί σε τομείς όπως η ανακάλυψη φαρμάκων και η πρόβλεψη της δομής των πρωτεϊνών Ένας ρόλος είναι ακόμα βοηθητικός ρόλος.

Η εφαρμογή της γενετικής τεχνητής νοημοσύνης στην ακαδημαϊκή γραφή φέρνει δύο σημαντικά προβλήματα. Από τη μία πλευρά, η λογοκλοπή διευκολύνεται από τη γενετική τεχνητή νοημοσύνη. Οι λογοκλοπές μπορούν να χρησιμοποιήσουν την γενετική τεχνητή νοημοσύνη για να παραφράσουν την έρευνα άλλων ανθρώπων με το στυλ των ακαδημαϊκών περιοδικών Το παραφρασμένο κείμενο είναι γενικά λιγότερο παρόμοιο με το αρχικό κείμενο, επομένως είναι δύσκολο να κριθεί ως λογοκλοπή.

Επιπλέον, το μοντέλο AI καταναλώνει μεγάλη ποσότητα περιεχομένου που προστατεύεται από πνευματικά δικαιώματα κατά τη διαδικασία εκπαίδευσης και το μοντέλο είναι πολύ πιθανό να παράγει περιεχόμενο που προστατεύεται από πνευματικά δικαιώματα στον χρήστη χωρίς καμία προτροπή. Οι New York Times ανακάλυψαν κάποτε ότι το ChatGPT του OpenAI chatbot τεχνητής νοημοσύνης είχε εξάγει απευθείας τις αρχικές λέξεις της αναφοράς των New York Times χωρίς να επισημαίνει την πηγή. Μήνυσαν επίσης το OpenAI για παραβίαση.

2. Τα εργαλεία ανίχνευσης αποτυγχάνουν στο παιχνίδι γάτας και ποντικιού.

Ως απάντηση στην αυξανόμενη χρήση εργαλείων τεχνητής νοημοσύνης, πολλές εταιρείες έχουν λανσάρει εργαλεία ανίχνευσης περιεχομένου AIGC, αλλά αυτά τα εργαλεία απέτυχαν στο «παιχνίδι γάτας και ποντικιού» με τη γενετική τεχνητή νοημοσύνη.

Στα τέλη του περασμένου έτους, αρκετοί μελετητές από το Πανεπιστήμιο Εφαρμοσμένων Επιστημών του Βερολίνου στη Γερμανία δημοσίευσαν μια μελέτη Διαπίστωσαν ότι μόνο 5 από τα 14 εργαλεία ανίχνευσης τεχνητής νοημοσύνης που χρησιμοποιούνται συνήθως στον ακαδημαϊκό χώρο πέτυχαν ποσοστό ακρίβειας άνω του 70%. Η μέση ακρίβεια αναγνώρισης είναι μόνο 50%-60%.

▲Κύρια εργαλεία ανίχνευσης AIGC στην αγορά έχουν κακή απόδοση (Πηγή: Weber-Wulf et al.)

Αυτά τα εργαλεία ανίχνευσης AIGC αποδίδουν ακόμη χειρότερα όταν αντιμετωπίζουν περιεχόμενο που δημιουργείται από τεχνητή νοημοσύνη, το οποίο έχει επεξεργαστεί από ανθρώπους και μεταγράφεται από μηχανές. Με απλές μόνο λειτουργίες, όπως αντικατάσταση συνωνύμων και προσαρμογή σειράς λέξεων, η ακρίβεια του εργαλείου ανίχνευσης AIGC θα μειωθεί σε λιγότερο από 50%. Μελέτες έχουν δείξει ότι η πλήρης ακρίβεια αναγνώρισης των εργαλείων ανίχνευσης AIGC είναι μόνο 50%.

▲05 και 06 στο σχήμα είναι αντίστοιχα το κείμενο μετά από ανθρώπινη επεξεργασία και παράφραση από μηχανή που δημιουργείται από AI Το εργαλείο ανίχνευσης AIGC έχει πολύ κακή απόδοση σε αυτούς τους δύο τύπους κειμένου (Πηγή: Weber-Wulf et al.)

Τα δεδομένα δείχνουν ότι τα εργαλεία αναγνώρισης AIGC στην αγορά έχουν υψηλή ακρίβεια στον εντοπισμό εγγράφων που έχουν γραφτεί από άνθρωπο. Ωστόσο, εάν ο συγγραφέας γράψει πρώτα μια πρωτότυπη εργασία σε μια γλώσσα που είναι εξοικειωμένη και στη συνέχεια ζητήσει από το λογισμικό μετάφρασης να τη μεταφράσει σε άλλη γλώσσα, το εργαλείο αναγνώρισης μπορεί να το κρίνει εσφαλμένα ως AIGC. Αυτό μπορεί να έχει εξαιρετικά αρνητικό αντίκτυπο στην ακαδημαϊκή φήμη ακαδημαϊκών και φοιτητών.

3. Τα όρια μεταξύ της υποβοηθούμενης γραφής και της ακαδημαϊκής ανάρμοστης συμπεριφοράς είναι ασαφή και τα εργαλεία γραφής τεχνητής νοημοσύνης έχουν επίσης την αξία τους.

Ωστόσο, η χρήση εργαλείων δημιουργίας τεχνητής νοημοσύνης φέρνει ευκολία σε ορισμένους ερευνητές. Ο Hend Al-Khalifa, ένας ερευνητής τεχνολογίας πληροφοριών στο Πανεπιστήμιο King Saud στο Ριάντ, μοιράστηκε ότι πριν από την εμφάνιση των εργαλείων παραγωγής τεχνητής νοημοσύνης, πολλοί συνάδελφοι που δεν ήταν ικανοί στα αγγλικά αντιμετώπιζαν μεγάλες δυσκολίες κατά τη συγγραφή εργασιών, και τώρα, αυτοί οι μελετητές μπορούν να επικεντρωθούν για την ίδια την έρευνα χωρίς να ξοδεύετε πολύ χρόνο στη συγγραφή.

Η γραμμή μεταξύ της γραφής με τη βοήθεια τεχνητής νοημοσύνης και της ακαδημαϊκής ανάρμοστης συμπεριφοράς είναι δύσκολο να καθοριστεί. Ο Soheil Feizi, επιστήμονας υπολογιστών στο Πανεπιστήμιο του Maryland, πιστεύει ότι η χρήση γενετικής τεχνητής νοημοσύνης για την παράφραση του περιεχομένου μιας υπάρχουσας εργασίας είναι ξεκάθαρα λογοκλοπή.

Ωστόσο, η χρήση εργαλείων τεχνητής νοημοσύνης για να βοηθήσει στην έκφραση απόψεων δεν θα πρέπει να τιμωρείται. Με την προϋπόθεση της προληπτικής αποκάλυψης της χρήσης εργαλείων τεχνητής νοημοσύνης, οι ερευνητές μπορούν να χρησιμοποιήσουν λεπτομερείς προτροπικές λέξεις για να δημιουργήσουν κείμενο ή να χρησιμοποιήσουν εργαλεία τεχνητής νοημοσύνης για να επεξεργαστούν προσχέδια.

Πολλά περιοδικά έχουν επίσης τυποποιήσει τη χρήση εργαλείων AI στην ακαδημαϊκή γραφή, χωρίς να την απαγορεύουν άμεσα. Το κορυφαίο ακαδημαϊκό περιοδικό "Science" ορίζει ότι η τεχνητή νοημοσύνη δεν μπορεί να συμπεριληφθεί ως συν-συγγραφέας και ο συγγραφέας θα πρέπει να αποκαλύψει το σύστημα τεχνητής νοημοσύνης και τις προτρεπτικές λέξεις που χρησιμοποιούνται και να είναι υπεύθυνος για την ακρίβεια του περιεχομένου και για το εάν υπάρχει υποψία λογοκλοπής.

▲Σχετικοί κανονισμοί για τη χρήση της τεχνητής νοημοσύνης στο ακαδημαϊκό περιοδικό "Science" (Πηγή: Επίσημος ιστότοπος του ακαδημαϊκού περιοδικού "Science")

Το ακαδημαϊκό περιοδικό Nature ορίζει ότι οι ερευνητές πρέπει να καταγράφουν τη χρήση εργαλείων παραγωγής τεχνητής νοημοσύνης στην ενότητα «Μέθοδοι Έρευνας». Οι στατιστικές δείχνουν ότι από τον Οκτώβριο του 2023, 87 από τα 100 κορυφαία περιοδικά έχουν αναπτύξει κατευθυντήριες γραμμές για τη χρήση εργαλείων τεχνητής νοημοσύνης.

Συμπέρασμα: Τα εργαλεία τεχνητής νοημοσύνης δεν είναι μάστιγα, μόνο η αλλαγή του ακαδημαϊκού προσανατολισμού μπορεί να θεραπεύσει τη βασική αιτία

Την περασμένη περίοδο αποφοίτησης πανεπιστημίου, πολλά εγχώρια πανεπιστήμια εισήγαγαν επίσης εργαλεία δοκιμών AIGC στη διαδικασία υπεράσπισης και αναθεώρησης της πτυχιακής εργασίας. Ωστόσο, η εισαγωγή αυτού του δείκτη δεν έχει περιορίσει αποτελεσματικά την ακαδημαϊκή ανάρμοστη συμπεριφορά που σχετίζεται με τα εργαλεία τεχνητής νοημοσύνης. Υπάρχουν επίσης διάφορες υπηρεσίες στην αγορά που ειδικεύονται στη μείωση του ποσοστού τεχνητής νοημοσύνης Αφού κρίθηκαν εσφαλμένα ως δημιουργημένα με τεχνητή νοημοσύνη, πολλά έγγραφα των μαθητών άλλαξαν πέρα από την αναγνώριση λόγω της μείωσης του ποσοστού AI.

Η υιοθέτηση μιας αντίπαλης προσέγγισης στα εργαλεία παραγωγής τεχνητής νοημοσύνης στην ακαδημαϊκή έρευνα ενδέχεται να μην είναι σε θέση να θεραπεύσει αυτό το πρόβλημα. Μελετητές από το Πανεπιστήμιο Εφαρμοσμένων Επιστημών του Βερολίνου στη Γερμανία τόνισαν επίσης συνοψίζοντας την έρευνα ότι το πρόβλημα της κατάχρησης τεχνητής νοημοσύνης στην ακαδημαϊκή γραφή είναι δύσκολο να λυθεί μόνο με την ανίχνευση του AIGC επίλυση αυτού του προβλήματος.

Πηγή: "Φύση"

Νέα

Τα ChatGPT μολύνουν τον ακαδημαϊκό κύκλο

Εισαγωγή

τα στοιχεία επικοινωνίας μου