Κατηγορούμενος για παραβίαση πνευματικών δικαιωμάτων από το «τυραννικό» CNKI, το Secret Tower AI θα μπορούσε κάλλιστα να πει μερικές ακόμα λέξεις

Κατηγορούμενος για παραβίαση πνευματικών δικαιωμάτων από το «τυραννικό» CNKI, το Secret Tower AI θα μπορούσε κάλλιστα να πει λίγα λόγια ακόμα

2024-08-19

Συγγραφέας |. Zhou Xiaoxiao
Email｜[email protected]
Συντάκτης｜Wang Zhaoyang
Email｜[email protected]

Σπασμένος σύνδεσμος

Πρόσφατα, οι χρήστες της αναζήτησης Secret Tower AI θα βρουν μια γραμμή εντυπωσιακού κειμένου στο επάνω μέρος όταν ανοίξουν τον ιστότοπο: "Τελείωσε! Λάβαμε μια επιστολή ειδοποίησης παραβίασης 28 σελίδων από το CNKI."

Κάντε κλικ για να ανοίξετε μια δήλωση από τη Secret Tower, η οποία ανέφερε ότι έλαβε μια επιστολή ειδοποίησης παράβασης από το ηλεκτρονικό περιοδικό "Chinese Academic Journal (CD Edition)" Co., Ltd. - δηλαδή, της επιβλήθηκε πρόστιμο 8.760 για ύποπτη μονοπωλιακή συμπεριφορά και ζητήματα ασφάλειας προσωπικών πληροφοριών 10.000 γιουάν και 50 εκατομμυρίων γιουάν, η CNKI, η οποία ήταν αμφιλεγόμενη, εξέδωσε μια κατηγορία παραβίασης εναντίον της.

Για να συνοψίσουμε, η αναζήτηση MiTa AI μπορεί να αναζητήσει περιεχόμενο CNKI το θεωρεί αυτό παραβίαση και απαιτεί να σταματήσει αμέσως να παρέχει δεδομένα CNKI στις υπηρεσίες αναζήτησης.

"Η εταιρεία μας δεν επιθυμεί την αναζήτηση στον ιστότοπό μας China National Knowledge Infrastructure από τη MiTa Technology. Αποσυνδέστε αμέσως τα αποτελέσματα αναζήτησης από τον ιστότοπό μας. Εάν χρειάζεστε επιχειρηματική συνεργασία, επικοινωνήστε με την εταιρεία μας."

Η MiTa Technology απάντησε σε αυτή τη δήλωση ότι η "ακαδημαϊκή" ενότητα της αναζήτησης MiTa AI περιλαμβάνει μόνο την περίληψη της βιβλιογραφίας και τη βιβλιογραφία της εργασίας και δεν περιλαμβάνει το περιεχόμενο του ίδιου του άρθρου Για να διαβάσετε το κείμενο, πρέπει να μεταβείτε στον ιστότοπο μέσω του συνδέσμου πηγής για να το αποκτήσετε. Σύμφωνα με τα ακαδημαϊκά πρότυπα, η περίληψη και η βιβλιογραφία ενός εγγράφου πρέπει να είναι ανεξάρτητη και αυτονόητη, επιτρέποντας στους αναγνώστες να αποκτήσουν τις απαραίτητες πληροφορίες χωρίς να διαβάσουν το πλήρες κείμενο.

Επί του παρόντος, ορισμένοι σύνδεσμοι στο Secret Tower Academic Search θα μεταβούν στα Δεδομένα Wanfang.

Η Secret Tower AI τονίζει επίσης ότι η αξία της γνώσης βρίσκεται στη ροή της Τα ακαδημαϊκά έγγραφα είναι ένας σημαντικός φορέας των ανθρώπινων πνευματικών επιτευγμάτων και είναι εξαιρετικά αναντικατάστατα. Εάν τα επιστημονικά έγγραφα γίνουν προϊόν πολυτελείας, δεν θα συμβάλει στη δίκαιη πρόσβαση στη γνώση ή στην ανάπτυξη της επιστημονικής έρευνας.

Ωστόσο, μετά τη συζήτηση από την ανθρώπινη σοφία στις ακαδημαϊκές επιδιώξεις, η ενέργεια που δόθηκε από τη Secret Towers ήταν να "σπάσει τη σύνδεση": "Ακόμα και αν δεν καταλαβαίνουμε, σεβόμαστε την επιλογή του CNKI, από εδώ και πέρα, η αναζήτηση τεχνητής νοημοσύνης του Secret Towers δεν θα". Περιλαμβάνει πλέον Τα βιβλιογραφικά και αφηρημένα δεδομένα των εγγράφων CNKI θα περιλαμβάνονται στα βιβλιογραφικά και αφηρημένα δεδομένα άλλων έγκυρων βάσεων γνώσης της Κίνας και της Αγγλικής γλώσσας.

Δηλαδή, η Secret Tower τελικά χειρίστηκε την καταγγελία σύμφωνα με τις απαιτήσεις προσφυγής του CNKI.

Σημαντικά θέματα που δεν εξηγούνται με σαφήνεια

Το Secret Tower AI Search είναι το βασικό προϊόν σε αυτόν τον γύρο της έκρηξης της τεχνητής νοημοσύνης και συχνά συγκρίνεται με το Perplexity της Κίνας. Η Secret Tower είναι επίσης μια εταιρεία σταρ σε αυτόν τον γύρο μεγάλων μοντέλων νεοσύστατων επιχειρήσεων. Η MiTa ιδρύθηκε πριν από τη μεγάλη έκρηξη των μοντέλων, αλλά το βασικό της προϊόν MiTa AI αναζήτησης κυκλοφόρησε επίσημα τον Μάρτιο του τρέχοντος έτους.

Διαφήμιση του Secret Tower στη δορυφορική τηλεόραση Χουνάν

Η ειδοποίηση παραβίασης του CNKI ανέφερε ότι η Mita παρείχε στους χρήστες την ακαδημαϊκή βιβλιογραφία και τα συνοπτικά δεδομένα του CNKI και ήταν ύποπτος για παραβίαση. Από την άποψη αυτή, ο You Yunting, ανώτερος συνεργάτης και δικηγόρος στο δικηγορικό γραφείο Shanghai Dabang, είπε ότι οι ιστοσελίδες διαφέρουν από τις εργασίες Κίνα Οι φορείς εκμετάλλευσης με δεσπόζουσα θέση στην αγορά υπηρεσιών βάσεων δεδομένων δικτύου πρέπει να έχουν εύλογους λόγους να μην επιτρέπουν στο Secret Tower Search να συλλαμβάνει αυτά τα δύο μέρη των δημόσιων πληροφοριών.

Ουσιαστικά, το CNKI ζητά από το Secret Tower να μην ανιχνεύει τον ιστότοπό του. Στο οικοσύστημα των παραδοσιακών μηχανών αναζήτησης, υπάρχουν βασικοί κανόνες για μια τέτοια συμπεριφορά ανιχνευτή συλλογής πληροφοριών - κάθε ιστότοπος και διάφοροι πάροχοι πληροφοριών χρησιμοποιούν ένα αρχείο Robots.txt για να λένε στη μηχανή αναζήτησης ποιο περιεχόμενο μπορεί να ανιχνευτεί και ποιο όχι.

Οι μηχανές αναζήτησης όπως η Baidu και η Google θα ονομάσουν τα δικά τους προγράμματα ανίχνευσης στη διαδικασία για να ενημερώσουν το άλλο μέρος ότι ήταν εκεί και τι έχουν αφαιρέσει. Ωστόσο, αν κρίνουμε από το αρχείο Robots.txt του CNKI, δεν αποκλείει κανένα πρόγραμμα ανίχνευσης.

«Αυτό που είναι ενδιαφέρον είναι ότι παρόλο που το CNKI έστειλε μια επιστολή στη Mita ζητώντας να αποσυνδέσει τον σύνδεσμο, πράγμα που σημαίνει ότι δεν επιτρέπεται να ανιχνεύει περιεχόμενο ιστού, το αρχείο ρομπότ (https://www.cnki.cn/robots.txt) δεν έχει Οι ανιχνευτές μηχανών αναζήτησης απαγορεύονται Σύμφωνα με το περιεχόμενο του αρχείου ρομπότ του CNKI, δεν απαγορεύεται σε κανέναν να ανιχνεύει τις ιστοσελίδες του, μόνο cms, query.html?*, report, paper, qrcode, js, cs, που περιλαμβάνουν τη διεπαφή διαχείρισης παρασκηνίου. και οι ιστοσελίδες καταλόγου στατικών πόρων και συγκεκριμένου περιεχομένου δεν μπορούν να ανιχνευθούν."

Εάν στο άλλο μέρος δεν απαγορεύεται η ανίχνευση σύμφωνα με τους κανόνες του κλάδου, γιατί πρέπει να στείλουμε μια επιστολή ειδοποίησης;

"Πολλοί ανιχνευτές μηχανών αναζήτησης τεχνητής νοημοσύνης δεν ακολουθούν πλέον την πολεμική ηθική. Δεν κατονομάζουν τους δικούς τους ανιχνευτές όπως το παραδοσιακό Baidu, το Google, το Sogou και το Bing, αλλά σέρνονται σιωπηλά και ανώνυμα." Στην πραγματικότητα, αυτοί οι ανώνυμοι ανιχνευτές δεν εκτελούνται απαραίτητα στο όνομα αυτών των εταιρειών αναζήτησης τεχνητής νοημοσύνης. Υπάρχουν πολλές υπηρεσίες ανίχνευσης τρίτων στην αγορά που χρησιμοποιούν διάφορες μεθόδους για να παρακάμψουν αυτές τις βασικές οδηγίες για την ανίχνευση. Το εάν χρησιμοποιήθηκαν αυτές οι υπηρεσίες δεν αναφέρθηκε στην απάντηση του Secret Tower.

Το Peroplexity έχει αντιμετωπίσει παρόμοιες διαμάχες στο παρελθόν.

Εκείνη την εποχή, το περιοδικό Wired και ο προγραμματιστής Robb Knight ερεύνησε και διαπίστωσε ότι το Perplexity δεν συμμορφωνόταν με το πρότυπο robots.txt. Ο ιδρυτής Aravind Srinivas απάντησε σε μια συνέντευξη ότι η Perplexity δεν αγνόησε το Πρωτόκολλο Εξαιρέσεις Ρομπότ... Ο εν λόγω ανιχνευτής ιστού βρέθηκε ότι ανήκει σε τρίτο προμηθευτή.

Αλλά όταν ρωτήθηκε αν θα σταματήσει να χρησιμοποιεί ανιχνευτές τρίτων, είπε απλώς "είναι περίπλοκο". Επιπλέον, η έρευνα εκείνη την εποχή αποκάλυψε ότι σε ορισμένες περιπτώσεις, το Perplexity μπορεί να μην συνόψιζε τα πραγματικά άρθρα, αλλά αντ' αυτού ανακατασκεύασε το περιεχόμενο με βάση τις διευθύνσεις URL και τα ίχνη που είχαν απομείνει στις μηχανές αναζήτησης, όπως αποσπάσματα και μεταδεδομένα. Deja vu.

Σύμφωνα με το άρθρο που δημοσίευσε η MiTa, η ειδοποίηση παράβασης που απέστειλε το CNKI στη MiTa ήταν 28 σελίδων. Το Secret Tower υποκλοπή μόνο της επιστολής ειδοποίησης και τη δημοσίευσε.

Σύμφωνα με όσα έχουν μοιραστεί πολλοί χρήστες στο παρελθόν, ο Secret Tower μπορεί να λάβει μη δημόσιες εργασίες και μπορεί να διαβαστεί απευθείας στην ιστοσελίδα του Secret Tower Αν και αυτά τα έγγραφα PDF είναι συνδεδεμένα με εξωτερικές τοποθεσίες Web βιβλιοθήκης, μπορεί στην πραγματικότητα να αποθηκευτούν στον Secret Tower υπηρέτης. Ο You Yunting πιστεύει ότι εάν ο Secret Tower δημιουργήσει μια βάση δεδομένων ευρετηρίων που περιέχει το πλήρες κείμενο των εγγράφων CNKI, μπορεί να συνιστά παραβίαση.

"Το τμήμα podcast και βιβλιοθήκης της αναζήτησης AI του MiTa έχει μια βάση δεδομένων ευρετηρίου. Η βάση δεδομένων ευρετηρίων που καταλαβαίνω μπορεί να είναι ότι η MiTa έχει δημιουργήσει απευθείας μια βάση δεδομένων ευρετηρίου εσωτερικά για τη βιβλιογραφία που συλλέγεται σε παρτίδες. Όταν ο χρήστης κάνει αναζήτηση, το MiTa θα πραγματοποιήσει αναζήτηση στο δίκτυο. Αντίστοιχη περιεχόμενο σε πραγματικό χρόνο και, στη συνέχεια, χρησιμοποιήστε την τεχνητή νοημοσύνη για να ενσωματώσετε αποτελέσματα αναζήτησης σε πραγματικό χρόνο και ευρετηρίαση περιεχομένου βιβλιοθήκης για να δώσετε απαντήσεις», είπε ο You Yunting. Δηλαδή, αν και η βασική σελίδα αποτελεσμάτων εμφάνισης παρουσιάζει το ευρετήριο με τη μορφή σχολιασμένων πηγών, το "πρωτότυπο κείμενο" μεταφέρεται επίσης στη δική του υπηρεσία.

"Η βάση δεδομένων ευρετηρίου είναι πιθανώς πραγματική. Στην πραγματικότητα, αυτό δεν είναι δύσκολο να αποδειχθεί τεχνικά. Αντιμετωπίσαμε αυτό το πρόβλημα όταν εκπροσωπούσαμε την αγωγή. Συνήθως χρησιμοποιούμε λογισμικό λήψης πακέτων για να εμφανίσουμε την πραγματική διεύθυνση IP του εγγράφου. Εάν η διεύθυνση IP βρίσκεται στον διακομιστή του μυστικού πύργου , σημαίνει ότι παρασχέθηκε από τον Secret Tower."

Επιπλέον, ως μηχανή αναζήτησης τεχνητής νοημοσύνης που βασίζεται σε προεκπαιδευμένα μοντέλα, το κατά πόσον αυτά τα δεδομένα πνευματικής ιδιοκτησίας χρησιμοποιούνται στα δεδομένα εκπαίδευσης είναι ένα πιο σημαντικό ζήτημα.

Όταν τα δεδομένα χαρτιού στην εκπαίδευση έχουν ως αποτέλεσμα το τελικό περιεχόμενο εξόδου στο χρήστη να είναι πολύ συνεπές με το αρχικό κείμενο λόγω του προβλήματος "υπερβολικής τοποθέτησης" που έχει συνήθως το μοντέλο, αυτό έχει εισέλθει στην κατηγορία παραβίασης πνευματικών δικαιωμάτων παρόμοια με "καθαρισμός χαρτιού". "από ορθή χρήση.

Όμως, υπό τέτοιες συνθήκες, το CNKI έχει το δικαίωμα να «προστατεύσει» αυτές τις εργασίες που γράφτηκαν από μεμονωμένους ερευνητές;

"Το HowNet δεν έχει δικαίωμα να διεκδικήσει παραβίαση πνευματικών δικαιωμάτων του Secret Tower Training."

Είπε ότι, παρόλο που περιλαμβάνονται οι περισσότερες εργασίες στον ιστότοπο του CNKI, το CNKI έχει το δικαίωμα να διαδίδει πληροφορίες στο δίκτυο που έχει εξουσιοδοτηθεί από το περιοδικό ή τον συγγραφέα της αναπαραγωγής και της αναπαραγωγής που ορίζονται στο νόμο περί πνευματικών δικαιωμάτων και άλλα δικαιώματα δεν παραβιάζουν τα δικαιώματα διάδοσης του δικτύου πληροφοριών του CNKI. Φυσικά, εάν η εκπαίδευση μυστικών πύργων για την προστασία των δικαιωμάτων του περιοδικού παραβιάζει, τότε ο μυστικός πύργος θα αντιμετωπίσει το ίδιο πρόβλημα με τους New York Times να μηνύσουν το OpenAI.

Ήρθε η ώρα για πιο σοβαρές συζητήσεις

Επομένως, ο στόχος στον οποίο θέλουν να «απαντήσουν» οι μυστικοί πύργοι δεν είναι μόνο το CNKI, το οποίο έχει σχολιαστεί ως «κακό» από τους netizens.

Εκτός από την ανταπόκριση στο CNKI - αυτές οι απαντήσεις προκαλούν πάντα ενσυναίσθηση, κρίνοντας από την ενότητα σχολίων της απάντησής του στο άρθρο, οι άνθρωποι εξακολουθούν να έχουν την ίδια στάση με το CNKI. Οι μεμονωμένοι συγγραφείς πίσω από τα δεδομένα εκπαίδευσης εξηγούν πώς χρησιμοποιούνται τα δεδομένα.

Η αμφιλεγόμενη "ακαδημαϊκή" λειτουργία αναζήτησης είναι ένας σημαντικός σχεδιασμός που διακρίνει το Secret Tower από άλλα Perplexities Αυτή η λειτουργία έχει επίσης κερδίσει επαίνους από πολλούς χρήστες. Αυτοί οι χρήστες είναι συχνά εκείνοι που πρέπει να κάνουν μεγάλο αριθμό αναζητήσεων βιβλιογραφίας για εργασίες όπως εργασίες τάξης, δευτερεύουσα δημιουργία άρθρων, ακόμη και συγγραφή εργασιών.

Για τους πραγματικούς συγγραφείς της εργασίας, η χρήση αυτών των δεδομένων μπορεί να προκαλέσει άλλα προβλήματα.

Ένα πρόσφατο άρθρο του Nature επεσήμανε ότι πολλοί ακαδημαϊκοί εκδότες έχουν εξουσιοδοτήσει εταιρείες τεχνολογίας να έχουν πρόσβαση στις δικές τους εργασίες για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης. Για παράδειγμα, ο Αμερικανός εκδότης Wiley έλαβε άμεσα έσοδα 23 εκατομμυρίων δολαρίων, αφού επέτρεψε σε μια εταιρεία να χρησιμοποιήσει το μοντέλο εκπαίδευσης περιεχομένου της. Και αυτά τα εισοδήματα δεν έχουν καμία σχέση με τους συντάκτες των εφημερίδων.

Εκτός από αυτό το πρόβλημα κατανομής του πραγματικού εισοδήματος που είναι πιθανό να είναι τελικά άλυτο, για αυτούς τους ερευνητές, ορισμένα πολύ σημαντικά συστήματα αξιολόγησης στον ακαδημαϊκό κόσμο έχουν επίσης διαταραχθεί στη διαδικασία δημιουργίας αυτής της «Ακαδημαϊκής αναζήτησης AI». Για παράδειγμα, οι παραπομπές, ένας πολύ σημαντικός δείκτης στον ακαδημαϊκό χώρο, φαίνεται να μην υπάρχουν πλέον σε αυτά τα σενάρια ακαδημαϊκής αναζήτησης AI. Η τυχαιότητα και η μη ερμηνευτικότητα του ίδιου του μεγάλου μοντέλου, καθώς και η μη πληρότητα των δεδομένων, κάνουν τα ακαδημαϊκά αποτελέσματα αναζήτησης που παράγει διαφορετικά από τα πρότυπα κρίσης της ίδιας της ακαδημαϊκής κοινότητας.

Ένας μελετητής είπε στη Silicon Star: Όταν αυτές οι αναζητήσεις τεχνητής νοημοσύνης παράγουν απαντήσεις από μόνες τους, ποια είναι τα κριτήρια για να επιλέξετε ποιες θα επιλέξετε και ποιες όχι; Για τους ακαδημαϊκούς που θεωρούν τον αριθμό των αναφορών ως το πιο άμεσο κριτήριο της περιεκτικότητας σε χρυσό, εάν αυτά τα αποτελέσματα τεχνητής νοημοσύνης γίνονται ολοένα και πιο πολλά και στη συνέχεια χρησιμοποιούνται από πολλούς ερευνητές στις δικές τους εργασίες, είναι και αυτή μια άλλη μορφή ρύπανσης AI SEO;

Αποτελέσματα των ερωτήσεων στο Secret Tower Law

Όσον αφορά την ίδια τη διαφωνία, όταν ο Secret Tower διέγραψε έγγραφα CNKI από τη βάση δεδομένων ευρετηρίου και δεν παρείχε πλέον στους χρήστες τη λειτουργία ηλεκτρονικής ανάγνωσης των εγγράφων CNKI, η διαφωνία για την παραβίαση πνευματικής ιδιοκτησίας ήταν ελάχιστη και ο You Yunting είπε ότι σύμφωνα με το "Anti- Ο νόμος για το αντίστροφο μονοπώλιο και η Σύμβαση για την αυτοπειθαρχία των υπηρεσιών μηχανών αναζήτησης στο Διαδίκτυο, δεν είναι πλέον λογικό για το CNKI να μην επιτρέπει στο Secret Tower Search να καταγράφει αυτά τα δύο μέρη των δημόσιων πληροφοριών.

Αλλά εάν οι εταιρείες αναζήτησης τεχνητής νοημοσύνης θεωρούν τα προϊόντα στα οποία εργάζονται ως μακροπρόθεσμο και σοβαρό θέμα, τότε εκτός από τις μικρές ευλογίες του προϊόντος και κάποιες κομψές συμπεριφορές, είναι επίσης καιρός να αντιμετωπίσουμε αυτά τα περίπλοκα και ρεαλιστικά προβλήματα , και συζητώντας το ανοιχτά με κατάλληλο τρόπο, μόνο τότε μπορούν πραγματικά να ελπίζουν να φτάσουν στην πραγματική ουσία του σημερινού πεδίου πρόσβασης στις πληροφορίες που ελπίζουν να αμφισβητήσουν.

νέα

Κατηγορούμενος για παραβίαση πνευματικών δικαιωμάτων από το «τυραννικό» CNKI, το Secret Tower AI θα μπορούσε κάλλιστα να πει λίγα λόγια ακόμα

Εισαγωγή

Τα στοιχεία επικοινωνίας μου