Η ομάδα του Claude προκάλεσε την οργή του κοινού και έκανε ό,τι χρειαζόταν για την ανίχνευση δεδομένων, αλλάζοντας το όνομα του προγράμματος ανίχνευσης για να αγνοήσει τους κανόνες απαγόρευσης

Η ομάδα του Claude προκάλεσε την οργή του κοινού κάνοντας ό,τι χρειαζόταν για την ανίχνευση δεδομένων, αλλάζοντας το όνομα του ανιχνευτή και αγνοώντας τους κανόνες απαγόρευσης.

2024-07-31

Το σπίτι προέρχεται από το ναό Aofei
Qubits | Δημόσιος λογαριασμός QbitAI

Η ομάδα του Κλοντ προκάλεσε την οργή του κοινού αυτή τη φορά!

λόγος:Επισκεφτείτε τον διακομιστή μιας εταιρείας 1 εκατομμύριο φορές μέσα σε 24 ώρες και ανιχνεύστε το περιεχόμενο του ιστότοπου δωρεάν.

Όχι μόνο αγνόησαν κατάφωρα την ανακοίνωση "χωρίς ανίχνευση", αλλά επίσης κατέλαβαν βίαια τους πόρους του διακομιστή.

Η εταιρεία «θύμα» στην πραγματικότητα προσπάθησε να υπερασπιστεί τον εαυτό της, αλλά δεν κατάφερε να το σταματήσει και τα δεδομένα περιεχομένου εξακολουθούσαν να καταγράφονται από τον Claude.

Ο υπεύθυνος της εταιρείας ήταν τόσο θυμωμένος που φύσηξε τα γένια του και κοίταξε και άνοιξε με πάθος το μικρόφωνο στο x:

Γεια σου Anthropic, ξέρω ότι πεινάς για δεδομένα. Ο Claude είναι πραγματικά έξυπνος!
Τα κατάφερες όμως δεν είναι καθόλου έτσι! δροσερός! ω!

Πολλοί χρήστες του Διαδικτύου ενοχλήθηκαν από αυτό.

“Προτείνω να χρησιμοποιήσετε το «steal» αντί του «not pay» για να περιγράψετε αυτή τη συμπεριφορά του Anthropic。”

Ξαφνικά, το πλήθος έγινε έξαλλο!

Όσοι υποστήριξαν την καταγγελία και εκείνοι που ζήτησαν από τον Claude να πληρώσει, έκαναν την περιοχή των σχολίων ένα χάος.

Πώς πάει αυτό

Η εταιρεία που καταδικάζει έντονα την Anthropic ονομάζεταιτο φτιάχνω, είναι ένας αμερικανικός ιστότοπος ηλεκτρονικού εμπορίου και οδηγίες χρήσης.

Μέρος της επιχείρησης του iFixit παρέχει δωρεάν, διαδικτυακούς οδηγούς επισκευής όπως η Wikipedia για ηλεκτρονικά είδη ευρείας κατανάλωσης και gadget.

εντός της ιστοσελίδαςΥπάρχουν εκατομμύρια σελίδες, συμπεριλαμβανομένων οδηγών επισκευής, ιστορικού αναθεωρήσεων οδηγών, ιστολογίων, αναρτήσεων ειδήσεων και έρευνας, φόρουμ, οδηγών επισκευής που συνεισφέρουν η κοινότητα, ενοτήτων Q&A και πολλά άλλα.

Ωστόσο, το iFixit ανακάλυψε ξαφνικά ότι το πρόγραμμα ανίχνευσης ClaudeBot του Claude λάμβανε χιλιάδες αιτήματα κάθε λεπτό μέσα σε λίγες ώρες.

Αυτό ισοδυναμεί με σχεδόν ένα εκατομμύριο επισκέψεις στον ιστότοπό της σε μία ημέρα.

Σύμφωνα με στατιστικά στοιχεία, απέκτησε πρόσβαση σε 10 TB αρχείων σε μια μέρα και συνολικά 73 TB είχε πρόσβαση σε όλο τον Μάιο.

Για αυτόν τον λόγο, ο Διευθύνων Σύμβουλος του iFixit, Kyle Wiens, έριξε μια πρόταση:

Ο ClaudeBot έκλεψε όλα τα δεδομένα μας χωρίς άδεια και κατέλαβε τους διακομιστές μας... Ωραία, δεν είναι μεγάλη υπόθεση.
Αναρωτιέστε αν έχει ανιχνευτεί στις οδηγίες αδειοδότησης; ?

Καλά διαβάσατε, "χωρίς άδεια".

Το iFixit έγραψε στην πραγματικότητα μια δήλωση——

Οποιαδήποτε αναπαραγωγή, αναπαραγωγή ή διανομή οποιουδήποτε περιεχομένου, υλικού ή στοιχείων σχεδίασης σε αυτόν τον ιστότοπο για οποιονδήποτε άλλο σκοπό (συμπεριλαμβανομένης της εκπαίδευσης μοντέλων μηχανικής εκμάθησης ή τεχνητής νοημοσύνης) χωρίς τη ρητή προηγούμενη γραπτή άδεια του iFixit απαγορεύεται αυστηρά.

Ωστόσο, δεν υπάρχουν αυγά.

Όχι μόνο ο Claude έκλεισε τα μάτια και συνέχισε να έχει πρόσβαση και να σέρνεται σαν τρελός, αλλά απέφυγε και την άμυνα του iFixit.

Το iFixit ουσιαστικά απέκλεισε με επιτυχία δύο ρομπότ αρπαγής τεχνητής νοημοσύνης Anthropic, με το όνομα "ANTHROPIC-AI" και "CLAUDE-WEB".

Αλλά αυτά τα δύο ρομπότ που ανιχνεύουν με τεχνητή νοημοσύνη φαίνεται να ανήκουν στο παρελθόν.

Ως έσχατη λύση, ο Old K είπε ότι το iFixit τροποποίησε το αρχείο robots.txt αυτή την εβδομάδα ειδικά για να αποκλείσει τα ρομπότ ανίχνευσης της Anthropic.

Λοιπόν, υπάρχει κάποια αντίδραση από την Anthropic;

Δεν έκλεισαν το μικρόφωνο και απάντησαν στα ΜΜΕ:

Το ANTHROPIC-AI και το CLAUDE-WEB είναι πράγματι παλιοί ανιχνευτές που χρησιμοποιούνται από την εταιρεία, αλλά έχουν πλέον καταργηθεί.

Φυσικά, η Anthropic παρακάμπτει το ερώτημα εάν το πλέον ενεργό ClaudeBot σέβεται το anti-crawler robots.txt για να αποτρέψει την ανίχνευση του.

Δεν είναι η πρώτη φορά που εταιρείες τεχνητής νοημοσύνης το κάνουν αυτό.

Κοιτάζοντας τον επίσημο ιστότοπο του Anthropic, μπορείτε να διαπιστώσετε ότι υπάρχει ένα άρθρο με τίτλο "Does Anthropic ανιχνεύει δεδομένα από το Διαδίκτυο;" Πώς μπορούν οι ιδιοκτήτες ιστοτόπων να αποκλείσουν προγράμματα ανίχνευσης; "Αρθρο.

Ανέφερε:

Σύμφωνα με τα βιομηχανικά πρότυπα, η Anthropic χρησιμοποιεί μια ποικιλία πηγών δεδομένων για την ανάπτυξη μοντέλων, όπως δημόσια διαθέσιμα δεδομένα από το Διαδίκτυο που συλλέγονται μέσω ανιχνευτών ιστού.
Η ανίχνευση μαςΔεν πρέπει να είναι ενοχλητικό ή ενοχλητικό。
Στόχος μας είναι να το πετύχουμε λαμβάνοντας υπόψη την ταχύτητα ανίχνευσης του ίδιου τομέα και, όπου χρειάζεται,Σεβαστείτε τις καθυστερήσεις ανίχνευσης για να ελαχιστοποιήσετε την αναστάτωση。

Δεν είναι όμως δύσκολο να διαπιστώσουμε από την κοινή γνώμη ότι η Anthropic προφανώς δεν το κάνει αυτό.

Ανιχνεύει τα δεδομένα άλλων χωρίς άδεια,Επαναλαμβανόμενος παραβάτης。

Απλώς πείτε ότι τον Απρίλιο του τρέχοντος έτους, έγινε ανίχνευση του φόρουμ Linux Mint.

Σε λίγες ώρες, ο ClaudeBot επισκέφτηκε το φόρουμ πολλές φορές για να ανιχνεύσει δεδομένα, με αποτέλεσμα το φόρουμ να βρίσκεται σε εξαιρετικά χαμηλή ταχύτητα ή κατάσταση σύγκρουσης για μερικές ώρες και τελικά κατέρρευσε εντελώς.

Κάποιοι είπαν ότι κατά την ίδια χρονική περίοδο, το ClaudeBot κατείχε τη μεγαλύτερη επισκεψιμότητα, η οποία ήταν 20 φορές εκείνη της δεύτερης θέσης και 40 φορές εκείνη της τρίτης θέσης.

Στις αναρτήσεις συζήτησης για το περιστατικό του Απριλίου και αυτό το περιστατικό, κάποιοι πρότειναν:

Εφόσον δεν ωφελεί την απαγόρευση ανακοινώσεων ανίχνευσης, γιατί να μην τοποθετήσετε ορισμένες ψευδείς πληροφορίες με ανιχνεύσιμες ή μοναδικές πληροφορίες στον ιστότοπο για να εντοπίσετε ποιος έχει κλέψει τα δεδομένα.

Το iFixit κάνει ακριβώς αυτό.

Και είναι πραγματικά χρήσιμο - ανακάλυψα ότι οι πληροφορίες στον ιστότοπό μου δεν ανιχνεύτηκαν μόνο από τον Claude, αλλά και ανιχνεύτηκαν από το OpenAI...

Για να είμαι ειλικρινής, τι μπορεί να γίνει; Πραγματικά δεν υπάρχει τρόπος.

Γιατί εκτός από τον Claude και το GPT, αυτόΥπάρχουν αρκετά AI που κλέβουν σπίτια με τη βία.

Πριν από λίγες μέρες, μια εκκίνηση ανίχνευσης ρομπότ που ονομάζεται Tollbit ισχυρίστηκε ότι οι Perplexity, Claude και OpenAI θα αγνοούσαν τις ρυθμίσεις robots.txt σε ιστότοπους που ανιχνεύονταν εκείνη την εποχή, κάποιος ρώτησε το OpenAI για τη στάση του, αλλά το OpenAI αρνήθηκε να σχολιάσει.

Κοιτάζοντας πιο πίσω, υπήρξε και ταραχή τον περασμένο μήνα.

Το «Forbes» καταδίκασε το προϊόν αναζήτησης τεχνητής νοημοσύνης Perplexity για φερόμενη λογοκλοπή στα ειδησεογραφικά του άρθρα, και περισσότερα μέσα ενημέρωσης κατηγόρησαν το ρομπότ PerplexityBot για παράνομη ανίχνευση πληροφοριών.

Η στάση του Perplexity ήταν πάντα:

Σεβαστείτε τα αιτήματα των εκδοτών να μην διαγράψετε περιεχόμενο και να λειτουργήσετε σύμφωνα με τους νόμους περί πνευματικών δικαιωμάτων περί θεμιτής χρήσης.

Θεωρητικά, είτε πρόκειται για ClaudeBot είτε για PerplexityBot, όταν συναντούν ένα αρχείο με την ένδειξη "No crawling" ή "Robot.txt απαγορεύεται", θα πρέπει να ακολουθούν τη συμφωνία και να αποφεύγουν την ανίχνευση του περιεχομένου του ιστότοπου του δηλούντος μέρους.

Αφού η δήλωση είναι άκυρη, λοιπόνΜερικοί άνθρωποι έχουν καλέσει τους δημιουργούς να μετακινήσουν περιεχόμενο σε περιοχές επί πληρωμή όσο το δυνατόν περισσότερο για να αποτρέψουν την απεριόριστη ανίχνευση.

Πιστεύετε ότι αυτή η προσέγγιση θα είναι αποτελεσματική;

Σύνδεσμοι αναφοράς:
[1]https://www.404media.co/websites-are-blocking-the-wrong-ai-scrapers-because-ai-companies-keep-making-new-ones/
[2]https://www.404media.co/anthropic-ai-scraper-hits-ifixits-website-a-million-times-in-a-day/
[3]https://twitter.com/kwiens/status/1816128302542905620
[4]https://x.com/Carnage4Life/status/1804316030665396356
[5]https://support.anthropic.com/en/articles/8896518-does-anthropic-crawl-data-from-the-web-and-how-can-site-owners-block-the-crawler?ref =404media.co

Νέα

Πώς πάει αυτό

Δεν είναι η πρώτη φορά που εταιρείες τεχνητής νοημοσύνης το κάνουν αυτό.

Εισαγωγή

τα στοιχεία επικοινωνίας μου