Όλες οι ομορφιές της AI εξαφανίστηκαν! Συλλογικά μετατράπηκε σε "φαντάσματα" κάτω από τον μαγικό καθρέφτη του κυβερνοχώρου, ο κώδικας AI διέκοψε τις εικόνες_news που δημιουργήθηκαν από την τεχνητή νοημοσύνη

Όλες οι ομορφιές της AI εξαφανίστηκαν! Ο κώδικας τεχνητής νοημοσύνης που μετατράπηκε συλλογικά σε «φαντάσματα» κάτω από τον μαγικό καθρέφτη του κυβερνοχώρου διέκοψε την παραγωγή εικόνων της τεχνητής νοημοσύνης

2024-08-12

Mingmin Kresi από τον ναό Aofei
Qubits | Δημόσιος λογαριασμός QbitAI

Κάτω από τον μαγικό καθρέφτη του κυβερνοχώρου, όλες οι ομορφιές της AI μετατράπηκαν σε φαντάσματα.

Ελάτε να δείτε τα δόντια του。

Όταν αυξηθεί πλήρως ο κορεσμός της εικόνας, τα δόντια του πορτρέτου AI θα γίνουν πολύ περίεργα και τα όρια θα είναι θολά.

Το χρώμα της συνολικής εικόνας είναι κανονικό, αλλά το κομμάτι του μικροφώνου είναι ακόμα πιο περίεργο.

αντίθεσηΦωτογραφίες πραγματικών ανθρώπων, θα έπρεπε να είναι έτσι.

Τα δόντια είναι καθαρά και οι χρωματικές κηλίδες στην εικόνα είναι ομοιόμορφες.

Αυτό το εργαλείο είναι ανοιχτό και όλοι μπορούν να το δοκιμάσουν με φωτογραφίες.

Ένα συγκεκριμένο καρέ στο βίντεο που δημιουργείται από AI δεν μπορεί να ξεφύγει από αυτήν τη μέθοδο.

Οι φωτογραφίες των δοντιών που λείπουν μπορεί επίσης να αποκαλύψουν προβλήματα.

Αλλά BTW, αυτό το εργαλείοαπό τον Κλοντ. Χρησιμοποιήστε το AI για να σπάσετε το AI, έναν υπέροχο κλειστό βρόχο.

Στην πραγματικότητα, τα πορτρέτα της τεχνητής νοημοσύνης είναι πρόσφατα πολύ ζωντανά και έχουν προκαλέσει πολλές συζητήσεις, για παράδειγμα, σε ένα σύνολο δημοφιλών "βίντεο με ηχεία TED", κανένα από αυτά δεν είναι πραγματικά αληθινά άτομα.

Όχι μόνο είναι δύσκολο να ξεχωρίσεις πρόσωπα, αλλά ακόμα και η γραφή, η προηγούμενη αδυναμία της τεχνητής νοημοσύνης, μπορεί πλέον να είναι εντελώς ψεύτικη.

Το πιο σημαντικό είναι ότι το κόστος δημιουργίας τέτοιων πορτρέτων τεχνητής νοημοσύνης δεν είναι υψηλό. Μπορεί να γίνει για μόλις 5 λεπτά και 1,5 δολάρια ΗΠΑ (περίπου 10 γιουάν) κάθε 20 δευτερόλεπτα.

Τώρα οι χρήστες του Διαδικτύου δεν μπορούσαν να καθίσουν ήσυχοι και ξεκίνησαν διαγωνισμούς κατά της απομίμησης τεχνητής νοημοσύνης ο ένας μετά τον άλλο.

Σχεδόν 5.000 άτομα ήρθαν για να συζητήσουν ποιο από αυτές τις δύο φωτογραφίες είναι το πραγματικό πρόσωπο.

Οι λόγοι που αναφέρθηκαν ποικίλλουν. Μερικοί άνθρωποι βρίσκουν τις λεπτομέρειες του κειμένου και του σχεδίου πολύ αφηρημένες, ενώ άλλοι πιστεύουν ότι τα μάτια των χαρακτήρων είναι άδεια...

Οι κανόνες με τους οποίους η πιο προηγμένη τεχνητή νοημοσύνη δημιουργεί πορτρέτα διερευνώνται σταδιακά.

Είναι δύσκολο να το πει κανείς χωρίς να κοιτάξει τις λεπτομέρειες

Συνοπτικά, η προσαρμογή του κορεσμού μπορεί να είναι ο ταχύτερος τρόπος για να τον αναγνωρίσετε.

Τα πορτρέτα της ομάδας AI εκτίθενται πιο διεξοδικά με αυτόν τον τρόπο.

Υπάρχει πρόβλημα με αυτό όμως. Αυτή η μέθοδος ενδέχεται να μην λειτουργεί εάν η εικόνα συμπιέζεται χρησιμοποιώντας τον αλγόριθμο JPEG.

Για παράδειγμα, βεβαιωθείτε ότι η φωτογραφία είναι πραγματική φωτογραφία.

Ωστόσο, λόγω προβλημάτων συμπίεσης εικόνας και φωτισμού, τα δόντια του χαρακτήρα είναι επίσης λίγο θολά.

Ως εκ τούτου, οι χρήστες του Διαδικτύου απαρίθμησαν επίσης περισσότερους τρόπους για να διαπιστώσουν εάν ένα πορτρέτο συντίθεται από AI.

Η πρώτη μέθοδος, με απλά λόγια, είναι να βασιστείς στην ανθρώπινη γνώση και κρίση.

Δεδομένου ότι ο τρόπος με τον οποίο η τεχνητή νοημοσύνη μαθαίνει τις εικόνες δεν είναι συνεπής με τους ανθρώπους, είναι αναπόφευκτο να μην μπορεί να κατανοήσει το 100% των οπτικών πληροφοριών από την ανθρώπινη προοπτική.

Το αποτέλεσμα είναι ότι οι εικόνες που δημιουργούνται από την τεχνητή νοημοσύνη συχνά περιέχουνΔεν συνάδει με τον πραγματικό κόσμοΑυτό παρέχει ένα σημείο εκκίνησης για την αναγνώριση εικόνας.

Χρησιμοποιήστε την εικόνα στην αρχή ως παράδειγμα.

Σε γενικές γραμμές, το δέρμα του χαρακτήρα είναι πολύ λείο και δεν φαίνονται πόροι.

Φυσικά, αυτό το «μη ρεαλιστικό συναίσθημα» δεν ισοδυναμεί απόλυτα με το «ψεύτικο» Άλλωστε, οι πόροι δεν φαίνονται σε εικόνες που έχουν υποστεί επεξεργασία με μικροδερμοαπόξεση.

Αλλά αυτός δεν είναι ο μόνος παράγοντας κρίσης Μπορεί να μην υπάρχει μόνο μία απόκλιση από την κοινή λογική στην εικόνα.

Στην πραγματικότητα, αν κοιτάξετε τις ακόλουθες λεπτομέρειες αυτής της εικόνας, μπορείτε να δείτε ένα σχετικά προφανές χαρακτηριστικό——Η ιδιόμορφη μέθοδος σύνδεσης του γάντζου πάνω από την πινακίδα。

Υπάρχουν επίσης μικρόφωνα που εμφανίζουν ελαττώματα στη λειτουργία υψηλού κορεσμού και οι ενδείξεις μπορούν να φανούν απευθείας με γυμνό μάτι μετά την ενίσχυση.

Αυτό που είναι ακόμη πιο λεπτό είναι ότι υπάρχουν αρκετές τρίχες στην άκρη των μαλλιών που βρίσκονται σε πολύ παράλογες θέσεις, αλλά ένα τέτοιο χαρακτηριστικό θα απαιτούσε πιθανώς όραση σε επίπεδο Leeuwenhoek για να δει.

Ωστόσο, με την πρόοδο της τεχνολογίας παραγωγής, τα χαρακτηριστικά που μπορούν να βρεθούν γίνονται όλο και πιο κρυφά, κάτι που είναι μια αναπόφευκτη τάση.

Ένας άλλος τρόπος είναι να κοιτάξετε το κείμενο Αν και η τεχνητή νοημοσύνη ξεπερνά σταδιακά το πρόβλημα των «χαρακτήρων-φαντάσματα» στην απεικόνιση των γραμματοσειρών, εξακολουθούν να υπάρχουν κάποιες δυσκολίες στη σωστή απόδοση του κειμένου με το σωστό πραγματικό νόημα.

Για παράδειγμα, ορισμένοι χρήστες του Διαδικτύου ανακάλυψαν ότι στο σήμα που φορούσε το άτομο στη φωτογραφία, τα δύο γράμματα στην τελευταία γραμμή κάτω από το λογότυπο της Google είναι "CA", που σημαίνει Καλιφόρνια και η μακριά συμβολοσειρά μπροστά θα πρέπει να είναι το όνομα της πόλης.

Αλλά στην πραγματικότητα, δεν υπάρχει πόλη στην Καλιφόρνια με τόσο μεγάλο όνομα.

Εκτός από τις λεπτομέρειες των ίδιων των αντικειμένων, πληροφορίες όπως το φως και η σκιά μπορούν επίσης να χρησιμοποιηθούν για τον προσδιορισμό της αυθεντικότητας.

Αυτή η εικόνα έχει εξαχθεί από ένα βίντεο και υπάρχει ένα τέτοιο πλαίσιο στο βίντεο όπου βρίσκεται.

Στη δεξιά πλευρά του μικροφώνου, υπάρχει μια πολύ περίεργη σκιά. Αυτή η σκιά αντιστοιχεί σε ένα από τα χέρια του χαρακτήρα.

Όταν πρόκειται για βίντεο, λόγω της συνέπειας του περιεχομένου πριν και μετά, η τεχνητή νοημοσύνη είναι πιο πιθανό να αποκαλύψει ελαττώματα παρά σε στατικές εικόνες.

Υπάρχουν επίσης ορισμένα χαρακτηριστικά που δεν είναι "λάθη κοινής λογικής", αλλά αντικατοπτρίζουν επίσης ορισμένες προτιμήσεις της τεχνητής νοημοσύνης κατά τη δημιουργία εικόνων.

Για παράδειγμα, αυτές οι τέσσερις εικόνες είναι όλες με «μέσους ανθρώπους» που συντέθηκαν από την τεχνητή νοημοσύνη. Έχετε βρει κάτι κοινό;

Μερικοί χρήστες του Διαδικτύου είπαν ότι κανένα από τα άτομα σε αυτές τις τέσσερις φωτογραφίες δεν έχει χαμογελαστό πρόσωπο, το οποίο φαίνεται να αντικατοπτρίζει ορισμένα χαρακτηριστικά των εικόνων που δημιουργούνται από την τεχνητή νοημοσύνη.

Αυτό ισχύει πράγματι για αυτές τις εικόνες, αλλά είναι δύσκολο να διαμορφωθεί ένα σύστημα για αυτό το είδος κρίσης, σε τελική ανάλυση, διαφορετικά εργαλεία σχεδίασης τεχνητής νοημοσύνης έχουν διαφορετικά χαρακτηριστικά.

Εν ολίγοις, για να ανταπεξέλθουμε στη σταδιακή πρόοδο της τεχνητής νοημοσύνης, μπορούμε αφενός να αυξήσουμε την ένταση του "Leewenhoek" και αφετέρου να εισαγάγουμε τεχνικές επεξεργασίας εικόνας όπως η αύξηση του κορεσμού.

Αλλά αν τέτοιες «ποσοτικές αλλαγές» συσσωρεύονται όλο και περισσότερο, θα γίνεται όλο και πιο δύσκολο να κριθεί με γυμνό μάτι και ο κορεσμός της εικόνας μπορεί μια μέρα να σπάσει από την τεχνητή νοημοσύνη.

Ως εκ τούτου, οι άνθρωποι αλλάζουν επίσης τη σκέψη και τη σκέψη τους για τη μέθοδο "μοντέλο προς μοντέλο", χρησιμοποιώντας εικόνες που δημιουργούνται από την τεχνητή νοημοσύνη για να εκπαιδεύσουν μοντέλα ανίχνευσης και να αναλύσουν περισσότερα χαρακτηριστικά από τις εικόνες.

Για παράδειγμα, οι εικόνες που δημιουργούνται από την τεχνητή νοημοσύνη έχουν πολλά χαρακτηριστικά σε φάσμα, κατανομή θορύβου κ.λπ. Αυτά τα χαρακτηριστικά δεν μπορούν να αποτυπωθούν με γυμνό μάτι, αλλά η τεχνητή νοημοσύνη μπορεί να τα δει καθαρά.

Φυσικά, δεν αποκλείει το ενδεχόμενο η μέθοδος ανίχνευσης να υστερεί και να μην μπορεί να συμβαδίσει με τις αλλαγές μοντέλων ή οι προγραμματιστές μοντέλων να ειδικεύονται ακόμη και στην ανάπτυξη αντιπάλων.

Για παράδειγμα, στην εικόνα που συζητήθηκε παραπάνω, ένα εργαλείο ανίχνευσης AI έχει μόνο 2% πιθανότητα να συντεθεί από AI.

Ωστόσο, η διαδικασία παιχνιδιού μεταξύ απάτης με τεχνητή νοημοσύνη και ανίχνευσης τεχνητής νοημοσύνης είναι από μόνη της ένα «παιχνίδι γάτας και ποντικιού».

Επομένως, εκτός από τον εντοπισμό, οι προγραμματιστές μοντέλων μπορεί επίσης να χρειαστεί να αναλάβουν ορισμένες ευθύνες, όπως η προσθήκη αόρατων υδατογραφημάτων σε εικόνες που δημιουργούνται από τεχνητή νοημοσύνη, έτσι ώστε η απάτη με τεχνητή νοημοσύνη να μην έχει πού να κρυφτεί.

Το AI είναι ένα πόδι ψηλότερο

Αξίζει να αναφέρουμε ότι πολλά από τα πορτρέτα AI που έχουν προκαλέσει πανικό όπως προαναφέραμε είναι από τα πρόσφατα δημοφιλήΡοήΔημιουργία/συμμετοχή στην παραγωγή.

Όλοι έχουν αρχίσει ακόμη και να υποθέτουν ότι τα εφέ που είναι πολύ καλά για να τα διακρίνει κανείς τα κάνει η Flux.

Δημιουργήθηκε από την αρχική ομάδα του Stable Diffusion και προκάλεσε σάλο στο Διαδίκτυο μόλις 10 μέρες μετά την κυκλοφορία του.

Αυτές οι όμορφες φωτογραφίες από ψεύτικες ομιλίες TED είναι όλες φτιαγμένες από αυτό.

Άλλοι έχουν χρησιμοποιήσει το Flux και το Gen-3 μαζί για να δημιουργήσουν όμορφες διαφημίσεις προϊόντων περιποίησης δέρματος.

Και διάφορα εφέ σύνθεσης από πολλές γωνίες.

Επιλύει πολύ καλά προβλήματα όπως οι ζωγράφοι AI και το κείμενο που δημιουργείται από AI σε εικόνες.

Αυτό οδηγεί άμεσα στο γεγονός ότι οι άνθρωποι δεν μπορούν πλέον να κοιτάζουν απευθείας τα χέρια και τις λέξεις για να διακρίνουν τα σχέδια της τεχνητής νοημοσύνης, αλλά μπορούν μόνο να μαντέψουν με βάση ενδείξεις.

Το Flux θα έπρεπε να έχει ενισχυμένη εκπαίδευση στο χέρι, κείμενο και άλλους δείκτες.

Αυτό σημαίνει επίσης ότι εάν η τρέχουσα τεχνητή νοημοσύνη συνεχίσει να εργάζεται σκληρά για την εκπαίδευση σε λεπτομέρειες υφής, χρώματα κ.λπ., μέχρι να βγει το μοντέλο σχεδίασης τεχνητής νοημοσύνης επόμενης γενιάς, οι μέθοδοι ανθρώπινης αναγνώρισης μπορεί να γίνουν ξανά αναποτελεσματικές...

Επιπλέον, το Flux είναι ανοιχτού κώδικα και μπορεί να εκτελεστεί σε φορητούς υπολογιστές. Πολλοί άνθρωποι βρίσκονται τώρα στο Forget Midjourney.

Χρειάστηκαν 2 χρόνια για να πάει από το Stable Diffusion στο Flux.

Χρειάστηκε 1 χρόνος για να πάει από το "Will Smith eating noodles" στο "Tedx speaker".

Πραγματικά δεν ξέρω ποια κόλπα θα πρέπει να επινοήσουν οι άνθρωποι στο μέλλον για να διακρίνουν τη γενιά της τεχνητής νοημοσύνης...

Σύνδεσμοι αναφοράς:
[1]https://x.com/ChuckBaggett/status/1822686462044754160
[2]https://www.reddit.com/r/artificial/comments/1epjlbl/average_looking_people/
[3]https://www.reddit.com/r/ChatGPT/comments/1epeshq/these_are_all_ai/
[4]https://x.com/levelsio/status/1822751995012268062

νέα

Είναι δύσκολο να το πει κανείς χωρίς να κοιτάξει τις λεπτομέρειες

Το AI είναι ένα πόδι ψηλότερο

Εισαγωγή

Τα στοιχεία επικοινωνίας μου