Πέρα από την παράξενη κοιλάδα! Πέντε εκατομμύρια χρήστες του Διαδικτύου σε όλο τον κόσμο εξαπατήθηκαν και κανένας από τους δημοφιλείς ομιλητές του TEDx δεν ήταν αληθινοί άνθρωποι;

2024-08-10

Νέα Έκθεση Σοφίας

Επιμέλεια: Αινείας τόσο νυσταγμένος

[Εισαγωγή στη Νέα Σοφία]Πρόσφατα, αυτά τα ηχεία TED έχουν γίνει viral στο Διαδίκτυο, ωστόσο, δεν είναι αληθινά άτομα; ! Μετά την αποκάλυψη της απάντησης, πέντε εκατομμύρια χρήστες του Διαδικτύου απλώς σοκαρίστηκαν. Πόσα σφάλματα μπορείτε να βρείτε σε αυτές τις 5 φωτογραφίες;

Πρόσφατα, αυτά τα «ηχεία TED» έχουν γίνει πολύ δημοφιλή στο Διαδίκτυο και μπορούν να ονομαστούν viral.

Ρίξτε μια πιο προσεκτική ματιά Μπορείτε να βρείτε προβλήματα;

Η απάντηση αποκαλύπτεται - κανένας από αυτούς τους πέντε ανθρώπους δεν είναι πραγματικό πρόσωπο!

Ο τύπος που ψάχνει κάποιον στο διαδίκτυο θα κλάψει

Τόσο ζωντανό και σχεδόν άψογο, αυτό το επίπεδο τεχνητής νοημοσύνης που δημιουργεί φωτογραφίες σόκαρε άμεσα τους χρήστες του Διαδικτύου.

Ακόμη και το λογισμικό αναγνώρισης AI δεν μπορεί να αναγνωρίσει ότι αυτή είναι μια εικόνα που δημιουργείται από AI.

«Φαίνεται αληθινό, δεν είναι επειδή είναι αληθινή φωτογραφία;»

"Κανένας από αυτούς δεν είναι αληθινοί άνθρωποι; Είναι τόσο ανατριχιαστικό!"

Οι χρήστες του Διαδικτύου σχολίασαν: Αυτό έχει ξεπεράσει την παράξενη κοιλάδα και έφτασε στην «υπερπραγματική κοιλάδα».

Μέσα σε λίγες μόνο ώρες, η ανάρτηση που μοιράστηκε αυτήν την εικόνα είχε περισσότερες από 5 εκατομμύρια προβολές στο Twitter.

Αργότερα, αποκαλύφθηκε και ο συγγραφέας - ήταν ο Leo Kadieff, πρώην μέλος της ομάδας Stable Diffusion.

Αποκάλυψε: Αυτά τα ηχεία TEDx κατασκευάστηκαν όλα χρησιμοποιώντας την τελευταία πραγματική έκδοση Flux του LoRA.

Στο παρελθόν, οι εικόνες που δημιουργήθηκαν από την τεχνητή νοημοσύνη θα ήταν κάπως ασυνεπείς με το ανθρώπινο μάτι, αλλά αυτή τη φορά οι εικόνες είναι τόσο ζωντανές. Είναι το βελτιωμένο μοντέλο που χρησιμοποιεί την τεχνολογία LoRA που αυξάνει σημαντικά την αίσθηση της πραγματικότητας.

Επιπλέον, ο συγγραφέας είπε ότι αυτή η ροή εργασίας έχει επίσης το πλεονέκτημα ότι απλοποιεί σε μεγάλο βαθμό τις σύνθετες προτρεπτικές λέξεις.

Αυτή η είδηση κάνει απλώς εκστασιασμένους τους προτρεπτικούς κυρίους λέξεων.

Αυτό το μικρό αρχείο των 22 MB μας γλιτώνει από τον κόπο να γράψουμε ένα σωρό κουπόνια που σχετίζονται με την αυθεντικότητα σε κάθε λέξη που σας ζητείται.

Μια φράση, "A RAW σουρεαλιστική φωτογραφία, UHD, 8k" είναι αρκετή. Οι λάτρεις του ρεαλισμού, αγαπούν απόλυτα αυτό το εργαλείο.

Ο συγγραφέας το λέει ωμά: Χρειάζεται ακόμα να τελειοποιήσουμε τα ρεαλιστικά μας μοντέλα;

- Αυτές οι εικόνες είναι ακατέργαστες εξόδους από το Flux+LoRA χωρίς καμία αναβάθμιση ή μετα-επεξεργασία

Lora：https://huggingface.co/XLabs-AI/flux-RealismLora/tree/main

ComfuUI:https://we.tl/t-zrC5tPFG17

Πραγματική έκδοση του LoRA, εξαιρετικό αποτέλεσμα

Δεν είναι δύσκολο να δει κανείς από τις δύο παρακάτω εικόνες ότι η σύγκριση των αποτελεσμάτων της χρήσης LoRA και της μη χρήσης LoRA είναι πράγματι πολύ προφανής.

Οι χρήστες του Διαδικτύου διασκεδάζουν

Την ίδια στιγμή, η Κυράνιο, η μοιρασμένη του «TED Speaker», προσπάθησε να το αναπαράγει με το Midjourney.

Οι αρχικές προτρεπτικές λέξεις είναι οι εξής:

Μια γυναίκα που μιλάει στη σκηνή, από την Google, λευκό φόντο, θολό εταιρικό λογότυπο, τεχνολογικό συνέδριο --στυλ ακατέργαστο --v 6.1

Μπορεί να φανεί ότι το φαινόμενο της γενιάς δεν είναι κακό, αλλά εξακολουθεί να υπάρχει ένα μεγάλο κενό με τις εικόνες που δημιουργούνται από τον Leo Kadieff.

Στη συνέχεια, ο blogger έκανε κάποιες βελτιώσεις:

Μια νεαρή γυναίκα που χαμογελά και μιλάει στη σκηνή, από την Google, λευκό φόντο, θολό εταιρικό λογότυπο, τεχνολογικό συνέδριο --style raw --v 6.1

Και μετά από πολλές γενιές, δοκίμασα το πιο κοντινό αποτέλεσμα:

Ταυτόχρονα, καθώς το Google Imagen 3 έγινε δημόσια διαθέσιμο, οι χρήστες του Διαδικτύου δοκίμασαν επίσης αυτό το σύνολο προτροπών για πρώτη φορά.

Για ένα διάστημα, η τρέλα της δημιουργίας φωτογραφιών με τεχνητή νοημοσύνη ξεκίνησε σε όλο το Διαδίκτυο.

Το Imagen 3 είναι διαθέσιμο σε όλους

Σωστά, όπως μόλις αναφέρθηκε, το πιο ισχυρό μοντέλο γραφήματος Vincentian της Google, το Imagen 3, είναι επίσημα διαθέσιμο.

προτροπή：Φωτογραφία ενός άνδρα που κρατά μια πινακίδα που λέει: "Το Imagen είναι τώρα σχεδόν τόσο καλό όσο το Midjourney" στη Νέα Υόρκη.

Πηγή: Risphere

Ο Netizen chrypnotoad είπε ότι δεν έχει δει ποτέ κανένα AI που να μπορεί να κάνει τόσο καλά την Ασπίδα του Αχιλλέα!

Το Imagen 3 δεν μπορεί να υποτιμηθεί, έχοντας τη δυνατότητα να τηρεί εύκολα τέτοια πολύπλοκα μηνύματα.

Η γνωστή blogger «Guizang» είπε μετά την εμπειρία:

Το περιεχόμενο που δημιουργείται είναι ακριβές, αλλά η αισθητική της εικόνας είναι κακή. Όσο εμπλέκονται χαρακτήρες, πρέπει να εξετάσετε προσεκτικά πώς να γράψετε τα μηνύματα, διαφορετικά υπάρχει μεγάλη πιθανότητα να μην δημιουργηθεί η εικόνα.

Ευτυχώς, έκαναν καλή δουλειά στην αλληλεπίδραση με τις γρήγορες λέξεις:

Το LLM θα αναλύσει τον τύπο λέξης που ζητείται και θα σας δώσει σχετικές λέξεις που μπορείτε να αλλάξετε απευθείας.

Πηγή: Guizang

νέα

Νέα Έκθεση Σοφίας

Πραγματική έκδοση του LoRA, εξαιρετικό αποτέλεσμα

Εισαγωγή

Τα στοιχεία επικοινωνίας μου