Τα στοιχεία επικοινωνίας μου
Ταχυδρομείο[email protected]
2024-08-25
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Κύκλος AI, δημιουργία εικόνων ανοιχτού βιβλίου ξανά.
Μια σειρά από εξελίξεις συγκεντρώθηκαν:
21 Αυγούστου,Το Ideogram κυκλοφορεί επίσημα την έκδοση 2.0, ισχυριζόμενος ότι έχει ισχυρότερες δυνατότητες απόδοσης κειμένου.
Σωστά, είναι το έργο που ιδρύθηκε τον Αύγουστο του περασμένου έτους από τα τέσσερα μεγάλα παιδιά της Google AI Painting που συλλογικά εγκατέλειψαν τις δουλειές τους για να ξεκινήσουν μια επιχείρηση.
Αυτή τη φορά Ideogram επίσηςΑνοιχτή πρόκληση στο Flux, ο αξιωματούχος δήλωσε με βεβαιότητα ότι η ανθρώπινη αξιολόγησή του είναι σημαντικά καλύτερη από το Flux Pro.
Ξέρετε, το Flux δημιουργήθηκε από την αρχική ομάδα του Stable Diffusion και πρόσφατα έγινε δημοφιλές στα μεγάλα δίκτυα για τη δημιουργία «φωτογραφιών» ομιλιών TED που μοιάζουν με πραγματικές.
Επιπλέον, πριν από μια εβδομάδα, η Google κυκλοφόρησε επίσημαΕικόνα 3, σε επίσημες αξιολογήσεις, υποστηρίζεται ότι έχει καλύτερη απόδοση από τα DALL-E 3, Midjourney v6, Stable Diffusion 3 και άλλα μοντέλα σχεδίασης.
Ίσως λόγω διέγερσης (doge), το Midjourney έκανε επίσης μετάβαση και κυκλοφόρησε απευθείας σε όλους τους χρήστες στις 22 Αυγούστου.Δωρεάν web έκδοση。
Υπάρχει κάτι καλό να παρακολουθήσετε τώρα!
Εφόσον όλοι ισχυρίζονται ότι είναι δυνατοί, θα μπορούσαμε κάλλιστα να τους φέρουμε όλους στο ίδιο τραπέζι και να έχουμε ένα πρόσωπο με πρόσωπο PK.
Ποιος είναι το πιο δυνατό σχέδιο AI;
Ας προσκαλέσουμε πρώτα τους 4 διαγωνιζόμενους μας (όλοι χρησιμοποιούν την έκδοση web):
Διαγωνιζόμενος Νο. 1: Ιδεόγραμμα 2.0.Υπάρχουν 10 πόντους δωρεάν κάθε μέρα, 1 πόντος μπορεί να δημιουργήσει 4 φωτογραφίες και έως 40 φωτογραφίες την ημέρα.
Παίκτης Νο. 2: Flux.1.Το Black Forest παρέχει επίσημα μια δωρεάν επίδειξη στο Hugging Chat (επιλέξτε την έκδοση FLUX.1 Schnell).
Διαγωνιζόμενος Νο. 3: Εικόνα 3.Δωρεάν και απεριόριστη χρήση στο Image FX.
Παίκτης Νο. 4: Midjourney.Κατά τη διάρκεια της δωρεάν δοκιμαστικής περιόδου, έχετε μόνο την ευκαιρία να δημιουργήσετε συνολικά 25 φωτογραφίες.
Τώρα μπαίνουμε και επίσημα στην αγωνιστική φάση.
Οι μαύρες μαϊμούδες ανατράπηκαν όλες
Πρώτον, για να δοκιμάσετε αυτά τα ξένα AIΚαταλαβαίνετε τις κινεζικές λέξεις;, ας εκμεταλλευτούμε επίσης τη δημοτικότητα των κορυφαίων μαύρων πιθήκων του σήμερα.
προτροπή: Ο χαρακτήρας του παιχνιδιού είναι ένας πίθηκος, που φορά πανοπλία, ένα χρυσό στέμμα με φτερά φοίνικα στο κεφάλι του και κρατά ένα χρυσό στεφάνι στο χέρι του, στέκεται σε έναν γκρεμό.
Όπως ήταν αναμενόμενο, έγινε ένα ατύχημα...
Πιστεύω ότι όλοι τράβηξαν με την πρώτη ματιά ο μεγάλος κόκκινος σταυρός στο Νο. 3. Σωστά, κάτω από την ίδια προτροπή λέξη, υπάρχει μόνο το Imagen 3Το αίτημα κατασκευής απορρίφθηκε。
Όταν το είδα αυτό, η πρώτη μου αντίδραση ήταν αν οι προτροπές μας προκάλεσαν προστασία πνευματικών δικαιωμάτων. Έτσι, πρώτα διέγραψα τον "χαρακτήρα του παιχνιδιού" στη λέξη που ζητήθηκε, αλλά το αποτέλεσμα ήταν ότι η υπενθύμιση δεν μπορούσε να δημιουργηθεί.
Μήπως επειδή το Google Imagen 3 δεν υποστηρίζει κινέζικα; Έτσι, άλλαξα τυχαία τη λέξη προτροπής σε μια πιο απλή, και αυτή τη φορά υπήρχε μια εικόνα.
Απλώς το αποτέλεσμα ήταν ένα μεγάλο λάθος και άλλαξαν πολλές κινεζικές προτροπές λέξεις και τελικά ήταν όλες άσχετες εικόνες υφής.
ΦαίνεταιΤο Google Imagen 3 δεν είναι όντως εντάξει με τις κινεζικές προτροπές λέξεις。
Αφού το Νο. 3 απέτυχε στη λίστα, κοιτάζοντας τους άλλους, υπήρχαν μόνοΝο. 1 Ιδεόγραμμα 2.0 αποδίδει καλύτερα。
Το Νο. 2 μπορεί ακόμα να δει τη σκιά των κινεζικών κόμικ, αλλά το Νο. 4 Midjourney έχει αφεθεί εντελώς~ (το κύριο θέμα είναι εντελώς άσχετο)
Τέλος, θα ήθελα να επαινέσω το Ideogram 2.0 για την ακριβή κάλυψη όλων των βασικών στοιχείων.
Αν και δεν είναι αυτό που θέλω στην καρδιά μου (θέλω τη Μαύρη Μυθολογία), δεν υπάρχει πραγματικά τίποτα κακό με την επαναφορά των πρόχειρων λέξεων.
Είναι πραγματικό πρόσωπο ή AI; Ανόητο, δεν μπορώ να διακρίνω τη διαφορά
Στη συνέχεια, εισαγάγετε τη ζώνη άνεσης κάθε παίκτη——Γενιά πορτρέτου。
Εκείνες τις μέρες, το Midjourney έγινε δημοφιλές στο Διαδίκτυο με μια φωτογραφία ενός ζευγαριού στην ταράτσα τώρα, το Flux είναι ακόμη δημοφιλές στο Διαδίκτυο με ένα σύνολο εικόνων ομιλίας TED.
Ποιος είναι καλύτερος; Η απάντηση θα αποκαλυφθεί σύντομα.
προτροπή: Ένας νεαρός άνδρας με καστανόξανθα μαλλιά, φορώντας ένα καρό πουκάμισο σε γαλαζοπράσινο και κρεμ, απαθανατίστηκε με φακό 50 mm για μια vintage εμφάνιση. Πλούσια χρώματα, ευκρινή εστίαση και μια πινελιά ρετρό γοητείας.
Ένας νεαρός άνδρας με καστανόξανθα μαλλιά, φορώντας γαλαζοπράσινο και κρεμ καρό πουκάμισο, απαθανατίστηκε με φακό 50 χιλιοστών σε ρετρό στυλ. Τα χρώματα είναι πλούσια και η εστίαση είναι έντονη με μια νότα vintage γοητείας.
Βλέποντας πρώτα το Νο. 2 και το Νο. 4, είναι προφανές ότι το Midjourney έχει κερδίσει!
Βλέποντας τις λεπτομέρειες, το Νο 2Το Flux.1 είναι ελαφρώς απενεργοποιημένο, υπάρχουν ακόμη δύο χρώματα ρούχων, που είναι ιδιαίτερα εμφανές ανάμεσα στα μπλε και πράσινα καρό πουκάμισα.
Επιπλέον, ανακαλύψαμε και το Imagen 3 στην αρχήΈνα μοναδικό μικρό αποκορύφωμα: Κυκλώστε τη λέξη-κλειδί πριν ξεκινήσει η γενιά.
Με τη δουλειά που έχει κάνει, μπορούμε απλώς να δοκιμάσουμε την απόδοση αρκετών παικτών.βασικά στοιχεία(Γαλαζοπράσινο καρό πουκάμισο, φακός 50mm κ.λπ.).
Φαίνεται ότι σε γενικές γραμμές, αρκετοί παίκτες είχαν καλή απόδοση (εκτός από το Νο. 2), με υψηλό βαθμό αποκατάστασης και όλοι να κοιτάζουν προς την κάμερα.
Επιπλέον, εάν αυτά δεν δημιουργήθηκαν από τον εαυτό μου χρησιμοποιώντας AI, δεν θα μπορούσα να διακρίνω τη διαφορά από τους πραγματικούς ανθρώπους αμέσως. (Ντροπιασμένος)
Τέλος, θα ήθελα να πω ήσυχα ότι ο διαγωνιζόμενος Νο. 4, Midjourney, έχει την καλύτερη εμφάνιση.
Μεγάλη δυσκολία: Κείμενο εμφάνισης εικόνας
Αφού εξαπατήσαμε επιτυχώς τους πάντες, ήρθε η ώρα να αφήσουμε το AI να υποφέρει λίγο——
Προσθήκη κειμένου σε εικόνες。
Αυτό το θέμα ήταν πάντα ένα μακροχρόνιο πρόβλημα και έχει γίνει επίσης ένα από τα πρότυπα για τη δοκιμή του επιπέδου σχεδίασης AI.
Χωρίς περαιτέρω καθυστέρηση, ας αφήσουμε λίγους διαγωνιζόμενους να φτιάξουν μια εξαιρετική διαφημιστική πινακίδα. Όλοι οι αναγνώστες, παρακαλούμε φέρτε τον δικό σας ρόλο ως πατέρα του Κόμματος Α.
προτροπή: Μια οριζόντια ορειχάλκινη πινακίδα που γράφει «Εορταστική περίοδος» σε κομψό σενάριο, περικυκλωμένη από πεύκο και πουρνάρι σε φόντο από σκούρο ξύλο, με κοντινή εστίαση στα χρυσά γράμματα.
Μια οριζόντια ορειχάλκινη πινακίδα που γράφει «Εορταστική περίοδος» σε κομψό σενάριο περιβάλλεται από κλαδιά πεύκου και πουρνάρι σε σκούρο ξύλινο φόντο, με ένα κοντινό πλάνο να εστιάζει στα χρυσά γράμματα.
Μετά από μια γρήγορη ματιά, είναι όλα αρκετά καλά Φαίνεται ότι έχουν αποκαταστήσει τις προτρεπτικές λέξεις σε υψηλό βαθμό;
Ωστόσο, μόλις αποκαλυφθούν τα αιχμηρά μάτια του πατέρα του Κόμματος Α, το Νο. 2 δεν μπορεί να τα κρύψει.
Προσοχή, αριθμός 2Flux.1 κομμένες γωνίες, από τη λέξη "Season" λείπει το γράμμα "S".
Αλλά εκτός από το Νο. 2, τα άλλα είναι αρκετά καλά Φαίνεται ότι διάφορες εταιρείες τεχνητής νοημοσύνης τα πάνε καλά.Λειτουργία απόδοσης κειμένουΈχουν γίνει όλες οι προσπάθειες.
Το επόμενο βήμα λοιπόν είναι ο καθένας να έχει τις δικές του προτιμήσεις για το ραπανάκι και τα πράσινα λαχανικά και ο καθένας κάνει μια επιλογή με βάση τις προσωπικές του προτιμήσεις. (Προσωπικά ψήφισα το Midjourney)
Παρεμπιπτόντως, το No. 1 Ideogram έχει προωθήσει ειδικά τη λειτουργία "απόδοση κειμένου" σε αυτήν την αναβάθμιση του μοντέλου.
Ανατρέξτε στα McDonald's, το όλο θέμα της διαφήμισης AI
Πρόσφατα, τα McDonald's προσέλαβαν 11 καλλονές AI για να φωνάξουν τις τηγανιτές πατάτες τους, κάτι που τις έκανε πολύ δημοφιλείς~
Στην πραγματικότητα, η αρχή είναι σχετικά απλή. Δεν είναι τίποτα άλλο από τη χρήση της τεχνητής νοημοσύνης για τη δημιουργία εικόνων διαφορετικών χαρακτήρων που προωθούν τηγανητές πατάτες και στη συνέχεια τη συναρμολόγηση τους σε ένα βίντεο.
Απροσδόκητα, το αποτέλεσμα ήταν εκπληκτικό μόνο στο Twitter, το σχετικό βίντεο έλαβε σχεδόν 10 εκατομμύρια προβολές.
Αφού κατακτήσαμε τον κώδικα πλούτου, αρχίσαμε επίσημα να εργαζόμαστε ως Κινέζοι,Η τεχνητή νοημοσύνη βοηθά τους αγρότεςΠρέπει να περπατάς πάνω κάτω~
προτροπή:Με φόντο μια μητρόπολη σε στυλ κυβερνοπάνκ, ένα κορίτσι προωθεί βιολογικά αγροτικά προϊόντα στα χέρια της.
Σε ένα αστικό υπόβαθρο σε στυλ κυβερνοπάνκ, ένα κορίτσι προωθεί τα βιολογικά προϊόντα στα χέρια της.
Πολύ καλό, «απέτυχε» ξανά ο παίκτης Νο3. Ωστόσο, αυτό το κύμα είναι πραγματικά μπερδεμένο.
Μετά την κατάργηση του Νο. 3, ο διαγωνιζόμενος Νο. 1 Ideogram 2.0 έφερε τη μεγαλύτερη ποικιλία προϊόντων, όπως κινέζικο λάχανο, ντομάτες, μοβ λάχανο κ.λπ.
Και είναι το μόνο που πληκτρολόγησεσημάδι κειμένουΉρθα εδώ για να προωθήσω τα βιολογικά τρόφιμα, και βλέπω ότι εργάζονται πολύ σκληρά~
Επιπλέον, αν κοιτάξετε προσεκτικά, μπορείτε να δείτε ότι μόνο το Νο. 1 προσπαθεί να μιμηθεί το πραγματικό πρόσωπο, ενώ το Νο. 2 και το Νο. 4 είναι εντελώςδίστιχος πίθηκος。
u1s1, αν αναφέρεστε στο διαφημιστικό στυλ του Maimai, αυτή η βραχυπρόθεσμη γενιά δεν πέτυχε το επιθυμητό αποτέλεσμα. (Ελπίζουμε πιο κοντά στην πραγματικότητα)
Ωστόσο, ευτυχώς, αυτά τα εργαλεία τεχνητής νοημοσύνης είναι προς το παρόν διαθέσιμα δωρεάν. Δεν είναι αδύνατο να τα δοκιμάσετε πολλές φορές. 🐶
Μην φύγετε βιαστικά, υπάρχει στην πραγματικότητα ένας πιο αξιόπιστος τρόπος για να κερδίσετε χρήματα——
Χρησιμοποιήστε AI για να ελέγχετε εύκολα τις λήψεις στούντιοαφίσες επιχειρήσεων, δεν θα ήταν ωραίο να εξοικονομήσετε χρήματα σε φωτογράφους, χώρους και post-production.
Ένας κομψός σωλήνας κραγιόν λάμπει με φόντο την κομψότητα, τονίζοντας την πλούσια χρωστική ουσία και την ομαλή ολίσθηση. Προκαλέστε την πολυτέλεια με ευκρινή εστίαση και μια νότα λάμψης.
Ένας κομψός σωλήνας κραγιόν λάμπει σε ένα εκλεπτυσμένο φόντο, τονίζοντας το έντονο χρώμα και την ομαλή εφαρμογή. Προκαλέστε μια αίσθηση πολυτέλειας με έντονη εστίαση και μια πινελιά λάμψης.
Ας δοκιμάσουμε όλους, αν έπρεπε να διαλέξετε ένα κραγιόν για μια γυναίκα γύρω σας, ποιο θα επιλέγατε; (Έρχεται το τεστ θανάτου)
Χεχε, λοιπόν, έχει διαλέξει κανείς το Νο 4;
Αν και το γκρι χρώμα του No. 4 Midjourney φαίνεται πολύ μοντέρνο, το μαύρο χρώμα μπορεί να είναι λίγο εξειδικευμένο. (Επιλέξτε προσεκτικά)
Εκτός από αυτό, οι επόμενοι καλύτεροι ερμηνευτές είναιΕικόνα 3, το βελούδινο ύφασμα από κάτω αναδεικνύει μια αίσθηση πολυτέλειας και το πιο σημαντικό, η υφή του κραγιόν είναι πολύ αληθινή.
Συγκριτικά, τόσο το Νο 1 όσο και το Νο 2 φαίνονται λίγο ψεύτικα, με «πλαστική αίσθηση».
Επομένως, συνολικά, ο παίκτης Νο. 3 κέρδισε αυτόν τον γύρο.
Συνοψίζοντας, συνολικά η απόδοση των τεσσάρων παικτών ήταν πολύ καλή. Κάτω από τις κινεζικές προτροπές, ο παίκτης με σκούρο άλογο Ideogram 2.0 είχε την καλύτερη απόδοση.
Ποιος είναι το Ιδεόγραμμα;
Τον Φεβρουάριο του τρέχοντος έτους, το Ideogram κυκλοφόρησε την έκδοση 1.0 Σε μόλις μισό χρόνο, εξελίχθηκε ξανά και κυκλοφόρησε την έκδοση 2.0.
Στην πραγματικότητα, το Ideogram και η Google συνδέονται στενά.
Ιδρύθηκε τον Αύγουστο του περασμένου έτους, τα τέσσερα πρώτα μέλη της ιδρυτικής ομάδας ήτανΣυγγραφέας της εργασίας Imagen σχετικά με την έρευνα γραφημάτων Google Vincentian。
Διευθύνων Σύμβουλος Mohammad Norouzi, συν-συγγραφέας της εργασίας, έλαβε την υποτροφία Google ML PhD ενώ σπούδαζε για διδακτορικό στην Επιστήμη Υπολογιστών στο Πανεπιστήμιο του Τορόντο.
Μετά την αποφοίτησή του, εντάχθηκε στο Google Brain και εργάστηκε για 7 χρόνια, φτάνοντας στη θέση του ανώτερου ερευνητήΔημιουργία μοντέλου。
Επιπλέον, είναι αρχικό μέλος της ομάδας μετάφρασης της Google Neural Machine Translation και συν-συγγραφέας του αυτο-εποπτευόμενου πλαισίου αντιθετικής μάθησης SimCLR της ομάδας Hinton.
CTO William Chan(Chen Junle), συν-συγγραφέας της εργασίας, σπούδασε στο Πανεπιστήμιο του Waterloo και στο Πανεπιστήμιο Carnegie Mellon στον Καναδά.
Όταν εντάχθηκε στην Google το 2012, εργάστηκε αρχικά σε διαφημιστικά έργα μηχανικής εκμάθησης και στη συνέχεια μετακόμισε στο Google Brain για να κάνει έρευνα για το NLP.
Ο συνιδρυτής Jonathan Ho, αποφοίτησε από το UC Berkeley με διδακτορικό, εργάστηκε στο OpenAI για ένα χρόνο και στη συνέχεια έγινε μέλος της Google.
Εκτός από τον βασικό συνεισφέροντα στο έγγραφο Imagen, έθεσε επίσης τα θεμέλια για το μοντέλο διάχυσης αποθορύφωσης.《Πιθανολογικά μοντέλα διάχυσης αποθήνωσης》Ο Pieter Abbeel, ένας από τους συν-συγγραφείς αυτής της εργασίας, είναι επίσης επενδυτής στο Ideogram AI.
Συνιδρυτής Chitwan Saharia, συν-συγγραφέας της εργασίας, αποφοίτησε από το Ινστιτούτο Τεχνολογίας της Βομβάης με πτυχίο. Έγινε μέλος της Google το 2019, όπου είναι κυρίως υπεύθυνος για την καθοδήγηση του μοντέλου διάχυσης εικόνας σε εικόνα.
Τα άλλα τρία άτομα της ιδρυτικής ομάδας,Shayaan AbdullahΉταν μηχανικός μηχανικής μάθησης στο Twitter. Άφησε τη δουλειά του τον Απρίλιο του περασμένου έτους και αργότερα εντάχθηκε στο Ideogram AI.
Τζέικομπ ΛουΜηχανικός λογισμικού, εργάστηκε σε εταιρείες όπως η Amazon πριν ενταχθεί στην Ideogram.Τζένη ΛέιΕίμαι ασκούμενος μηχανικός λογισμικού και έκανα πρακτική άσκηση στην Google πριν εγγραφώ στο Ideogram AI.
Μπορεί να φανεί ότι το Ideogram αποτελείται από κορυφαίες ερευνητικές ομάδες μοντέλων διάχυσης και έχει λάβει κεφαλαιουχικές χάρες από την έναρξή του.
Ο γύρος σποράς του Ideogram χρηματοδοτήθηκε απόa16zκαιIndex VenturesΟδήγησε την επένδυση με ποσό 16,5 εκατομμυρίων δολαρίων ΗΠΑ (περίπου 120 εκατομμύρια RMB εκείνη την εποχή).
Υπάρχουν επίσης μεμονωμένοι επενδυτές όπως ο Andrej Karpathy, ο γκουρού της ενίσχυσης της εκμάθησης Pieter Abbeel και ο συνιδρυτής του GitHub, Tom Preston-Werner.
Επιπλέον, τον Φεβρουάριο του τρέχοντος έτους, πολλές πηγές ανέφεραν ότι το Ideogram είχενέος κύκλος χρηματοδότησης。
σύμφωνα με πληροφορίες ανατράφηκε με επιτυχία80 εκατομμύρια δολάρια ΗΠΑ(περίπου 5,7 δισεκατομμύρια γιουάν) Χρηματοδότηση της σειράς Α, με επικεφαλής τον Andreessen Horowitz, και άλλους συμμετέχοντες επενδυτές περιλαμβάνουν τις Index Ventures, Redpoint Ventures, Pear VC και SV Angel.
Φαίνεται ότι η Ideogram, που έχει χρήματα και τεχνολογία, είναι αναμφίβολα ένα σκοτεινό άλογο στον τομέα της χαρτογράφησης AI.
Κυλήστε, συνεχίστε να κυλάτε.