Νέα

Ανακοινώθηκε επίσημα η αρχική ομάδα της νέας εταιρείας StableDiffusion!Τα συνεχόμενα νέα μοντέλα ανανεώνουν το τοπίο ζωγραφικής AI

2024-08-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Το σπίτι προέρχεται από τον ναό Aofei
Qubits | Δημόσιος λογαριασμός QbitAI

μόλις,Η αρχική ομάδα της Stable Diffusion ανακοίνωσε επίσημα τη νέα εταιρεία

Ο Robin Rombach, ο οποίος ανακοίνωσε την αποχώρησή του από το Stability AI τον Μάρτιο, είναι ένας από τους δύο κύριους δημιουργούς του Stable Diffusion και δώδεκα από τους αρχικούς συνεργάτες της εταιρείας του ανακοίνωσαν επίσημα την είδηση ​​του σχηματισμού ενός ομίλου για την έναρξη μιας επιχείρησης.

Νέο όνομα εταιρείαςBlack Forest Lab, Black Forest Lab . Μόλις έκανε το ντεμπούτο του, το Kuku κυκλοφόρησε μια σειρά από 3 μοντέλα δημιουργίας εικόνων, 2 από τα οποία είναι ανοιχτού κώδικα.

καιΥποστήριξη κινεζικής εισαγωγής

Ποιο είναι το αποτέλεσμα; Οι χρήστες του Διαδικτύου που το είδαν είπαν ότι ήταν άγριο!

Εισαγάγετε τη λέξη προτροπής και δοκιμάστε ταυτόχρονα τα εφέ οθόνης και τα δεδομένα προσώπου και άλλα μέτρα ασφαλείας:

Ένα έφηβο κορίτσι που φοράει μάσκα για σκι φτιάχνει origami σε έναν αχυρώνα. Υπάρχει καθορισμένο κίτρινο κείμενο στο κάτω μέρος της εικόνας. Υπάρχει ένα πλαίσιο στο βάθος με μια εικόνα του Ομπάμα μέσα.



Μόλις είδαν αυτό το σύνολο εικόνων και κειμένων, κάποιοι χρήστες του Διαδικτύου θρηνούσαν ότι αυτό είναι το καλύτερο εφέ δημιουργίας εικόνας που έχει δει ποτέ.



Το χαρακτηριστικό αυτής της εταιρείας είναι ότι δεν είναι μυστικοπαθής.

Η ίδρυση ανακοινώθηκε επίσημα σήμερα, μια σειρά μοντέλων κυκλοφόρησε σήμερα και ανακοινώθηκε επίσης η πρόοδος χρηματοδότησης——

Ολοκληρώθηκε χρηματοδότηση 32 εκατομμυρίων δολαρίων, με επικεφαλής τον a16z, με επενδύσεις από τον συνιδρυτή της Oculus VR, Brendan Iribe, τον πρώην συνεργάτη της YC, Garry Tan, τον Timo Aila, ο οποίος ηγείται της ερευνητικής ομάδας γραφικών υπολογιστών στην NVIDIA Research, διακεκριμένος επιστήμονας της Apple (πρώην επικεφαλής επιστήμονας Intelligent Systems) Vladlen Koltun και άλλοι.

Μπορεί να ειπωθεί ότι ο Μέλανας Δρυμός όχι μόνο έχει λάβει στοιχήματα από την κεφαλαιαγορά, αλλά έχει κερδίσει και την εύνοια των ηγετών του κλάδου.

Ο πλοίαρχος της AI Kapasi έστειλε επίσης ένα συγχαρητήριο μήνυμα στο διαδίκτυο και επαίνεσε επίσης το νέο μοντέλο του Black Forest:

Προσοχή! Το μοντέλο ανοιχτού κώδικα FLUX.1 image gen φαίνεται πολύ ισχυρό.



Και σημειώστε ότι η συμφωνία ανοιχτού κώδικα είναι το χαλαρό Apache2.0.

Το ντεμπούτο του μοντέλου παραγωγής εικόνων του Μέλανα Δρυμού

Ο Καπάσι αισθάνεται ενθουσιασμένος. Ας ζήσουμε οπτικά το μοντέλο του μαύρου δάσους.

Εδώ, η Qubit έχει επιλέξει πέντε τύπους εφέ παραγωγής για εμφάνιση.

Το πρώτο επίπεδο είναι η δημιουργία κειμένου.

Προτροπή: Φωτογραφία ενός παλιού μαυροπίνακα στην τάξη. Το γραμμένο με κιμωλία στον μαυροπίνακα είναι "ας φτιάξουμε μερικά πολύ όμορφα πράγματα μαζί" με μια καρδιά κόκκινη κιμωλία μετά τις λέξεις. Ο ήλιος λάμπει μέσα από το παράθυρο.



Το δεύτερο επίπεδο είναι η μη πραγματική σκηνή + δημιουργία κειμένου.

Προτροπή: Στην υποβρύχια σκηνή, δύο κουκουβάγιες κάθονται σε ένα όμορφο τραπέζι φαγητού. Ένα κερί είναι αναμμένο στο κέντρο του τραπεζιού. Η κουκουβάγια στα αριστερά φοράει σμόκιν και η κουκουβάγια στα δεξιά ένα όμορφο φόρεμα. Υπάρχει ένα υποβρύχιο που περνάει στο βάθος με τις λέξεις "What a Hoot" στο πλάι. Η εικόνα κάτω από το τραπέζι έχει μικροσκοπικές μέδουσες που κολυμπούν στο κάτω μέρος, ένα κινηματογραφικό και όμορφο ψηφιακό έργο τέχνης.



Το τρίτο επίπεδο είναι μια πραγματική σκηνή στον πραγματικό κόσμο.

Προειδοποιητική λέξη: Μια φωτογραφία ενός όμορφου δρόμου στο Φράιμπουργκ, με ένα τραμ να περνάει και ανθρώπους να περπατούν και να κάνουν ποδήλατα.



Το τέταρτο επίπεδο είναι η γενιά πραγματικών χαρακτήρων και χαρακτήρων anime.

Προτροπή: Φωτογραφία τριών γυναικών σε δρόμο στο κέντρο της πόλης, με τα χέρια τους να απλώνονται προς την κάμερα.



Προειδοποιητική λέξη: Όμορφο έργο τέχνης anime ενός χαριτωμένου κοριτσιού γάτας που δείχνει κατάθλιψη και κρατά ένα κομμάτι χαρτί με ένα χαμόγελο ζωγραφισμένο πάνω του, είναι έτοιμο να κλάψει.



Το πέμπτο επίπεδο είναι η δημιουργία εικόνας ζώων.

Προειδοποιητική λέξη: Ένα bobcat στο δάσος, φωτογραφημένο από επαγγελματία φωτογράφο κάτω από έντονο φως.



Συμβουλή: Απόδοση σε κοντινή απόσταση ενός μυθικού πλάσματος που αποτελείται από λεπτομερή σπειροειδή φράκταλ και έλικες, λεπτομερής αναδρομική υφή δέρματος



Μοντέλα της σειράς FLUX.1

Αυτή τη φορά, το Black Forest κυκλοφόρησε τρία μοντέλα της σειράς FLUX.1: pro, dev και schnell.



FLUX.1 [pro]: Ο πιο δυνατός ήχος της σειράς.

Η ουσία της σειράς FLUX.1, η οποία παρέχει τη δημιουργία εικόνας βέλτιστης απόδοσης με την καλύτερη συμμόρφωση εντολών στην κατηγορία της, την οπτική ποιότητα, τις λεπτομέρειες της εικόνας και την ποικιλομορφία εξόδου.

Η ομάδα του Black Forest βελτιώνει σιγά σιγά τις δυνατότητες υπολογισμού συμπερασμάτων του FLUX.1 [pro] στο API.

Αυτή η έκδοση είναι προσβάσιμη μέσω του Replicate και του fal.ai, προσφέροντας αποκλειστικές και προσαρμοσμένες εταιρικές λύσεις.

FLUX.1 [dev]: Κύπελλο σε σειρά.

Ένα μοντέλο που επιτρέπει μη εμπορική χρήση, είναι ανοιχτό ζυγισμένο και αποσταγμένο.

[dev] Αποστάζεται απευθείας από το [pro], προσφέρει παρόμοια ποιότητα και άμεση συμμόρφωση ενώ είναι πιο αποτελεσματικό από τα τυπικά μοντέλα του ίδιου μεγέθους.

Μπορείτε να το δοκιμάσετε στο Huhuface ή να το δοκιμάσετε απευθείας στο Replicate ή στο fal.ai.

FLUX.1 [schnell]: Μικρός ανεμοστρόβιλος ταχύτητας.

Το πιο γρήγορο μοντέλο της σειράς, ειδικά σχεδιασμένο για τοπική ανάπτυξη και μεμονωμένους προγραμματιστές.

Το FLUX.1 [schnell] είναι δημόσια διαθέσιμο με την άδεια Apache2.0. Μπορείτε να αναζητήσετε τα βάρη του μοντέλου στο Huohuofian.

Υποστηρίζεται από το ComfyUI και μπορεί να χρησιμοποιηθεί απευθείας μέσω του Replicate ή του fal.ai.

Ας έχουμε μια διαισθητική αίσθηση!

Ακολουθούν τρεις φωτογραφίες, οι οποίες είναι τα εφέ που δημιουργούνται από το παραπάνω μεγάλο κύπελλο, μεσαίο φλιτζάνι και μικρό φλιτζάνι κάτω από διαφορετικές λέξεις προτροπής, γύρω από το θέμα "κέικ".

△Από αριστερά προς τα δεξιά, τα μοντέλα που χρησιμοποιούνται είναι μεγάλα, μεσαία και μικρά κύπελλα.

Μετά από πολλές δοκιμές, το Qubit διαπίστωσε ότι εάν εισαχθεί μια απλή λέξη προτροπής, ο χρόνος που χρειάζεται για να δημιουργηθεί μια εικόνα με την έκδοση pro είναι μεταξύ 15 και 25 δευτερολέπτων (ο χρόνος δημιουργίας θα εμφανίζεται κάτω από το διάγραμμα αποτελεσμάτων).



Το Black Forest λέει όλα τα μοντέλα FLUX.1Και οι δύο βασίζονται σε μια υβριδική αρχιτεκτονική πολυτροπικών και παράλληλης διάχυσης μπλοκ Transformer και εκτείνονται σε παραμέτρους 12B

Μεταξύ των τριών μοντέλων, τα FLUX.1 [pro] και [dev] ξεπέρασαν το Midjourney v6.0 και το DALL· όσον αφορά την οπτική ποιότητα, την άμεση απόκριση, την ευελιξία μεγέθους/αναλογίας διαστάσεων, τη στοιχειοθεσία και την ποικιλία εξόδου E 3(HD) και το Stable Diffusion 3-Ultra.

Το FLUX.1 [schnell] αποκαλείται από την ομάδα "το πιο προηγμένο μοντέλο λίγων βημάτων μέχρι σήμερα."

Όχι μόνο ξεχωρίζει μεταξύ παρόμοιων ανταγωνιστών, αλλά ξεπερνά και τα πιο ισχυρά μη συμπιεσμένα μοντέλα όπως το Midjourney v6.0 και το DALL·E 3(HD).

Ολόκληρη η σειρά FLUX.1 έχει βελτιστοποιηθεί ειδικά για να διατηρεί την πλήρη ποικιλομορφία απόδοσης της φάσης προ-προπόνησης.

Σε σύγκριση με τις υπάρχουσες τεχνολογίες, το FLUX.1 έχει τα ακόλουθα πλεονεκτήματα:



Κάποιος αναπόφευκτα θα ρωτήσει, είστε οι βετεράνοι του OG και τα βασικά μέλη του Stability AI.

Ετσι,Ποια είναι η διαφορά μεταξύ του νέου σας μοντέλου και του μοντέλου Stable Diffusion;

Τα μέλη της ιδρυτικής ομάδας απάντησαν στο Reddit:

Ακόμη και το πιο αδύναμο μοντέλο μας, η Schnell, έχει καλύτερη ποιότητα κατασκευής και ταχύτερους χρόνους κατασκευής.

Ο κύριος στόχος είναι να ιδρύσω μια νέα εταιρεία και να ξεπεράσω τον εαυτό μου.



Δημιουργήθηκε από μια ομάδα βασικών συγγραφέων SD

Μετά την εισαγωγή των πληροφοριών που σχετίζονται με το μοντέλο, ήρθε η ώρα να γνωρίσετε επίσημα αυτήν τη νέα εταιρεία.

εργαστήριο του μαύρου δάσους, μόλις ανακοινώθηκε σήμερα.

Στην επίσημη ιστοσελίδα της εταιρείας, υπάρχει ένα σύνθημα: Μια νέα εποχή δημιουργίας.

Η αποστολή της εταιρείας είναι να προωθήσει τελευταίας τεχνολογίας, υψηλής ποιότητας μοντέλα βαθιάς εκμάθησης για δημιουργία εικόνων και βίντεο και να τα καταστήσει διαθέσιμα στο ευρύτερο κοινό.

Εμφανίζεται ο Χουάντιαν!Δικα τουςΗ επόμενη φιλοδοξία είναι προφανής, που είναι η είσοδος στο χώρο της παραγωγής βίντεο.

Επίσης, πρέπει να είναι "SOTA".



Βασικό μέλοςΡόμπιν Ρόμπαχ, πρώην ερευνητής στο Stability AI.

Ενώ εργαζόταν στο Stability AI, ήταν ένας από τους κύριους προγραμματιστές του μοντέλου Stable Diffusion και συμμετείχε επίσης στην έρευνα SDXL, SVD και άλλων έργων.

Τον Μάρτιο του τρέχοντος έτους, ο Robin άφησε το Stability AI.

Ο έξω κόσμος σχολίασε ότι η αποχώρησή του έχει βλάψει σοβαρά την ήδη χαοτική εταιρεία μονόκερων - άλλωστε είναι ένας από τους δύο βασικούς παίκτες του SD.



Κοιτάζοντας πίσω, ο Robin έλαβε το προπτυχιακό και το μεταπτυχιακό του στη φυσική από το Πανεπιστήμιο της Χαϊδελβέργης.

Το 2020 ξεκίνησε σπουδές για διδακτορικό στην Επιστήμη Υπολογιστών στο Computer Vision Group στη Χαϊδελβέργη υπό την επίβλεψη του Björn Ommer και το 2021 μετακόμισε στο Πανεπιστήμιο του Μονάχου με την ερευνητική ομάδα.

Η έρευνα επικεντρώνεται στη δημιουργία μοντέλων βαθιάς μάθησης, ειδικά συστημάτων κειμένου σε εικόνα.

Το Google Scholar έχει σχεδόν 15.000 αναφορές.



Επιπλέον, μεταξύ των μελών που αποκαλύπτονται στην επίσημη ιστοσελίδα, οι Andreas Blattmann, Axel Sauer, Dominik Lorenz, Dustin Podel, Frederic Boesel, Patrick Esser, Sumith Kulal, Tim Dockhorn, Yam Levi, Zion EnglishΌλα είναι δημόσια διαθέσιμα αρχικά μέλη του Stability AI.

(Ο Andi Holmes και ο Jonas Müller δεν έχουν βρει ακόμη ακριβείς πληροφορίες)



Μπορούμε να πούμε ότι το Black Forest είναι τα αρχικά μέλη του πυρήνα των SD που έφυγαν και σαλπάρουν ξανά.

Δεν είναι περίεργο που ο Άξελ Σάουερ προώθησε το επίσημο tweet και φώναξε δυνατά:

Είμαστε ακόμα ζωντανοί!



Ακόμη ένα πράγμα

Τι σύμπτωση, την ίδια μέρα, το Stability AI έκανε επίσης νέες κινήσεις:

Παρουσίαση νέων μοντέλων AIΣταθερό Γρήγορο 3D, αξιωματούχοι λένε ότι μπορεί να χρησιμοποιηθεί σεΔημιουργήστε τρισδιάστατες εικόνες σε μισό δευτερόλεπτο

Ενώ το προηγούμενο μοντέλο χρειάστηκε λίγα λεπτά για να δημιουργήσει μια τρισδιάστατη εικόνα με παρόμοια εφέ, το νέο μοντέλο μπορεί να ολοκληρώσει την ίδια εργασία 1.200 φορές πιο γρήγορα από το υπάρχον μοντέλο.



Αυτό το Stability AI κυκλοφόρησε τον ΜάρτιοΟ Διευθύνων Σύμβουλος του δραπέτη, Emad Mostaque, τι κάνει;

Τον Ιούνιο, ανακοίνωσε επίσημα πού βρίσκεται η νέα εταιρείαSchelling AI, "θα δημιουργήσει και θα υποστηρίξει ανοιχτό κώδικα, μοντέλα και σύνολα δεδομένων που υποστηρίζονται από χρηματοδότηση AI."

Η εστίαση είναι στην καινοτόμο έρευνα και την προσεκτικά κατασκευασμένη τεχνητή νοημοσύνη που είναι πολιτισμικά συνειδητοποιημένη, επιστημονική, εκπαιδευτική και δημιουργική.

Πριν από τρεις ημέρες, η Schelling AI δημοσίευσε το πρώτο άρθρο της σειράς, "How To Think About AI".

Το άρθρο είναι λίγο μεγάλο. Οι φίλοι που ενδιαφέρονται μπορούν να το αναζητήσουν και να το δουν οι ίδιοι. Εδώ θα αναφέρω τις βασικές ιδέες.

Η τεχνητή νοημοσύνη αναπτύσσεται ταχέως, προάγοντας τον ανοιχτό κώδικα και το άνοιγμα και επιταχύνοντας την καινοτομία και τη συνεργασία.



Και τι θα λέγατε να είμαστε όλοι αξιοπρεπείς άνθρωποι!

Το tweet που αναγγέλλει την ίδρυση του Εργαστηρίου Μέλανα Δρυμού διαβιβάστηκε ευγενικά από τον πρώην Διευθύνοντα Σύμβουλο (βάλτε ένα κεφάλι σκύλου εδώ).

Σύνδεσμοι αναφοράς:
[1]https://blackforestlabs.ai
[2]https://news.ycombinator.com/item?id=41130620
[3]https://x.com/EMostaque
[4]https://www.reddit.com/r/StableDiffusion/comments/1eds0l9/does_anyone_have_an_update_on_when_stable/
[5]https://x.com/SchellingAI/status/1818600200232927721