2024-10-06
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
le dernier modèle de graphique vincentien iaflux1.1, rafraîchi l'écran pendant la nuit.
avec une seule astuce simple, vous pouvezsupprimez "l'odeur d'ia" de l'image, les personnes et les paysages peuvent obtenir des effets de qualité photo.
la réaction des internautes dans la zone de commentaires a été la suivante : je ne peux pas faire la différence, je ne peux vraiment pas faire la différence.
cette technique est également très simple à utiliser dans le mot d'invite.imitez le format de nom de fichier d'un appareil photo reflexc'est ça.
par exemple"cr2"il s'agit du format de fichier d'image brute utilisé par les appareils photo canon,"img" + nombre aléatoire + ".cr2", plus le contenu spécifié, vous pouvez obtenir une image réaliste.
plus tard, il y a eu également des retours d'internautes qui l'ont essayé et sont passés aux appareils photo sony."arw", appareil photo nikon« nef », même celui d'apple"heic"format, vous pouvez obtenir de bons résultats.
à tel point que certaines personnes ont commencé à douter que le modèle ait craché au hasard une vraie photo à partir des données d'entraînement, n'est-ce pas ?
cependant, lorsque vous zoomez et regardez certains détails spécifiques, il est facile de voir qu'ils sont bien générés par l'ia. par exemple, le texte sur le numéro de plaque d'immatriculation est tronqué.
alors, le modèle flux1.1 lui-même est-il très puissant ? quel rôle cette technique y joue-t-elle ?
un retoucheur photo senior a publié une comparaison. il a ajouté img_1018.cr2 à gauche et sans celui-ci à droite. il a pensé que la différence était énorme.
il ressort également de nos résultats de mesures réels que l’ajout de cette technique peut améliorer considérablement l’authenticité de l’image.
maintenant, si vous souhaitez essayer gratuitement ce modèle flux1.1, vous pouvez venir surensemble.aiplateforme, vous obtiendrez 5 points usd lors de votre inscription.
générez aléatoirement un selfie d'un touriste sur la grande muraille. à première vue, cela ressemble à cela, mais si vous regardez attentivement la texture de la peau du personnage, les montagnes et les plantes en arrière-plan, cela sent toujours l'ia.
si vous le remplacez par « img_0314.cr2 : selfie sur la grande muraille », est-ce que ce sera immédiatement différent ?
nom de code blueberry, le dernier modèle de diagramme sota vincent
avec la sortie officielle de flux1.1, deux modèles non réclamés qui ont été à plusieurs reprises en tête de liste des modèles vincentiens ont été"myrtille"le mystère du modèle est également levé, c'est exactement cela.
le responsable ne le cache plus et publie les données directement sur l'arène d'images de l'analyse artificielle.flux1.1 [pro]nom de code « blueberry », il a surpassé tous les autres modèles et a obtenu le score elo global le plus élevé.
en comparaison, flux1.1 [pro]c'est aussi moins cher et plus rapide, divers indicateurs surpassent midjourney, sd3, ideogram, etc.
en termes de vitesse de génération, flux1.1 [pro] est 6 fois plus rapide que la génération précédente flux.1 [pro] tout en conservant la qualité de l'image, la réponse aux commandes et les améliorations de la diversité.
à propos, flux.1 [pro] a également été mis à jour et est 2 fois plus rapide qu'avant, flux1.1 [pro] est 3 fois plus rapide que le flux.1 [pro] actuellement disponible.
en outre, le responsable a déclaré qu'une génération rapide de haute résolution serait bientôt lancée, du type que flux1.1 [pro] peut prendre en charge nativement et peut générer des images 2k sans sacrifier aucune réponse de commande.
flux1.1 [pro] sera disponible sur des plateformes en ligne telles que together.ai, replicate, fal.ai et freepik.
dans le même temps, le responsable a également lancé l'api bfl, qui peut être intégrée par d'autres développeurs dans leurs propres applications. le prix de l'api est le suivant :
flux.1 [dev] : 2,5 cents par image (environ 0,18 yuan rmb)
flux.1 [pro] : 5 cents par image (environ 0,35 yuan rmb)
flux1.1 [pro] : 4 cents par image (environ 0,28 yuan rmb)
créé par l'équipe originale de stable diffusion
derrière flux1.1 [pro] se trouveéquipe originale de stable diffusion, les membres comprennent robin rombach, andreas blattmann, dominik lorenz, etc.
△robin rombach
en fait, stable diffusion était à l’origine un projet de recherche universitaire.
dirigé par le professeur björn ommer, plusieurs membres du groupe de recherche sur la vision industrielle et l'apprentissage de l'université de munich, dont robin rombach, andreas blattmann, dominik lorenz et le chercheur runway patrick esser.
sept mois après la publication du document de recherche, stability ai est intervenu pour fournir des ressources informatiques permettant de développer davantage le modèle de génération de texte en image. en 2022, les auteurs des articles ci-dessus rejoindront stability ai.
ensemble, l'équipe a créé stable diffusion xl, stable video diffusion, etc.
l'un des meilleurs articles de l'icml 2024, le document technique rectified flow transformers of the stable diffusion 3 et la méthode adversarial diffusion distillation utilisée par sdxl-turbo sont également étudiés par ce groupe de personnes.
en mars de cette année, il a été révélé que les principaux membres de l’équipe de recherche avaient démissionné en masse.
ensuite, ils ont formé une nouvelle équipe appeléelaboratoires de la forêt-noire(laboratoires de la forêt-noire), dont le siège est en allemagne.
il vient d'être annoncé début août de cette année et a publié son modèle graphique vincent de première génération, flux.1, qui comporte trois variantes : flux.1 [pro], flux.1 [dev] et flux.1 [schnell], équilibrés. performance et accessibilité.
à l'heure actuelle, le laboratoire de la forêt-noire a finalisé un tour de table de financement d'un montant total de31 millions de dollars levés, andreessen horowitz a dirigé l'investissement, avec brendan iribe, michael ovitz, garry tan, timo aila et vladlen koltun parmi d'autres investisseurs.
on dit qu'ils ont également reçu un investissement de suivi de general catalyst et de mätchvc.
laboratoire de la forêt-noireil y a toujours une coopération avec musk, introduisant son modèle de génération d’images dans l’assistant grok de xai.
ensuite, l'équipe a révélé qu'elle lancerait le niveau sotamodèle génératif texte-vidéo。
on dit qu'ilslève 100 millions de dollars pour une valorisation de 1 milliard de dollars, une augmentation significative par rapport à la valorisation précédente de 150 millions de dollars.
de pika 1.5 à meta movie gen, la piste de génération vidéo a explosé au second semestre de cette année, et l'ajout de black forest lab pourrait apporter une étincelle différente.