notícias

A equipe original da nova empresa da StableDiffusion é anunciada oficialmente!Novos modelos contínuos atualizam o cenário da pintura de IA

2024-08-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

A casa originou-se do Templo Aofei
Qubits | Conta pública QbitAI

apenas,A equipe original da Stable Diffusion anunciou oficialmente a nova empresa

Robin Rombach, que anunciou sua saída da Stability AI em março, é um dos dois principais autores do Stable Diffusion, e uma dúzia de seus parceiros originais da empresa anunciaram oficialmente a notícia de formar um grupo para iniciar um negócio.

Novo nome da empresaLaboratório Floresta Negra, Laboratório Floresta Negra . Assim que estreou, Kuku lançou uma série de 3 modelos de geração de imagens, 2 dos quais são de código aberto.

eSuporta entrada chinesa

Qual é o efeito? Os internautas que viram disseram que era uma loucura!

Digite a palavra de alerta e teste os efeitos de tela, dados faciais e outras medidas de segurança de uma só vez:

Uma adolescente usando máscara de esqui faz origami em um celeiro. Há um texto amarelo designado na parte inferior da imagem. Há uma moldura ao fundo com uma foto de Obama dentro.



Logo após ver esse conjunto de fotos e textos, alguns internautas lamentaram que este seja o melhor efeito de geração de imagens que ele já viu.



A característica desta empresa é que ela não é secreta.

O estabelecimento foi anunciado oficialmente hoje, uma série de modelos foram lançados hoje e o progresso do financiamento também foi anunciado——

Concluiu US$ 32 milhões em financiamento, liderado por a16z, com investimentos do cofundador da Oculus VR, Brendan Iribe, do ex-parceiro da YC Garry Tan, de Timo Aila, que lidera o grupo de pesquisa de computação gráfica da NVIDIA Research, do distinto cientista da Apple (ex-cientista-chefe da Intel Intelligent Systems) Vladlen Koltun e outros.

Pode-se dizer que a Floresta Negra não só recebeu apostas do mercado de capitais, mas também conquistou o favor dos líderes do setor.

O mestre de IA Kapasi também enviou uma mensagem de parabéns online e também elogiou o novo modelo da Floresta Negra:

Cuidado, bom! O modelo de geração de imagem FLUX.1 de código aberto parece muito poderoso.



E observe que o contrato de código aberto é o Apache2.0 gratuito.

A estreia do modelo de geração de imagens da Floresta Negra

Kapasi está animado. Vamos experimentar visualmente o efeito modelo da floresta negra.

Aqui, Qubit selecionou cinco tipos de efeitos de geração para exibir. As imagens são todas fornecidas pelo oficial e não é especificado qual modelo é usado.

O primeiro nível é a geração de texto.

Palavra de alerta: Foto de um antigo quadro-negro de sala de aula. Escrito com giz no quadro negro está "vamos fazer coisas realmente bonitas juntos" com um coração de giz vermelho após as palavras. O sol brilha pela janela.



O segundo nível é cena não real + geração de texto.

Palavra de alerta: Na cena subaquática, duas corujas estão sentadas em uma linda mesa de jantar. Uma vela está acesa no centro da mesa. As duas corujas estão desfrutando de um delicioso jantar juntas. A coruja da esquerda está de smoking e a coruja da direita está com um lindo vestido. Há um submarino passando ao fundo com as palavras "What a Hoot" pintadas na lateral. A imagem embaixo da mesa mostra pequenas águas-vivas nadando no fundo, uma bela obra de arte digital cinematográfica.



O terceiro nível é uma cena real no mundo real.

Palavra de alerta: Foto de uma linda rua de Freiburg, com um bonde passando e pessoas andando e andando de bicicleta.



O quarto nível é a geração de personagens reais e personagens de anime.

Palavra de alerta: Foto de três mulheres em uma rua do centro da cidade, com as mãos estendidas em direção à câmera.



Palavra de alerta: Linda arte de anime de uma linda gata parecendo deprimida e segurando um pedaço de papel com um sorriso desenhado, ela está prestes a chorar.



O quinto nível é a geração de imagens de animais.

Palavra de alerta: Um lince na floresta, fotografado por um fotógrafo profissional sob luz forte.



Palavra da dica: Renderização em close de uma criatura mítica composta de fractais espirais detalhados e gavinhas, textura de pele recursiva detalhada



Modelos da série FLUX.1

Desta vez, a Black Forest lançou três modelos da série FLUX.1: pro, dev e schnell.



FLUX.1 [pro]: O som mais forte da série.

A essência da série FLUX.1, fornecendo geração de imagem de desempenho ideal com a melhor conformidade de comando, qualidade visual, detalhes de imagem e diversidade de saída.

A equipe da Floresta Negra está melhorando lentamente os recursos de computação de inferência do FLUX.1 [pro] na API.

Esta versão pode ser acessada através do Replicate e fal.ai, oferecendo soluções empresariais dedicadas e customizadas.

FLUX.1 [dev]: Copa em série.

Um modelo que permite uso não comercial, é de peso aberto e destilado.

[dev] Destilado diretamente de [pro], oferece qualidade semelhante e conformidade imediata, ao mesmo tempo que é mais eficiente do que modelos padrão do mesmo tamanho.

Você pode experimentá-lo no Huhuface ou diretamente no Replicate ou fal.ai.

FLUX.1 [schnell]: Pequeno redemoinho de velocidade.

O modelo mais rápido da série, feito sob medida para desenvolvimento local e desenvolvedores individuais.

FLUX.1 [schnell] está disponível publicamente sob a licença Apache2.0. Os pesos do modelo podem ser consultados em Huohuofian. O código de inferência pode ser encontrado no GitHub.

Ele foi suportado pelo ComfyUI e pode ser usado diretamente, mas também por meio do Replicate ou fal.ai.

Vamos ter uma sensação intuitiva!

Aqui estão três fotos, que são os efeitos gerados da xícara grande, xícara média e xícara pequena acima, sob diferentes palavras de alerta, em torno do tema "bolo".

△Da esquerda para a direita, os modelos utilizados são copos grandes, médios e pequenos.

Depois de muitos testes, Qubit descobriu que se uma simples palavra de prompt for inserida, o tempo que leva para gerar uma imagem com a versão pro fica entre 15s e 25s (o tempo de geração será exibido abaixo do gráfico de resultados).



Floresta Negra diz todos os modelos FLUX.1Ambos são baseados em uma arquitetura híbrida de blocos transformadores de difusão multimodal e paralela e se estendem a parâmetros de 12B

Entre os três modelos, FLUX.1 [pro] e [dev] superaram Midjourney v6.0 e DALL· em termos de qualidade visual, capacidade de resposta rápida, flexibilidade de proporção de tamanho/aspecto, composição tipográfica e diversidade de saída E 3(HD) e Stable. Difusão 3-Ultra.

FLUX.1 [schnell] é chamado pela equipe de “o modelo de poucas etapas mais avançado até hoje”.

Não só se destaca entre concorrentes semelhantes, como também supera modelos não comprimidos mais potentes, como Midjourney v6.0 e DALL·E 3(HD).

Toda a série FLUX.1 foi especificamente ajustada para manter toda a diversidade de resultados da fase de pré-treinamento.

Comparado com as tecnologias existentes, o FLUX.1 tem as seguintes vantagens:



Alguém inevitavelmente perguntará: vocês são os veteranos do OG e membros principais do Stability AI.

Então,Qual é a diferença entre o seu novo modelo e o modelo de difusão estável?

Os membros da equipe fundadora responderam no Reddit:

Mesmo o nosso modelo mais fraco, Schnell, tem melhor qualidade de construção e tempos de construção mais rápidos.

O principal objetivo é estabelecer uma nova empresa e me superar.



Criado por uma equipe de autores principais do SD

Depois de apresentar as informações relacionadas ao modelo, é hora de conhecer formalmente esta nova empresa.

laboratório floresta negra, acaba de ser anunciado hoje.

No site oficial da empresa há um slogan: Uma nova era de criação.

A missão da empresa é desenvolver modelos de aprendizagem profunda de alta qualidade e de última geração para geração de imagens e vídeos e disponibilizá-los ao público mais amplo.

Huadian aparece!DelesA próxima ambição é óbvia, que é entrar na área de geração de vídeo.

Além disso, deve ser "SOTA".



Membro principalRobin Rombach, ex-cientista pesquisador da Stability AI.

Enquanto trabalhava na Stability AI, foi um dos principais desenvolvedores do modelo Stable Diffusion e também participou da pesquisa de SDXL, SVD e outros projetos.

Em março deste ano, Robin deixou o Stability AI.

O mundo exterior comentou que sua saída prejudicou gravemente a já caótica empresa unicórnio – afinal, ele é um dos dois principais players da SD.



Olhando para trás, Robin recebeu sua graduação e mestrado em física pela Universidade de Heidelberg.

Em 2020, começou a estudar para doutorado em Ciência da Computação no Computer Vision Group em Heidelberg sob a supervisão de Björn Ommer, e em 2021 mudou-se para a Universidade de Munique com o grupo de pesquisa.

A pesquisa se concentra na geração de modelos de aprendizagem profunda, especialmente sistemas de texto para imagem.

O Google Scholar tem quase 15.000 citações.



Além disso, entre os integrantes divulgados no site oficial, estão Andreas Blattmann, Axel Sauer, Dominik Lorenz, Dustin Podel, Frederic Boesel, Patrick Esser, Sumith Kulal, Tim Dockhorn, Yam Levi, Zion EnglishTodos são membros originais do Stability AI disponíveis publicamente.

(Andi Holmes e Jonas Müller ainda não encontraram informações precisas)



Pode-se dizer que a Floresta Negra é o núcleo original do SD que partiu e zarpou novamente.

Não é à toa que Axel Sauer encaminhou o tweet oficial e gritou bem alto:

Ainda estamos vivos!



Mais uma coisa

Que coincidência, no mesmo dia, a Stability AI também fez novos movimentos:

Lançamento de novos modelos de IAEstável Rápido 3D, as autoridades dizem que pode ser usado emGere imagens 3D em meio segundo

Embora o modelo anterior demorasse alguns minutos para gerar uma imagem 3D com efeitos semelhantes, o novo modelo pode completar a mesma tarefa 1.200 vezes mais rápido que o modelo existente.



Aquela Stability AI lançada em marçoCEO fugitivo, Emad Mostaque, o que ele está fazendo?

Em junho, ele anunciou oficialmente seu paradeiro à nova empresa.Schelling IA, "construirá e apoiará código-fonte aberto, modelos e conjuntos de dados apoiados pelo financiamento de IA."

O foco está na pesquisa inovadora e na IA cuidadosamente construída que seja culturalmente consciente, científica, educacional e criativa.

Há três dias, Schelling AI publicou o primeiro artigo da série, "How To Think About AI".

O artigo é um pouco longo. Amigos interessados ​​​​podem pesquisá-lo e visualizá-lo. Aqui mencionarei as ideias principais——

A IA está a desenvolver-se rapidamente, promovendo o código aberto e a abertura, e acelerando a inovação e a colaboração.



E que tal sermos todos pessoas decentes!

O tweet anunciando a criação do Laboratório Floresta Negra foi gentilmente encaminhado pelo ex-CEO (coloque aqui uma cabeça de cachorro).

Links de referência:
[1]https://blackforestlabs.ai
[2]https://news.ycombinator.com/item?id=41130620
[3]https://x.com/EMostaque
[4]https://www.reddit.com/r/StableDiffusion/comments/1eds0l9/does_anyone_have_an_update_on_when_stable/
[5]https://x.com/SchellingAI/status/1818600200232927721