notícias

o mais recente modelo de mapeamento de ia flux1.1 chega à tela! adicione nomes de arquivos de câmeras dslr para imagens hiper-realistas

2024-10-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

o mais recente modelo gráfico da ia ​​vicentinafluxo 1.1, atualizou a tela durante a noite.

com apenas um truque simples, você poderemova o "cheiro de ia" da imagem, tanto as pessoas quanto as paisagens podem obter efeitos de qualidade fotográfica.

a reação dos internautas na área de comentários foi do tipo: não consigo perceber a diferença, realmente não consigo perceber a diferença.

essa técnica também é muito simples de usar na palavra prompt.imite o formato de nomenclatura de arquivo de uma câmera slré isso.

por exemplo“cr2”é o formato de arquivo de imagem bruto usado pelas câmeras canon, entrada"img" + número aleatório + ".cr2", além do conteúdo especificado, você pode obter uma imagem realista.

mais tarde, também houve feedbacks de internautas que experimentaram e mudaram para câmeras sony.“arw”, câmera nikon“nef”, até mesmo da apple“heic”formato, você pode obter bons resultados.

tanto que algumas pessoas começaram a duvidar que o modelo cuspiu aleatoriamente uma foto real dos dados de treinamento, certo?

no entanto, quando você aumenta o zoom e observa alguns detalhes específicos, é fácil ver que ele é realmente gerado pela ia. por exemplo, o texto no número da placa está distorcido.

então, o próprio modelo flux1.1 é muito poderoso? qual o papel que essa técnica desempenha nele?

um artista sênior de retoque fotográfico postou uma comparação. ele adicionou img_1018.cr2 à esquerda e sem ele à direita. ele achou que a diferença era enorme.

também pode ser visto pelos nossos resultados de medição reais que adicionar esta técnica pode melhorar significativamente a autenticidade da imagem.

agora, se você quiser experimentar este modelo flux1.1 gratuitamente, você pode acessarjuntos.aiplataforma, você receberá 5 pontos em dólares ao se inscrever.

gere aleatoriamente uma selfie de um turista na grande muralha. à primeira vista, parece isso, mas se você olhar atentamente para a textura da pele do personagem, as montanhas e as plantas de fundo, ainda cheira a ia.

se você substituí-lo por "img_0314.cr2: selfie na grande muralha", será diferente imediatamente?

codinome blueberry, o mais recente modelo de diagrama sota vincent

com o lançamento oficial do flux1.1, dois modelos não reclamados que repetidamente encabeçaram a lista de modelos vicentinos foram"mirtilo"o mistério do modelo também foi levantado, é exatamente isso.

o funcionário não esconde mais e divulga os dados diretamente na arena de imagens da análise artificial.flux1.1 [pró]com o codinome “mirtilo”, superou todos os outros modelos e alcançou a pontuação elo geral mais alta.

em comparação, flux1.1 [pro]também é mais barato e rápido, vários indicadores superam midjourney, sd3, ideogram, etc.

em termos de velocidade de geração, o flux1.1 [pro] é 6 vezes mais rápido que o flux.1 [pro] da geração anterior, mantendo a qualidade da imagem, resposta de comando e melhorias de diversidade.

a propósito, agora o flux.1 [pro] também foi atualizado e está 2 vezes mais rápido do que antes, o flux1.1 [pro] é 3 vezes mais rápido que o flux.1 [pro] atualmente disponível.

além disso, o responsável disse que em breve será lançada a geração rápida de alta resolução, do tipo que o flux1.1 [pro] pode suportar nativamente, podendo gerar imagens de 2k sem sacrificar qualquer resposta de comando.

flux1.1 [pro] estará disponível em plataformas online como together.ai, replicate, fal.ai e freepik.

ao mesmo tempo, o funcionário também lançou a api bfl, que pode ser integrada por outros desenvolvedores em seus próprios aplicativos. o preço da api é:

flux.1 [dev]: 2,5 centavos por imagem (aproximadamente rmb 0,18 yuan)

flux.1 [pro]: 5 centavos por imagem (aproximadamente rmb 0,35 yuan)

flux1.1 [pro]: 4 centavos por imagem (aproximadamente rmb 0,28 yuan)

criado pela equipe original da stable diffusion

por trás do flux1.1 [pro] estáequipe original de difusão estável, os membros incluem robin rombach, andreas blattmann, dominik lorenz, etc.

robin rombach

na verdade, a difusão estável foi originalmente um projeto de pesquisa acadêmica.

liderado pelo professor björn ommer, vários membros do grupo de pesquisa sobre visão de máquina e aprendizagem da universidade de munique, incluindo robin rombach, andreas blattmann, dominik lorenz e o pesquisador da runway, patrick esser.

sete meses após a publicação do artigo de pesquisa, a stability ai interveio para fornecer recursos de computação para desenvolver ainda mais o modelo de geração de texto para imagem. em 2022, os autores dos artigos acima ingressarão na stability ai.

juntos, a equipe criou stable diffusion xl, stable video diffusion, etc.

um dos melhores artigos do icml 2024, o artigo técnico transformadores de fluxo retificados da difusão estável 3 e o método de destilação por difusão adversarial usado pelo sdxl-turbo também estão sendo estudados por este grupo de pessoas.

em março deste ano, foi revelado que esses membros da equipe principal de pesquisa renunciaram em massa.

então, eles formaram uma nova equipe chamadalaboratórios da floresta negra(laboratórios floresta negra), com sede na alemanha.

acabou de ser anunciado no início de agosto deste ano e lançou seu modelo gráfico vincent de primeira geração flux.1 tem três variantes: flux.1 [pro], flux.1 [dev] e flux.1 [schnell], balanceado. desempenho e acessibilidade.

atualmente, o laboratório floresta negra concluiu uma rodada inicial de financiamento, com um total dearrecadou us$ 31 milhões, andreessen horowitz liderou o investimento, com brendan iribe, michael ovitz, garry tan, timo aila e vladlen koltun entre outros investidores.

diz-se que eles também receberam investimentos subsequentes da general catalyst e da mätchvc.

laboratório floresta negraainda há cooperação com musk, introduzindo seu modelo de geração de imagem no assistente grok do xai.

a seguir, a equipe revelou que lançará o nível sotamodelo generativo de texto para vídeo

diz-se que elesestá levantando us$ 100 milhões com uma avaliação de us$ 1 bilhão, um aumento significativo em relação à avaliação anterior de us$ 150 milhões.

do pika 1.5 ao meta movie gen, a faixa de geração de vídeo explodiu no segundo semestre deste ano, e a adição do black forest lab pode trazer uma faísca diferente.