Midjourney 5 melhora quase todos os aspectos das imagens geradas por IA
Melhorando: Com todas as notícias recentes envolvendo o ChatGPT e outros grandes modelos de linguagem, é fácil esquecer que seus primos - geradores de imagens AI - ainda estão melhorando. Pode-se ter descoberto como renderizar olhos e mãos sem fazer o sujeito parecer algo saído de um pesadelo. no entanto, os resultados ainda assustam algumas pessoas.
No início desta semana, o laboratório de pesquisa Midjourney lançou uma versão beta para a versão 5 de seu software de imagem AI autodenominado. De acordo com seu anúncio via Twitter, a versão mais recente adiciona maior qualidade de imagem, resultados mais "diversos", uma gama mais ampla de estilos, texturas perfeitas e muito mais.
A partir de hoje, nossa comunidade pode testar o Midjourney V5. Possui qualidade de imagem muito maior, saídas mais diversificadas, faixa estilística mais ampla, suporte para texturas contínuas, proporções mais amplas, melhor solicitação de imagem, faixa dinâmica mais ampla e muito mais. Vamos explorar!
Os usuários já postaram centenas de resultados impressionantes e os sentimentos sobre as melhorias são mistos. A maioria está impressionada porque a IA de imagem tem lutado para produzir aspectos como sombras, reflexos, olhos e mãos. Abaixo está uma imagem que criamos com o Dall-E da OpenAI como um exemplo de onde a máquina está com problemas.
A composição está um pouco errada e a sensação geral é de desenho animado. A iluminação está toda errada. Os olhos e as mãos estão muito deformados. As pernas estão sujas de artefatos, assim como a caixa de pipoca e o assento ao lado do sujeito. Este resultado é um dos quatro com problemas semelhantes em graus variados.
A versão 5 do Midjourney parece ter melhorado a esse respeito, pelo menos pelos exemplos que outros compartilharam. Os resultados de prompts simples beiram o vale misterioso - realistas o suficiente para passar por fotos profissionais em muitos casos, mas ainda com aquela qualidade estranha que você não consegue identificar. Embora incrivelmente realistas, muitos descreveram as imagens como assustadoras.
Midjourney v5 está aqui! (de verdade desta vez, lol) Aqui estão alguns dos meus prompts lado a lado, v4 vs v5, bem como alguns novos prompts e fotos da multidão. Vou adicionar mais a isso enquanto experimento.𧵠pic.twitter.com/qSEZWQBXou
Nosso próprio Kishalaya Kundu disse: "Estou mais com medo do que impressionado, para ser honesto", depois de ver uma série de fotos quase perfeitas do Midjourney V5. O medo é que alguém possa facilmente criar uma imagem falsa e passá-la como genuína.
Deixando de lado o fator de fluência, em comparação com o V4, o Midjourney V5 melhorou drasticamente a qualidade. A designer gráfica Julie Wieland usa o Midjourney V4 (lançado em novembro passado) há algum tempo e diz que a versão 5 tem texturas de pele "incrivelmente realistas". Os efeitos de iluminação também são muito melhores, incluindo reflexos, brilho e sombras. Talvez o mais importante, a IA gera mãos e olhos que parecem naturais na maioria das vezes.
�"� Dica MJ: fotos através de uma janela são finalmente possíveis com V5! Eu tenho desejado a estética "My Blueberry Nights" desde que experimentei Dalle2 pela primeira vez (e funcionou bem), mas v5 é incompreensível!� 'encontre o prompt no texto ALT das imagens #synthography #midjourneyv5 pic.twitter.com/kAOagopucG
"Os olhos estão quase perfeitos e não mais tortuosos", disse Wieland à Ars Technica. "As mãos estão corretas na maioria das vezes, com cinco dedos em vez de 7-10 em uma mão. MJ v5 atualmente me parece como finalmente conseguir óculos depois de ignorar a visão ruim por um tempo demais. De repente, você vê tudo em 4k; parece estranhamente opressor, mas também incrível."
foto do estilo de rua dos anos 1960 de uma jovem, sentada, veleiro, vestido dior verde, vestido verde de seda, vestido verde, seda, colar de pérolas, pérolas da tiffany, colar de pérolas da tiffany, pôr do sol, oceano, filmado em Agfa Vista 200, 4k --ar 16:9v4 (esquerda) v5 (direita) pic.twitter.com/wz7GbI3fvA
Midjourney também melhorou a resolução nativa de 512x512px para 1024x1024px. O aumento o alinha com Dall-E. No entanto, a versão 4 pode superamostrar para dobrar a resolução nativa. Não é razoável esperar que o V5 use a mesma técnica para produzir imagens de 2048x2048, mas isso é para uma atualização futura.