Alura > Cursos de Inteligência Artificial > Cursos de IA para Criativos > Conteúdos de IA para Criativos > Primeiras aulas do curso Inteligência artificial Generativa: Midjourney e ChatGPT

Inteligência artificial Generativa: Midjourney e ChatGPT

Conhecendo o Midjourney - Apresentação

Guilherme: Olá e boas-vindas a esse curso de Inteligência Artificial Generativa, no qual utilizaremos o ChatGPT e o Midjourney para explorar possibilidades de uso de AIs (Artificial Intelligence) no dia a dia.

Paulo: Mais do que usar essas ferramentas em específico, que estão muito populares, queremos mostrar como é possível pensar de ponta a ponta para que as inteligências artificiais auxiliem o nosso trabalho, além de ter uma boa ideia das limitações dessas ferramentas. Certo, Guilherme?

Guilherme: Isso mesmo.

Paulo: Eu sou Paulo Silveira, um dos líderes da Alura. Sou um homem branco de cabelo preto curto, estou usando óculos de armação azul e uma camiseta preta da FIAP, a nossa faculdade.

Guilherme: E eu sou Guilherme Silveira, professor da Alura. Sou não-binário, branco de cabelo preto e uso uma camiseta cinza da Alura.

Conhecendo o Midjourney - Explorando o Midjourney

Paulo: Guilherme, acho que sem dúvidas um dos principais exemplos de inteligência artificial generativa são os geradores de imagem, por exemplo o Midjourney. Mas existem vários, certo? Ele é só uma dessas várias ferramentas que, dado um prompt, vai tentar criar uma imagem, até UX de websites.

Mas tudo que conversarmos aqui vale também para o Dall-e, além de outras ferramentas já no mercado ou que ainda vão aparecer. Todas têm por trás os mesmos princípios, e para dominá-las e direcioná-las é necessário tomar certos cuidados.

Guilherme: Isso. Essa geração específica de inteligência artificial utiliza um texto, uma frase, na qual descrevemos aquilo que gostaríamos de ver em uma imagem. Existem outras gerações, mais antigas e mais recentes, que utilizam outras formas de gerar imagens.

Paulo: Acho que essas que estão baseadas em texto ganharam muito poder devido a UX. Todo esse boom do ChatGPT, Midjourney, Dall-e e do Bing vem porque a forma que pedimos que a IA faça algo é muito natural.

Acessando o showcase do Midjourney, podemos clicar em alguma das imagens e receber o prompt que a gerou. Por exemplo:

Ilustração no estilo de Maxfield Parrish

Ilustração digital colorida. Figura humana de costas observa uma grande cachoeira iluminada parcialmente iluminada pelo sol.

Fotografia hiperrealista, jovem chimpanzé feliz usando um capacete de aviação vintage

Ilustração digital colorida. Filhote de chimpanzé utilizando um chapéu de aviação vintage. Ao fundo, nuvens brancas.

Essa descrição é o que chamamos de "prompt". Conforme você pega outros exemplos, percebe que "fotorrealista" é um adjetivo muito utilizado. Às vezes também encontramos "8K", não porque a pessoa quer uma imagem nessa resolução, mas porque imagens em 8K estão muito ligados a algo muito detalhado, com muitas cores, efeitos de blur e assim por diante. São alguns truques que eu gostaria que fôssemos pegando.

Como fazemos para usar o Midjourney hoje em dia? Obviamente que sempre pode mudar, inclusive tem mudado bastante.

Guilherme: Para esse uso mais simples, que é a geração a partir do texto, é necessário acessar o Discord deles. Eu estou usando a versão paga, mas também existe uma versão gratuita.

Paulo: Que você acessa pelo "Join Beta" no site deles.

Guilherme: Nas atividades vamos colocar o link. Já no Discord, você vai escrever um texto, como se fosse uma conversa com esse bot. Na versão paga você tem acesso a um chat privado, já na versão gratuita é utilizado um canal público.

Paulo: Esse canal público é bem cheio, bagunçado, com muita informação.

Guilherme: Mas é legal porque você vai ter seu resultado, de graça, e também poderá ver os resultados de outras pessoas. Vou gerar uma imagem para testarmos o que deve ser digitado na conversa.

Para iniciar o prompt, insira o comando /imagine seguido do texto que descreve a imagem a ser gerada.

Guilherme: Vou imaginar duas pessoas gravando um curso sobre inteligência artificial em um estúdio com luzes azuis neon. Após pressionar "Enter", é necessário esperar algum tempo - e esse tempo varia, também, se você estiver usando a versão paga ou gratuita.

Paulo: No modo gratuito você estará em um canal de Discord com informações que passam muito rapidamente, o que pode assustar quem não está habituado.

Guilherme: Exatamente. Você que ele começa a gerar, o que é indicado por uma porcentagem crescente. Começa com uma "bagunça", uma imagem que é literalmente ruído, sem nenhum sentido, e começa a chegar em alguma conclusão. Ao acabar, teremos quatro sugestões de imagens:

Duas pessoas gravando um curso sobre inteligência artificial em um estúdio com luzes azul neon.

Quatro ilustrações digitais coloridas com predominância de azul neon. A primeira mostra um esqueleto humano sentado, desenhando em um papel utilizando canetas em ambas as mãos. A segunda mostra uma figura humanoide agachada de frente a um cavalete onde há uma pintura de um esqueleto humanoide. A terceira mostra um homem de barba e óculos, usando um casaco e desenhando em um caderno em meio a uma multidão. A quarta mostra um esqueleto humano agachado com um caderno aberto nas mãos, enquanto outro esqueleto está sentado ao fundo.

No próximo vídeo vamos tentar refinar esse prompt e o resultado dessa imagem, além de explorar outras questões.

Conhecendo o Midjourney - Ajustes e redução de ruídos na geração de imagens

Terminamos o vídeo anterior com o seguinte prompt:

Duas pessoas gravando um curso sobre inteligência artificial em um estúdio com luzes azul neon.

Quatro ilustrações digitais coloridas com predominância de azul neon. A primeira mostra um esqueleto humano sentado, desenhando em um papel utilizando canetas em ambas as mãos. A segunda mostra uma figura humanoide agachada de frente a um cavalete onde há uma pintura de um esqueleto humanoide. A terceira mostra um homem de barba e óculos, usando um casaco e desenhando em um caderno em meio a uma multidão. A quarta mostra um esqueleto humano agachado com um caderno aberto nas mãos, enquanto outro esqueleto está sentado ao fundo.

Paulo: Guilherme, aqui tem alguns detalhes interessantes. A luz azul neon pegou demais, não entendeu que eram algumas luzes azuis dentro de um estúdio. A Suellen, que trabalha conosco, também falou que a palavra "estúdio" pegou muito em um sentido literal, como um estúdio de arte, e não deu para entender que era um local de gravação.

Assim, ficou muito a ideia da caneta desenhando, pintando. Tem também aqui alguns estereótipos, como o homem máquina e o homem hipster de óculos e barba que é meio envolvido com tecnologia. A gente queria dar um passo além.

Isso já mostra a importância da gente refletir e pedir para essas inteligências artificiais algo mais específico. Se você for ver, é um problema humano também, um problema de comunicação. Se a gente manda para um time de design o mesmo prompt, se a pessoa não tem um contexto, fica muito aberto.

Há a necessidade de sermos específicos no projeto, de ter algo bem definido.

Guilherme: Sim, porque boa parte do que foi dito foi retratado na imagem: duas pessoas, gravando um curso de inteligência artificial em um estúdio e com luz azul. Mas não é o que a gente queria. Nesse caso, podemos tentar novamente.

Vamos fazer um novo /imagine.

Duas pessoas gravando um curso sobre inteligência artificial. O ambiente é feito em uma sala com luz de fundo azul neon fraca, e luz branca sobre os dois professores. Ambiente de tecnologia, cada professor tem um notebook e queremos passar a imagem de uma interação homem-máquina.

Guilherme: Eu acho que ficou muito complexo para o Midjourney entender. Acontece que nem todas as palavras têm o mesmo valor. Quando falamos uma frase, mesmo que a gente tire algumas palavras ou letras, a gente entende tudo.

Isso incorre em algumas situações. Por exemplo, se temos o número dois, precisa ser dois, não pode ser um ou três, porque nós damos valor a essa palavra. A IA, no entanto, pode não dar o mesmo valor a essa palavra. Não é que ele não entende, mas sim que, ao processar uma frase, ela pode atribuir mais ou menos valor a determinadas palavras. Se ela não der tanto valor para o número dois, não teremos duas pessoas retratadas.

Quatro ilustrações digitais coloridas fotorrealistas de salas de aula ocupadas por pessoas usando computadores.

Paulo: E aqui eu troquei a palavra, né? Eu usei "duas pessoas" primeiro, depois usei "professores". Ficou difícil de entender se essas pessoas são os professores ou não, ficou um pouco ambíguo. E aí ele colocou uma sala de aula. Sem a palavra "estúdio" ficou complicado, não deu a entender que é uma gravação profissional.

Eu tentaria de novo usando sempre "duas pessoas".

Guilherme: Poderia ser "dois professores gravando um curso sobre inteligência artificial". Pode ser?

Paulo: Uhum.

Dois professores gravando um curso sobre inteligência artificial. O ambiente é de sala profissional de gravação com fundo neon azul e iluminação branca.

Paulo: E o ambiente desse estúdio é de tecnologia.

Guilherme: Acho que não precisa, acho que isso vai referenciar mais computadores e coisas do gênero, que não é o que a gente está buscando. Eu chutaria só isso mesmo, um pouco mais direto.

A gente cai nesse problema, que é o problema do conteúdo. O que eu quero nessa imagem? E já surge a dificuldade de dizer para a máquina aquilo que nós queremos. Isso é um treino, é uma habilidade que vamos pegando à medida que vamos nos comunicando com a IA e praticando, entendendo como ela entende o que estamos pedindo.

Olha o resultado aqui, já ficou bem mais direcionado.

Quatro ilustrações digitais representando duas pessoas sentadas em mesas de escritório com projeções de dados e esquemas na parede. A cor azul neon é predominante.

Guilherme: Temos duas pessoas, dois professores talvez, com algum tópico de inteligência artificial e a luz azul. Esses pontos estão aparecendo. O estúdio ficou meio de lado.

Paulo: Aí tem aqueles truques de cada uma dessas ferramentas. Se você for naquele showcase que a gente mostrou do Midjourney no começo, você vai ver que as pessoas já entenderam que determinados adjetivos ajudam a chegar em determinado estilo.

Então, como exemplo, podemos copiar e colar esse último prompt e adicionar as palavras "fotorrealista", "hiper-realista" e "8k". Esses são alguns que já testei.

Guilherme: Em português ou inglês?

Paulo: Os dois funcionam.

Guilherme: Vou colocar em português então.

Dois professores gravando um curso sobre inteligência artificial. O ambiente é de sala profissional de gravação com fundo neon azul e iluminação branca. Fotorrealista. Hiper realista. 8K. Iluminação dramática.

Guilherme: Esses são os chamados "estilos" que você aplica. Assim como você tem o prompt, temos o parâmetro "estilo", em que você pode colocar um número. Esse número pertence aos diversos estilos classificados pelo próprio Midjourney.

Repare que existem várias formas de customizar. Essa forma, através do estilo, ou através de um parâmetro extra. E repare no showcase que diversas imagens são geradas, às vezes, a partir de uma pequena frase seguida de palavras soltas. Por exemplo:

chapeuzinho vermelho pós-apocalíptica em manto esfarrapado. ruas da cidade. fumaça. varrido pelo vento.

Ilustração digital colorida de chapeuzinho vermelho com roupas desgastadas em um cenário destruído.

A IA ainda não entende sentenças completas, mas entende as palavras individualmente.

Paulo: E a gente está usando a palavra "entende", mas a verdade é que ela foi treinada com uma quantidade massiva de dados. Assim, quando aparece uma palavra, ela tem um determinado comportamento.

Vamos ver o resultado do nosso prompt:

Quatro ilustrações digitais fotorrealistas representando duas pessoas sentadas em uma mesa. Ao redor delas, livros e e projeções de dados e esquemas. A cor azul neon é predominante.

Guilherme: Note que mudou o estilo. Antes tínhamos um estilo mais de ilustração, mais cartunesco e simples. Agora temos algo mais fotorrealista, principalmente as três primeiras.

Paulo: A quarta caiu no estereótipo de "professor maluco", não é?

Guilherme: O azul e o neon são palavras que ainda estão muito fortes aqui. Se decidirmos que não queremos esse azul neon, basta digitarmos o mesmo prompt, substituindo o azul neon por qualquer outra coisa. Vamos substituir por "colorido", somente para reforçar que não queremos preto e branco.

Paulo: Eu acho que ele vai trazer bem mais colorido do que a gente imagina.

Guilherme: O que eu quero é isso, que ele traga algo mais vivo, em cores, com mais contrastes. Só pra mostrar para vocês a riqueza de cores, porque tudo que geramos até agora foi bem azulado.

Paulo: Engraçado o estereótipo dos professores. Quando era "duas pessoas", tínhamos outro perfil de imagem.

Dois professores gravando um curso sobre inteligência artificial. O ambiente é de sala profissional de gravação. Colorido. Fotorrealista. Hiper realista. 8K. Iluminação dramática.

Quatro ilustrações digitais coloridas representando duas pessoas sentadas em uma mesa fazendo anotações em seus cadernos.

Guilherme: Você vê que ficou colorido. Ao longo do processamento, o rosto das pessoas era colorido. A IA foi removendo isso, porque sabe que pessoas não costumam ter o rosto colorido.

Paulo: E na imagem do canto inferior direito apareceu alguma tecnologia. O Midjourney também nos dá a opção de fazer um upscale ou gerar variações de uma imagem por meio dos botões abaixo das imagens geradas. Cada número, de 1 a 4, se refere a uma das quatro imagens geradas, da esquerda para a direita e de cima para baixo.

U1, U2, U3 e U4, para gerar imagens em maior resolução

V1. V2, V3, e V4, para gerar variações de uma imagem

Paulo: O U4 geraria uma versão mais detalhada da quarta imagem, e a V4 geraria variações a partir dessa imagem. Para isso, a IA usaria um seed. É uma forma de refinar o que queremos gerar.

Guilherme: No próximo vídeo vamos explorar um pouco as variações, upscale e refeitura das imagens.

Sobre o curso Inteligência artificial Generativa: Midjourney e ChatGPT

O curso Inteligência artificial Generativa: Midjourney e ChatGPT possui 98 minutos de vídeos, em um total de 34 atividades. Gostou? Conheça nossos outros cursos de IA para Criativos em Inteligência Artificial, ou leia nossos artigos de Inteligência Artificial.

Matricule-se e comece a estudar com a gente hoje! Conheça outros tópicos abordados durante o curso:

Aprenda IA para Criativos acessando integralmente esse e outros cursos, comece hoje!

Plus

De
R$ 1.800
12X
R$109
à vista R$1.308
  • Acesso a TODOS os cursos da Alura

    Mais de 1500 cursos completamente atualizados, com novos lançamentos todas as semanas, emProgramação, Front-end, UX & Design, Data Science, Mobile, DevOps e Inovação & Gestão.

  • Alura Challenges

    Desafios temáticos para você turbinar seu portfólio. Você aprende na prática, com exercícios e projetos que simulam o dia a dia profissional.

  • Alura Cases

    Webséries exclusivas com discussões avançadas sobre arquitetura de sistemas com profissionais de grandes corporações e startups.

  • Certificado

    Emitimos certificados para atestar que você finalizou nossos cursos e formações.

Matricule-se

Pro

De
R$ 2.400
12X
R$149
à vista R$1.788
  • Acesso a TODOS os cursos da Alura

    Mais de 1500 cursos completamente atualizados, com novos lançamentos todas as semanas, emProgramação, Front-end, UX & Design, Data Science, Mobile, DevOps e Inovação & Gestão.

  • Alura Challenges

    Desafios temáticos para você turbinar seu portfólio. Você aprende na prática, com exercícios e projetos que simulam o dia a dia profissional.

  • Alura Cases

    Webséries exclusivas com discussões avançadas sobre arquitetura de sistemas com profissionais de grandes corporações e startups.

  • Certificado

    Emitimos certificados para atestar que você finalizou nossos cursos e formações.

  • Luri, a inteligência artificial da Alura

    Luri é nossa inteligência artificial que tira dúvidas, dá exemplos práticos e ajuda a mergulhar ainda mais durante as aulas. Você pode conversar com Luri até 100 mensagens por semana.

  • Alura Língua (incluindo curso Inglês para Devs)

    Estude a língua inglesa com um curso 100% focado em tecnologia e expanda seus horizontes profissionais.

Matricule-se
Conheça os Planos para Empresas

Acesso completo
durante 1 ano

Estude 24h/dia
onde e quando quiser

Novos cursos
todas as semanas