Inteligência artificial cria artes e imagens super realistas
Empresa que desenvolve ferramenta explica que IA que gera artes a partir de descrições de texto e imagens pré-existentes
C
Cido Coelho
11/04/2022, 16:00 • Atualizado em 25/11/2024, 10:49
compartilhar
imagem de cavalo com roupa de astronauta criada por uma inteligência artificial
Uma empresa dos Estados Unidos criou uma inteligência artificial capaz de gerar artes realistas por meio de descrições de texto e de imagens pré-existentes.
Acompanhe o SBT News nas TVs por assinatura Claro (586), Vivo (576), Sky (580) e Oi (175), via streaming pelo +SBT, Site e YouTube, além dos canais nas Smart TVs Samsung e LG.
Desenvolvida pela OpenAi e chamada de DALL-E2, a ferramenta de criação e edição de imagens foi desenvolvida para entender a linguagem humana e pode interpretá-la no menor dos detalhes.
Ela é capaz de atender qualquer solicitação de design possível. Basta gerar uma entrada de texto, com orientações, para que a ferramenta trabalhe a 'sua imaginação computadorizada'.
Imagens criadas pela inteligência artificial | Divulgação/OpenAI
A DALL-E2 pode gerar versões e estilos diferentes de uma mesma ideia e imagem, além de adicionar e remover elementos de uma imagem que já existe. A ferramenta também faz pintura de imagens. A IA considera reflexos, texturas e sombras, atuando como um "Photoshop autônomo". Os resultados gerados são de até quatro vezes a resolução original.
"O DALL-E 2 aprendeu a relação entre as imagens e o texto usado para descrevê-las. Ele usa um processo chamado ?difusão?, que começa com um padrão de pontos aleatórios e gradualmente altera esse padrão para uma imagem quando reconhece aspectos específicos dessa imagem", detalhou a nota da Open AI.
Ferramenta pode acrescentar elementos em qualquer imagem, neste caso, o cachorro foi adicionado pela IA | Divulgação/OpenAI
Restrições contra imagens violentas
Para que a IA não crie imagens agressivas ou violentas, a empresa impôs limitações na ferramenta. Ela não poderá criar imagens violentas, de ódio ou adultas.
"Ao remover o conteúdo mais explícito dos dados de treinamento, minimizamos a exposição do DALL·E 2 a esses conceitos. Também usamos técnicas avançadas para evitar que a IA seja utilizada para gerar imagens realistas de rostos de indivíduos reais, incluindo os de figuras públicas", conta a organização.
A dupla de flamingos que refletem no espelho d'água também foi acrescentado pela DALL-E 2 | Divulgação/OpenAI
A ferramenta só será disponiblizada para entidades aprovadas pela OpenAI. Numa perspectiva de futuro, os desenvolvedores da inteligência artificial esperam que a DALL-E 2 seja disseminada e que passe a fazer parte de funcionalidades comuns e até mesmo integrados aos programas de edição de imagem disponíveis no mercado.
Como funciona?
Esquema de funcionamento da inteligência artificial na criação das imagens | Divulgação/OpenAI
A inteligência artificial usa o modelo CLIP da OpenAI para codificar um texto e uma imagem no mesmo domínio, é como se ela começasse a se preparar pra fazer a receita do bolo que foi determinada. Com isso, gera uma uma representação condensada chamada de código latente.
Então, a partir disso ele usa um gerador, chamado de decodificador, que gera uma nova imagem que significa a mesma coisa que o texto.
Então, o DALL-E 2 opera em duas partes: primeiro, usa o modelo CLIP para codificar ou traduzir esta informação e o novo modelo de decodificador, para pegar essa informação codificada e gerar uma imagem a partir dela.
Com isso, as duas etapas separadas também são o motivo pelo qual podemos gerar variações das imagens. Se o texto é alterado, a imagem também pode sofrer leves modificações.
Veja como a inteligência artificial da OpenAi age (vídeo em inglês):
Inteligência artificial cria artes e imagens super realistas Empresa que desenvolve ferramenta explica que IA que gera artes a partir de descrições de texto e imagens pré-existentesTecnologia2022-04-11T16:00:00.000ZUma empresa dos Estados Unidos criou uma inteligência artificial capaz de gerar artes realistas por meio de descrições de texto e de imagens pré-existentes. Desenvolvida pela OpenAi e chamada de DALL-E2, a ferramenta de criação e edição de imagens foi desenvolvida para entender a linguagem humana e pode interpretá-la no menor dos detalhes. Ela é capaz de atender qualquer solicitação de design possível. Basta gerar uma entrada de texto, com orientações, para que a ferramenta trabalhe a 'sua imaginação computadorizada'. A DALL-E2 pode gerar versões e estilos diferentes de uma mesma ideia e imagem, além de adicionar e remover elementos de uma imagem que já existe. A ferramenta também faz pintura de imagens. A IA considera reflexos, texturas e sombras, atuando como um "Photoshop autônomo". Os resultados gerados são de até quatro vezes a resolução original. "O DALL-E 2 aprendeu a relação entre as imagens e o texto usado para descrevê-las. Ele usa um processo chamado ?difusão?, que começa com um padrão de pontos aleatórios e gradualmente altera esse padrão para uma imagem quando reconhece aspectos específicos dessa imagem", detalhou a nota da Open AI. Restrições contra imagens violentas Para que a IA não crie imagens agressivas ou violentas, a empresa impôs limitações na ferramenta. Ela não poderá criar imagens violentas, de ódio ou adultas. "Ao remover o conteúdo mais explícito dos dados de treinamento, minimizamos a exposição do DALL·E 2 a esses conceitos. Também usamos técnicas avançadas para evitar que a IA seja utilizada para gerar imagens realistas de rostos de indivíduos reais, incluindo os de figuras públicas", conta a organização. A ferramenta só será disponiblizada para entidades aprovadas pela OpenAI. Numa perspectiva de futuro, os desenvolvedores da inteligência artificial esperam que a DALL-E 2 seja disseminada e que passe a fazer parte de funcionalidades comuns e até mesmo integrados aos programas de edição de imagem disponíveis no mercado. Como funciona? A inteligência artificial usa o modelo CLIP da OpenAI para codificar um texto e uma imagem no mesmo domínio, é como se ela começasse a se preparar pra fazer a receita do bolo que foi determinada. Com isso, gera uma uma representação condensada chamada de código latente. Então, a partir disso ele usa um gerador, chamado de decodificador, que gera uma nova imagem que significa a mesma coisa que o texto. Então, o DALL-E 2 opera em duas partes: primeiro, usa o modelo CLIP para codificar ou traduzir esta informação e o novo modelo de decodificador, para pegar essa informação codificada e gerar uma imagem a partir dela. Com isso, as duas etapas separadas também são o motivo pelo qual podemos gerar variações das imagens. Se o texto é alterado, a imagem também pode sofrer leves modificações. Veja como a inteligência artificial da OpenAi age (vídeo em inglês): São PauloSPSudestehttps://sbtnews.sbt.com.br/noticia/tecnologia/204330-inteligencia-artificial-cria-artes-e-imagens-super-realistas
Enchentes no RS: IBGE revela dimensão do impacto nas casas
Dados mostram que a maioria dos domicílios enfrentou ocorrências relacionadas às enchentes, com impacto na estrutura das casas e no bem-estar da população