Inteligência artificial cria artes e imagens super realistas
Empresa que desenvolve ferramenta explica que IA que gera artes a partir de descrições de texto e imagens pré-existentes
Cido Coelho
Uma empresa dos Estados Unidos criou uma inteligência artificial capaz de gerar artes realistas por meio de descrições de texto e de imagens pré-existentes.
+ Conheça a editoria de Tecnologia do SBT News
+ Leia as últimas notícias no portal SBT News
Desenvolvida pela OpenAi e chamada de DALL-E2, a ferramenta de criação e edição de imagens foi desenvolvida para entender a linguagem humana e pode interpretá-la no menor dos detalhes.
Ela é capaz de atender qualquer solicitação de design possível. Basta gerar uma entrada de texto, com orientações, para que a ferramenta trabalhe a 'sua imaginação computadorizada'.
A DALL-E2 pode gerar versões e estilos diferentes de uma mesma ideia e imagem, além de adicionar e remover elementos de uma imagem que já existe. A ferramenta também faz pintura de imagens. A IA considera reflexos, texturas e sombras, atuando como um "Photoshop autônomo". Os resultados gerados são de até quatro vezes a resolução original.
"O DALL-E 2 aprendeu a relação entre as imagens e o texto usado para descrevê-las. Ele usa um processo chamado ?difusão?, que começa com um padrão de pontos aleatórios e gradualmente altera esse padrão para uma imagem quando reconhece aspectos específicos dessa imagem", detalhou a nota da Open AI.
Restrições contra imagens violentas
Para que a IA não crie imagens agressivas ou violentas, a empresa impôs limitações na ferramenta. Ela não poderá criar imagens violentas, de ódio ou adultas.
"Ao remover o conteúdo mais explícito dos dados de treinamento, minimizamos a exposição do DALL·E 2 a esses conceitos. Também usamos técnicas avançadas para evitar que a IA seja utilizada para gerar imagens realistas de rostos de indivíduos reais, incluindo os de figuras públicas", conta a organização.
A ferramenta só será disponiblizada para entidades aprovadas pela OpenAI. Numa perspectiva de futuro, os desenvolvedores da inteligência artificial esperam que a DALL-E 2 seja disseminada e que passe a fazer parte de funcionalidades comuns e até mesmo integrados aos programas de edição de imagem disponíveis no mercado.
Como funciona?
A inteligência artificial usa o modelo CLIP da OpenAI para codificar um texto e uma imagem no mesmo domínio, é como se ela começasse a se preparar pra fazer a receita do bolo que foi determinada. Com isso, gera uma uma representação condensada chamada de código latente.
Então, a partir disso ele usa um gerador, chamado de decodificador, que gera uma nova imagem que significa a mesma coisa que o texto.
Então, o DALL-E 2 opera em duas partes: primeiro, usa o modelo CLIP para codificar ou traduzir esta informação e o novo modelo de decodificador, para pegar essa informação codificada e gerar uma imagem a partir dela.
Com isso, as duas etapas separadas também são o motivo pelo qual podemos gerar variações das imagens. Se o texto é alterado, a imagem também pode sofrer leves modificações.