Startup do "ChatGPT francês" anuncia IA multimodal que gera texto e imagem
Pixtral 12B, da Mistral, consegue gerar conteúdo, legendar imagens e identificar objetos em fotos
Cido Coelho
A startup francesa de inteligência artificial Mistral lançou seu primeiro modelo de IA multimodal, capaz de gerar texto e imagem. Chamado de Pixtral 12B, ele conta com 12 bilhões de parâmetros e pode realizar tarefas como identificar objetos em fotos e legendar imagens.
+ Confira as últimas notícias de Tecnologia
Ele foi construído com base no modelo de texto Nemo 12B da própria startup e tem aproximadamente 24GB.
O Pixtral 12B gera respostas a perguntas com base em imagens de diferentes tamanhos e fontes. Elas podem ser enviadas por meio de links (URL) ou imagens codificadas em base64.
Semelhante ao GPT-4 da OpenAI, o Pixtral 12B pode ser utilizado de diversas formas, como em plataformas de chatbot e até mesmo em APIs para o desenvolvimento de programas e serviços.
Como acessar?
Segundo a chefe de relações com desenvolvedores da Mistral, Sophia Yang, o Pixtral 12B está disponível gratuitamente para download no GitHub e no Hugging Face, sob a licença Apache 2.0 – que permite modificações e comercialização, desde que o desenvolvedor seja creditado.
+ Todas as notícias sobre Inteligência Artificial
Yang afirma que, em breve, o sistema de IA estará integrado às plataformas proprietárias Le Chat e Le Plateforme para testes.
Mistral é a resposta europeia à OpenAI
O anúncio do Pixtral 12B aconteceu após a Mistral receber um aporte de US$ 645 milhões em uma rodada de financiamento.
+ Microsoft investe US$ 10 bilhões na OpenAI
Com esse investimento, a empresa atingiu um valor de mercado de US$ 6 bilhões, e a Microsoft detém uma participação minoritária na startup, que tem sido vista como a resposta europeia à OpenAI, com sua IA inovadora, o ChatGPT.