IA que conversa com você e mais: o que foi novidade no Google I/O 2024?
Gigante da tecnologia anuncia vários usos de inteligência artificial no buscador e em produtos
"A Era Gemini". Foi assim que o Google definiu o pacote de novidades anunciado no primeiro dia do evento Google I/O 2024, que começou na segunda-feira (14).
O Google I/O é uma conferência de programadores organizada todos os anos pela big tech na sede de São Francisco, Califórnia, Estados Unidos. O evento é um palco para anúncios aos desenvolvedores, além de apresentar as novidades que a empresa lançará no mercado.
A empresa de tecnologia monopolizou o tema da inteligência artificial generativa. Todos os produtos anunciados tinham relação com a IAG ou GenAI. Para se ter uma ideia, o Google mencionou o termo IA 121 vezes durante a apresentação.
Foram anunciados detalhes sobre o Gemini 1.5, Project Astra, novos recursos de busca, Imagen 3 e Veo. Além da integração da IA aos recursos tradicionais do Google, como Gmail e Fotos.
Confira abaixo os principais lançamentos:
Busca do Google com Gemini integrado
O seu principal produto, o buscador Google, que é usado quase de forma unânime na internet, será integrado à inteligência artificial.
O usuário poderá interagir com o buscador como se estivesse conversando com a IA.
Por exemplo, você pode pedir para a ferramenta criar um cardápio para a semana ou a criação de um roteiro turístico, ou até mesmo fazer buscas complexas, que demandam um histórico e contexto.
Além disso, será possível fazer buscas a partir do envio de vídeos para o sistema. Para isso, basta gravar algum objeto ou lugar e subir o vídeo gravado no buscador, que ele fará uma pesquisa avançada na internet e entregará os melhores resultados.
Audiovisual com IA: Imagen 3, Veo e Music AI Sandbox
O Imagen 3 é a nova versão do modelo de linguagem da Google para transformar textos em imagem através de comandos de prompt. As imagens são criadas com mais realismo e qualidade, prometendo "a melhor compreensão de linguagens naturais".
O modelo também consegue inserir palavras e frases inteiras na imagem gerada. Para conhecer a ferramenta acesse https://aitestkitchen.withgoogle.com/pt/tools/image-fx
O Veo vem para ser um concorrente do Sora, o gerador de vídeo da OpenAI.
A ferramenta consegue gerar mídias em clipes com resolução Full HD (1080p), na horizontal ou vertical, e com time lapse, através de comandos de texto. A qualidade das imagens geradas impressiona por ser muito próxima de um vídeo gravado em um cenário real.
Para acessar o Veo basta ir ao site AI Test Kitchen, do With Google, cadastrando nome, país e email na lista de espera no VideoFX. O site é https://aitestkitchen.withgoogle.com/pt
Confira abaixo um vídeo gerado com o Veo:
Já o Music AI Sandbox é outra ferramenta de IA que gera músicas a partir de comandos de texto. Basta digitar o ritmo ou estilo da música que você deseja criar, que a IA entregará uma música pronta para ouvir e curtir. A ferramenta já está disponível para uso no AI Test Kitchen.
LearnLM é uma ferramenta voltada para educação
E o LearnLM é uma nova família de modelos generativos de IA ajustados para o aprendizado. Ele é projetado para orientar os alunos de forma conversada sobre vários assuntos ampliando a experiência de aprendizado para os alunos.
“O LearnLM é baseado em pesquisa educacional, tornando as experiências de aprendizagem mais pessoais e envolventes”, disse James Manyika, vice-presidente sênior de pesquisa, tecnologia e sociedade do Google Research, no Google I/O.
Gemini no Gmail, Drive, Docs, Fotos e Meet
As tradicionais ferramentas de produtividade do Google serão integradas ao Gemini, com isso, a IA pode se tornar um assistente pessoal para o usuário dos serviços da empresa. Por exemplo, no Gmail, a IA pode ajudar a encontrar mensagens de forma mais rápida, organizada e resumir emails direto no celular.
Assim como no Docs, que vai se tornar um aliado para ajudar a escrever, bastando fazer um comando conforme sua demanda, como resumir um texto ou fazer correções. O serviço de email do Google também terá o mesmo recurso.
No Meet, o Gemini poderá resumir as reuniões e preparar um relatório dos melhores momentos do encontro, organizando e categorizando a conversa para facilitar a busca do usuário por algum assunto falado na reunião.
O Drive pode ajudar o usuário a organizar e encontrar arquivos, documentos e informações no seu armazenamento de forma mais ágil e detalhada. A empresa garante que os dados armazenados não serão usados para treinar o modelo de linguagem.
E no Fotos o usuário terá mais facilidade em encontrar imagens com apoio da IA, bastando descrever o que está procurando. Também será possível gerar legendas para compartilhar as fotos nas redes sociais. A funcionalidade chegará primeiro para quem assina o serviço Google One, sem previsão para o público geral.
Gemini mais leve, inteligente e sendo assistente de voz
A sua inteligência artificial Gemini foi atualizado e agora é mais eficiente. Todas as versões receberam alguns aprimoramentos que vão de mais agilidade para interpretar dados até mesmo se tornando um assistente pessoal.
- O Gemini Pro, que é um novo modelo mais rápido e eficiente com recursos multimodais. Ou seja, agora o chatbot pode entender texto, áudio, imagem e vídeo. Também pode acessar arquivos do Google Drive para responder perguntas e consegue manter conversas mais longas com o usuário.
- Mais leve que o Pro, o Gemini Flash, foi anunciado, e o Google aumentou a oferta de uso da versão Gemini 1.5 Pro, que tem mais velocidade, ações multimodais e uma janela maior de contexto, para quem assina o pacote de serviço Google One AI Premium.
- Gemini Live, que transforma a aplicação em um assistente de voz. Você pode conversar com a ferramenta como se estivesse falando com outra pessoa de forma natural e que te ajuda nas suas demandas e necessidades.
- A versão mais leve e mínima do Gemini, o Nano, agora consegue interagir com imagens e ele deve ser integrado ao Pixel e ao Google Chrome.
Projeto Astra é um super assistente de IA pessoal
Esta inteligência artificial é uma espécie de super assistente multimodal, que combina entradas de áudio e vídeo. Esta IA enxerga o mundo e interage com ele, interpretando tudo que se passa na frente da sua câmera.
A partir das informações captadas, o Project Astra cria conteúdo e também escuta comandos de voz do usuário para realizar várias tarefas.
Segundo o próprio Google, a ideia é facilitar a vida do usuário no dia a dia.
O que tenho a ver com isso?
A inteligência artificial é uma tecnologia que existe há mais de 80 anos e com o avanço da computação moderna, a IA ganha espaço e afeta todas as áreas da economia.
A tendência é que cada vez mais diversas tarefas e trabalhos considerados insalubres ou repetitivos serão realizados com o uso desta tecnologia.
Com o forte crescimento da empresa de inteligência artificial OpenAI, criadora do chatbot de IA ChatGPT, o Google e outras gigantes da tecnologia têm se movimentado para criar soluções e novidades nesta área para ganhar ou preservar o mercado.
Ao mesmo tempo, os sistemas e tecnologias criados em torno da IA prometem facilitar a vida do usuário em inúmeras demandas e necessidades em sua rotina.