Como o Pikachu ajuda a sua inteligência artificial favorita a ficar melhor
Jogos de Pokémon, lançados há quase 30 anos, viraram um laboratório improvável para testar modelos de IA de empresas como OpenAI, Google e Anthropic


Exame.com
Os jogos de Pokémon, lançados pela Nintendo no fim dos anos 1990, ganharam uma nova função no século 21: ajudar a treinar e avaliar modelos avançados de inteligência artificial. Aquilo que nasceu como entretenimento portátil para crianças agora aparece em relatórios técnicos, apresentações corporativas e até em transmissões ao vivo acompanhadas por milhares de pessoas.
Empresas como OpenAI, Google e Anthropic passaram a usar os títulos da franquia como uma espécie de pista de testes cognitivos para seus sistemas. A lógica é simples de explicar, apesar de difícil de executar: se uma IA consegue jogar Pokémon bem, ela aprendeu provavelmente a planejar, decidir e lidar com imprevistos.
A prática ganhou popularidade com transmissões ao vivo na Twitch, como "Claude Plays Pokémon", "GPT Plays Pokémon" e "Gemini Plays Pokémon", em que modelos de IA jogam enquanto o público acompanha cada decisão em tempo real. Além do entretenimento, essas lives viraram material de trabalho: os resultados aparecem em apresentações oficiais e documentos internos das empresas.
Não é a primeira vez que jogos entram nesse papel. Em 2016, o AlphaGo, sistema do Google, derrotou um campeão humano no jogo de Go, marco histórico para o setor. O Minecraft, jogo de construção em mundo aberto, também já foi usado como ambiente de testes. A diferença é que Pokémon combina narrativa, exploração, estratégia e gestão de recursos em um único pacote.
Um exemplo recente vem da Kaggle, plataforma de ciência de dados do Google, que lançou a Game Arena, arena aberta que avalia modelos de IA em competições baseadas em jogos. O primeiro torneio, realizado em agosto, foi vencido pelo modelo o3, da OpenAI.
Ao longo da jornada, o modelo precisa decidir quando treinar Pokémon já capturados, quando buscar novos aliados, como lidar com dinheiro limitado e itens escassos e, talvez o mais complicado, resolver quebra-cabeças espaciais. Esses desafios estão entre os obstáculos mais difíceis para sistemas automatizados.
O fascínio extrapola o laboratório. Funcionários da OpenAI assistiram a transmissões de Pokémon geradas por GPT em uma televisão no escritório. O CEO do Google, Sundar Pichai, chegou a comemorar uma vitória do Gemini durante a conferência Google I/O. A Anthropic, por sua vez, monta estandes com o jogo em eventos do setor e mantém canais internos dedicados a acompanhar o desempenho do Claude.
Os modelos mais recentes mostram avanços claros. O Claude Opus 4.5 tenta zerar o jogo ao vivo na Twitch. GPT e Gemini já conseguiram concluir o jogo original, embora os próprios desenvolvedores reconheçam que isso depende de ferramentas auxiliares criadas especialmente para a tarefa.
No fim, Pikachu, Charizard e companhia cumprem um papel inesperado: ajudar máquinas a pensar melhor. E, de quebra, transformar um experimento técnico em espetáculo público, algo que poucos benchmarks acadêmicos conseguem fazer.








