O Google anunciou, nesta quarta-feira (20), durante o Google I/O, evento voltado para desenvolvedores, melhorias significativas em sua linha de modelos de inteligência artificial (IA) Gemini 2.5.
As atualizações incluem avanços técnicos consideráveis e novos recursos para os modelos Gemini 2.5 Pro e Gemini 2.5 Flash, segundo comunicado divulgado pela empresa.
O Gemini 2.5 Pro foi apresentado inicialmente em março como o modelo mais inteligente da companhia até o momento.
Segundo a equipe de desenvolvimento, o modelo conquistou a primeira posição nos rankings WebDev Arena e LMArena, demonstrando excelência em desenvolvimento web e preferência dos usuários em várias dimensões.

Gemini 2.5: desempenho superior e novos recursos
- Especialistas do Google afirmam que o Gemini 2.5 Pro se destaca particularmente em aplicações educacionais;
- Após a incorporação da tecnologia LearnLM, família de modelos desenvolvida em colaboração com especialistas em educação, o sistema é uma das referências para aplicações de aprendizado, diz a big tech;
- Em comparações diretas avaliando pedagogia e eficácia, educadores e especialistas demonstraram preferência pelo Gemini 2.5 Pro em relação a outros modelos disponíveis no mercado, conforme o comunicado;
- Entre as principais inovações apresentadas pela empresa, destaca-se o Deep Think, modo experimental de raciocínio aprimorado para o Gemini 2.5 Pro;
- Este recurso utiliza técnicas de pesquisa avançadas que permitem, ao modelo, considerar múltiplas hipóteses antes de formular respostas. A efeito de comparação, por exemplo, o Grok, da xAI, e o ChatGPT, da OpenAI, já possuem sistemas similares;
- Segundo dados divulgados, o sistema com Deep Think alcançou pontuações impressionantes em benchmarks matemáticos complexos, como o USAMO 2025, além de liderar no LiveCodeBench, avaliação rigorosa para codificação de alto nível.
“Estamos definindo novas fronteiras com o Gemini 2.5 Pro Deep Think. Por isso, estamos dedicando tempo adicional para realizar avaliações de segurança e obter feedback de especialistas antes de disponibilizá-lo amplamente”, explicou a empresa em seu comunicado oficial.
Google também trouxe o Gemini 2.5 Flash
O Gemini 2.5 Flash, descrito como o modelo mais eficiente da linha e otimizado para velocidade e baixo custo, também recebeu melhorias significativas. Para conferir as novidades da IA, leia esta reportagem do Olhar Digital.
A versão atualizada do Gemini 2.5 Flash já está disponível para visualização no Google AI Studio para desenvolvedores, no Vertex AI para empresas e no aplicativo Gemini para todos os usuários. A disponibilidade geral para produção está prevista para o início de junho, conforme anunciado pela empresa.
Leia mais:
- Como usar a pesquisa avançada no Gemini? Entenda a função “Gemini Deep” no chatbot
- Como criar imagens com o Google Gemini
- Google Chrome terá integração com o Gemini – e ele poderá ler por você
Recursos inovadores para desenvolvedores e usuários
Entre as novas funcionalidades introduzidas pela Google, destaca-se a saída de áudio nativa e melhorias na API Live. A empresa está apresentando uma versão prévia de entrada audiovisual e diálogo com saída de áudio nativa, permitindo construção de experiências conversacionais mais naturais e expressivas com o Gemini.
O sistema permite que o usuário direcione tom, sotaque e estilo de fala do modelo. Por exemplo, é possível instruir o sistema a usar uma voz dramática ao contar uma história. A funcionalidade também suporta o uso de ferramentas, podendo realizar buscas em nome do usuário.
Desenvolvedores podem experimentar um conjunto de recursos iniciais, incluindo:
- Diálogo Afetivo, no qual o modelo detecta emoções na voz do usuário e responde adequadamente;
- Áudio Proativo, que permite ao modelo ignorar conversas de fundo e reconhecer quando deve responder;
- Pensamento na API Live, aproveitando as capacidades de raciocínio do Gemini para apoiar tarefas mais complexas.
O Google também anunciou novos recursos de conversão de texto em fala para os modelos 2.5 Pro e 2.5 Flash.
“Estas são as primeiras tecnologias a oferecer suporte para múltiplos falantes, permitindo conversão de texto em fala com duas vozes através da saída de áudio nativa”, afirmou a empresa. O recurso funciona em mais de 24 idiomas e alterna entre eles sem interrupções.
Segurança aprimorada e uso de computador
Um aspecto fundamental das atualizações é o significativo aumento nas proteções contra ameaças de segurança, como injeções indiretas de comandos.
A nova abordagem de segurança ajudou a aumentar consideravelmente a taxa de proteção do Gemini contra ataques de injeção indireta de comandos durante o uso de ferramentas, tornando a família Gemini 2.5 a mais segura até o momento, segundo a empresa.
O Google também está incorporando capacidades de uso de computador do Project Mariner na API Gemini e no Vertex AI.
Empresas, como Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company e Cartwheel, já estão explorando seu potencial, e a big tech planeja disponibilizar mais amplamente para desenvolvedores experimentarem entre junho e setembro.
Experiência aprimorada para desenvolvedores
Para facilitar o trabalho de desenvolvedores, o Google introduziu resumos de pensamento nos modelos 2.5 Pro e Flash, disponíveis na API Gemini e no Vertex AI. Estes resumos organizam os pensamentos brutos do modelo em formato claro com cabeçalhos, detalhes-chave e informações sobre ações do modelo, como quando utilizam ferramentas.
“Esperamos que, com formato mais estruturado e simplificado do processo de pensamento do modelo, desenvolvedores e usuários achem as interações com os modelos Gemini mais fáceis de entender e depurar“, explicou a empresa.

Outra novidade é a extensão dos orçamentos de pensamento para o Gemini 2.5 Pro, recurso já disponível no 2.5 Flash. Isso permite, aos desenvolvedores, controlar o número de tokens que um modelo utiliza para pensar antes de responder, ou, até mesmo, desativar suas capacidades de pensamento.
O Gemini 2.5 Pro com orçamentos estará disponível para uso estável em produção nas próximas semanas, juntamente com o modelo geralmente disponível.
A big tech também adicionou suporte nativo de SDK para definições do Model Context Protocol (MCP) na API Gemini para integração mais fácil com ferramentas de código aberto. A empresa está explorando maneiras de implantar servidores MCP e outras ferramentas hospedadas, facilitando a construção de aplicações com agentes de IA.
“Estamos sempre inovando em novas abordagens para melhorar nossos modelos e a experiência do desenvolvedor, incluindo torná-los mais eficientes e performáticos, e continuamos respondendo ao feedback dos desenvolvedores”, concluiu o Google em seu anúncio, indicando que mais novidades virão em breve.
O post Google I/O: Gemini 2.5 se iguala aos rivais e passa a contar com Deep Think apareceu primeiro em Olhar Digital.