Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124


O Google anunciou um novo modelo do Gemini capaz de navegar pela web e executar ações de forma autônoma. A novidade recebe o nome de 2.5 Computer Use e permite atuar como um agente nos navegadores.
O novo modelo incorpora as habilidades de compreensão visual e raciocínio do Gemini 2.5 Pro enquanto consegue interagir com interfaces de usuário. Dessa forma, a IA vai entender as informações da página, localizar dados e atuar da mesma forma que uma pessoa faria.
De acordo com a Gigante de Mountain View, o objetivo é conseguir ir além do uso das APIs pelas inteligências artificiais — muitas tarefas podem exigir que a IA responda à interface do usuário, então é importante ter uma alternativa para isso.
–
Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.
–
Dados revelados pela empresa indicam que o modelo pode atuar como um agente com baixa latência, ou seja, de forma mais rápida.

O Gemini 2.5 Computer Use é voltado para interagir com interfaces em páginas da web e executar diversas ações automaticamente. Alguns exemplos são:
O Google afirma que o LLM é otimizado para atuar em navegadores da web, mas mostra sinais positivos para controlar interfaces de dispositivos móveis. Por enquanto, ainda não foi otimizado para sistemas operacionais de computadores.
A novidade pode ser usada para melhorar o próprio Google Chrome, visto que a empresa já prometeu a chegada de agentes ao browser no futuro. Por enquanto, o modelo funciona apenas para demonstrações.
Leia também:
VÍDEO: IA em locadoras de carro: a inovação que pode virar um pesadelo?
Leia a matéria no Canaltech.