Google lança IA que cria imagens em 4 segundos e edita vídeos por voz

Google lança IA que cria imagens em 4 segundos e edita vídeos por voz – Canaltech

O Google anunciou dois novos modelos de inteligência artificial capazes de acelerar a criação de imagens e vídeos: o Nano Banana 2 Lite, que gera imagens em até 4 segundos, e o Gemini Omni Flash, que permite criar e editar vídeos usando comandos de voz ou texto.

Segundo a empresa, o Nano Banana 2 Lite foi feito para ser rápido e eficiente em grande escala. Ele cria imagens a partir de comandos de texto em poucos segundos, com foco em respostas rápidas, imagens consistentes e textos mais legíveis dentro das imagens.

Além disso, o modelo de imagem tem um custo menor que suas versões anteriores. Por exemplo, o Nano Banana 2 Lite custa cerca de US$ 0,034 por imagem de resolução 1K comparado ao Nano Banana 2 que custa US$ 0,067.

–
Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.
–

Já o Gemini Omni Flash leva a IA para a criação de vídeos. O modelo permite gerar vídeos curtos e editar cenas usando comandos de texto ou voz. Também combina texto, imagens e vídeos para manter a consistência do conteúdo e facilitar mudanças de cena ou estilo. Além disso, ele usa o conhecimento de mundo do Gemini, incluindo lógica narrativa e conceitos de áreas, como história e biologia, para criar vídeos coerentes e realistas.

Os dois sistemas usam a marca d’água SynthID para identificar conteúdos feitos por IA e funcionam de forma integrada. O usuário pode criar uma imagem no Nano Banana 2 Lite e usá-la como base no Gemini Omni Flash para transformá-la em um vídeo curto. Nesse fluxo, desenvolvedores podem utilizar a Interactions API, que mantém o histórico e o contexto da sessão, permitindo até três edições sequenciais sem perda do conteúdo gerado.

Apesar dos avanços, o Gemini Omni Flash ainda tem limitações. Ele gera vídeos de até 10 segundos, com versões mais longas previstas para o futuro. Na API, ainda não há suporte para envio de áudio de referência ou extensão de cenas, e também podem ocorrer falhas na consistência de personagens em mudanças de cena ou movimentos de câmera.

Quem pode acessar o Nano Banana 2 Lite e Gemini Omni Flash?

O Nano Banana 2 Lite será integrado ao modo de IA da Busca, ao app Gemini e a produtos, como Google Fotos, NotebookLM, Stitch, Google Flow e Google Ads. Já o Gemini Omni Flash também chega ao aplicativo Gemini e ao Google Flow.

Para desenvolvedores e empresas, o Nano Banana 2 Lite já está disponível no Google AI Studio, na API do Gemini e na Gemini Enterprise Agent Platform. Enquanto o Gemini Omni Flash pode ser testado em prévia pública nas mesmas plataformas, com possibilidade de integração com aplicações e serviços.

Se você gostou do conteúdo, talvez também se interesse por conferir 7 prompts para criar imagens com o Nano Banana 2.

Leia a matéria no Canaltech.

Source link