Gemini Omni: o Google agora deixa você editar vídeo conversando — e isso muda a criação de conteúdo

Imagine gravar um vídeo simples no celular e depois, em vez de abrir um programa de edição cheio de botões, apenas escrever: “troque o fundo por uma praia ao pôr do sol”, “adicione um cachorro correndo ao lado”, “deixe a iluminação mais quente”. E o vídeo muda — mantendo tudo o que já estava lá, sem você refazer nada. Foi isso que o Google colocou nas mãos de bilhões de pessoas com o Gemini Omni.

Apresentado pelo Google e em expansão desde então, o Gemini Omni é um novo tipo de modelo de inteligência artificial capaz de criar e editar vídeos a partir de qualquer combinação de texto, imagem, áudio e vídeo. E o mais importante para o público da IAtivei: a primeira versão, chamada Gemini Omni Flash, está disponível de graça dentro do YouTube Shorts — o que coloca essa capacidade ao alcance de qualquer criador de conteúdo brasileiro.

Vamos entender o que é, como funciona, o que muda na prática — e os cuidados sérios que vêm junto.

O que é o Gemini Omni (e por que “Omni”)

O nome “Omni” vem de “tudo” — e descreve bem a proposta. Diferente dos geradores de vídeo tradicionais, que fazem só uma coisa, o Gemini Omni é um modelo único que entende várias formas de entrada (texto, imagem, áudio e vídeo) ao mesmo tempo e gera vídeo como resultado.

A diferença técnica que o Google faz questão de destacar: o Omni não é “um modelo de vídeo colado a um modelo de raciocínio”. É um só modelo que raciocina sobre todas essas entradas e gera vídeo apoiado no conhecimento de mundo do Gemini — noções de física, história, ciência e contexto cultural. O CTO do Google DeepMind resumiu como o modelo “onde a capacidade do Gemini de raciocinar encontra a capacidade de criar”.

Na prática, isso significa que você pode dar a ele uma foto, um comando de voz e uma referência em vídeo, e pedir uma cena cinematográfica construída a partir disso.

O recurso que muda tudo: editar por conversa

Até agora, todas as ferramentas de vídeo com IA — Runway, Pika, Sora, o próprio Veo do Google — funcionavam do mesmo jeito: você escrevia um comando, a IA gerava um clipe novo, e se você quisesse mudar algo, recomeçava do zero. Cada tentativa era um recomeço.

O Gemini Omni quebra essa lógica. O recurso principal não é gerar vídeo — é editar vídeo conversando, em várias rodadas. Cada instrução parte da anterior. Você pede uma mudança, depois outra, e outra, e o modelo mantém a continuidade: os personagens continuam com o mesmo rosto e roupa, os objetos permanecem, a cena “lembra” o que veio antes.

Essa consistência de personagens e cenários entre edições é tecnicamente difícil e é o grande diferencial. Você pode pegar um vídeo que gravou e simplesmente pedir para mudar o que está acontecendo nele — trocar o ambiente, adicionar personagens, transformar um momento em algo que você jamais conseguiria filmar. O Google chama isso de o “momento Nano Banana” do vídeo, numa referência à facilidade que sua ferramenta de edição de imagens trouxe.

Onde usar e quanto custa

A estratégia de distribuição do Google é inteligente e vale a pena entender:

Grátis no YouTube Shorts e no app YouTube Create. Para usuários maiores de 18 anos, a capacidade do Omni está sendo liberada sem custo dentro do fluxo de criação do YouTube Shorts (no recurso Remix) e do aplicativo YouTube Create. Como o YouTube tem mais de 2 bilhões de usuários mensais, isso coloca a geração de vídeo por IA na frente de um público gigantesco, direto na ferramenta que os criadores já usam.

Pago no app Gemini e no Google Flow. O acesso completo, dentro do aplicativo Gemini e do estúdio criativo Flow, está disponível para assinantes dos planos Google AI (Plus, Pro e Ultra).

Para desenvolvedores. O acesso via API (para integrar o Omni a outros aplicativos) está sendo liberado de forma escalonada após o lançamento ao consumidor.

Um detalhe técnico importante: por enquanto, os vídeos têm até cerca de 10 segundos. Segundo o Google, isso não é uma limitação do modelo, mas uma decisão para liberar o recurso a mais gente — durações maiores estão no roteiro para o futuro próximo.

O que muda para o criador de conteúdo brasileiro

Esse é o ponto que mais interessa a boa parte do público da IAtivei. As implicações são concretas:

A barreira de entrada para criar vídeo despencou. Antes, editar vídeo com qualidade exigia software caro, computador potente e horas de aprendizado. Agora, descrever em português o que você quer pode bastar. Para o pequeno criador, o empreendedor que faz o próprio marketing ou o profissional que precisa de conteúdo visual sem ter equipe, isso muda o jogo.

Velocidade e experimentação. Como a edição é por conversa e parte sempre do resultado anterior, testar variações fica rápido e barato. Dá para explorar ideias, conceitos e versões de uma cena em minutos, algo que antes levava muito mais tempo.

Está onde o público já está. Por estar embutido no YouTube Shorts, não há barreira de adoção: o criador não precisa aprender uma ferramenta nova nem migrar de plataforma. A IA chega ao fluxo de trabalho que ele já usa.

Mas atenção: ferramenta acessível não substitui criatividade. Quando todo mundo tem acesso à mesma facilidade, o diferencial deixa de ser “saber editar” e passa a ser ter boas ideias, identidade própria e estratégia de conteúdo. A ferramenta nivela o campo técnico; o que destaca é o que você cria com ela.

Os cuidados sérios: direitos autorais, deepfakes e autenticidade

Aqui entra o contrapeso que uma cobertura responsável não pode omitir — e que é especialmente relevante para quem vai usar essas ferramentas profissionalmente.

Direitos autorais e imagem. Testes feitos pela imprensa especializada mostraram que o Gemini Omni pode, com os comandos certos, gerar vídeos que se parecem com personagens famosos de filmes e quadrinhos. Isso não significa que você pode publicar ou monetizar esse conteúdo legalmente. Direitos autorais, uso de imagem, marcas registradas, música e as regras de cada plataforma continuam valendo. Gerar é uma coisa; ter o direito de usar comercialmente é outra, completamente diferente. O criador é responsável por isso.

Deepfakes e desinformação. Uma ferramenta que cria e edita vídeos realistas com facilidade levanta, inevitavelmente, preocupações sobre conteúdo falso, manipulação e mídia sintética. A mesma tecnologia que ajuda um criador a fazer um vídeo bonito pode ser usada para enganar. É um poder que exige responsabilidade.

A marca d’água SynthID. Como medida de segurança, o Google embute em todos os vídeos gerados pelo Omni uma marca d’água digital invisível chamada SynthID, que permite identificar que aquele conteúdo foi criado por IA. É possível verificar isso pelo app Gemini, pelo Gemini no Chrome e pela Busca. É um passo importante para a transparência — embora não resolva sozinho o problema da desinformação.

Transparência com seu público. Para o criador sério, vale uma boa prática que vai além da lei: ser transparente quando o conteúdo é gerado ou fortemente editado por IA. A confiança da audiência é um ativo valioso, e ela se constrói com honestidade sobre como o conteúdo é feito.

Conclusão

O Gemini Omni representa um daqueles momentos em que uma capacidade que parecia ficção — editar vídeo só conversando, mantendo tudo coerente — vira realidade acessível, e de graça, para milhões de pessoas. Para criadores de conteúdo, empreendedores e profissionais que precisam de vídeo no trabalho, é uma ferramenta com potencial de transformar a forma como se produz conteúdo visual.

Mas, como toda ferramenta poderosa, ela vem com responsabilidades. A facilidade de criar não elimina a necessidade de respeitar direitos autorais, de ser honesto com a audiência e de usar a tecnologia com ética. A mídia sintética é um território novo, e quem entrar nele com consciência dos limites legais e morais vai colher os frutos sem cair nas armadilhas.

Para quem nos lê por aqui, a mensagem se repete, agora no terreno do vídeo: a IA democratiza o acesso às ferramentas, mas o que diferencia continua sendo o humano — a ideia, a criatividade, a estratégia e a responsabilidade de quem está no comando. A tecnologia faz o vídeo; você ainda decide o que vale a pena contar.