O telefone toca. Do outro lado, a voz é inconfundível — é seu filho, sua mãe, seu irmão. A voz está aflita, falando rápido: houve um acidente, um problema com a polícia, uma emergência. Precisa de um Pix agora, urgente. A voz é tão real, tão familiar, que você nem pensa duas vezes. Faz a transferência.
Só que não era seu filho. Não era ninguém da sua família. Era uma voz clonada por inteligência artificial, montada a partir de alguns segundos de áudio que essa pessoa publicou — sem perceber o risco — num story do Instagram ou num vídeo do TikTok.
Esse é o “golpe da voz clonada”, e ele se tornou uma das fraudes mais assustadoras e eficazes do Brasil em 2026. Diferente de quase todo golpe que você conhece, este é projetado para explorar exatamente aquilo que temos de mais humano: o amor e o medo por quem é próximo. Por isso, vale entender como ele funciona — e, principalmente, conhecer a proteção simples que neutraliza até as versões mais sofisticadas.
O que é o golpe e por que ele é tão perigoso
A técnica por trás do golpe é o chamado deepfake de áudio: o uso de inteligência artificial para recriar a voz de uma pessoa com altíssimo realismo.
O que torna esse golpe diferente — e mais perigoso — que os demais é um detalhe psicológico. Na maioria dos golpes, o criminoso engana a vítima para roubar dados ou acessar a conta dela. No golpe da voz clonada, a vítima faz a transferência voluntariamente, com as próprias mãos, acreditando que está ajudando alguém que ama numa emergência. Não há senha roubada nem invasão de conta. Há manipulação emocional pura.
E a tecnologia ficou assustadoramente acessível. Em 2026, a qualidade das clonagens de voz atingiu um nível em que a detecção apenas pelo ouvido humano se tornou praticamente impossível. Softwares disponíveis gratuitamente na internet conseguem clonar uma voz a partir de amostras muito curtas de áudio — em alguns casos, bastam de 3 a 15 segundos de gravação.
E de onde vêm esses segundos de áudio? Das próprias redes sociais. As fontes mais exploradas pelos golpistas são stories no Instagram, vídeos no TikTok, áudios em grupos de WhatsApp e vídeos no YouTube. Um perfil público fornece todo o material que o criminoso precisa.
Os números do Brasil
O cenário brasileiro é particularmente preocupante, e os dados confirmam isso.
O golpe do Pix usando deepfake e IA cresceu cerca de 148% em 2025, segundo levantamentos da área jurídica especializada em fraudes digitais. Num recorte mais amplo, ataques de phishing usando deepfakes cresceram impressionantes 1.600% no primeiro trimestre de 2025, e o Brasil está entre os países mais afetados do mundo — com incidentes cinco vezes mais frequentes do que nos Estados Unidos.
As buscas por ferramentas de detecção de voz por IA (“AI Voice Detector”) explodiram, refletindo a corrida de empresas e cidadãos para se proteger. E os prejuízos não são pequenos: em um caso internacional de 2024, uma multinacional perdeu o equivalente a cerca de R$ 125 milhões quando criminosos usaram deepfake para simular uma videoconferência com o diretor financeiro da empresa, levando um funcionário a autorizar transferências acreditando falar com executivos reais.
No Brasil, casos reais já chegaram à polícia. Em uma investigação no Rio Grande do Sul, um suspeito teria usado IA para simular a voz de uma pessoa desaparecida, criando áudios com pedidos de ajuda e relatos cotidianos para enganar familiares — mostrando como o golpe pode ir além do financeiro e atingir dimensões ainda mais cruéis.
Como os golpistas montam o golpe
Entender o passo a passo ajuda a reconhecer o perigo antes que ele aconteça. O esquema costuma seguir uma sequência:
1. Coleta do áudio. O criminoso encontra gravações da voz-alvo em perfis públicos de redes sociais. Quanto mais a pessoa posta vídeos falando, mais material ele tem.
2. A “ligação muda”. Em algumas versões, os golpistas ligam para a própria vítima e ficam em silêncio, ou puxam uma conversa qualquer, apenas para captar a voz dela e usá-la depois — inclusive contra os familiares dela.
3. A clonagem. Com os segundos de áudio, a IA gera uma voz sintética capaz de “dizer” qualquer frase com o timbre da pessoa real.
4. O roteiro de pânico. O golpe é construído para impedir que a vítima pense. As histórias mais usadas exploram o desespero: “me sequestraram, paga R$ 5.000 agora”, “sofri um acidente, preciso pagar para ser atendido”, “fui preso, preciso de fiança”. Todas têm um elemento em comum: urgência extrema, para que a vítima aja antes de verificar.
5. O Pix imediato. A pressa é a arma. O criminoso insiste que não há tempo a perder, justamente para impedir que a vítima desligue e ligue de volta para a pessoa de verdade.
A proteção que funciona contra qualquer deepfake: a palavra-código
Aqui está a parte mais importante deste artigo — e a boa notícia. Por mais avançada que seja a tecnologia, existe uma defesa simples, gratuita e praticamente infalível: a palavra-código.
A lógica é elegante. O golpista pode clonar a voz e até o rosto de um familiar, mas ele não tem como adivinhar uma informação que existe apenas entre você e a pessoa de verdade. Por isso, a recomendação central dos especialistas é:
Combine com sua família uma palavra ou frase secreta. Pode ser qualquer coisa — uma palavra sem sentido, uma lembrança em comum, um código combinado. A regra é: em qualquer ligação envolvendo dinheiro ou emergência, você pergunta a palavra-código. Se a pessoa do outro lado não souber, é golpe. Simples assim.
Essa proteção funciona contra deepfakes de qualquer qualidade, presente ou futura, porque ataca o ponto cego do golpe: o criminoso pode imitar a voz, mas não a memória compartilhada.
Outras proteções práticas
Além da palavra-código, alguns hábitos reduzem bastante o risco:
Desligue e ligue de volta. Diante de qualquer pedido urgente de dinheiro por ligação, desligue e ligue você mesmo para o número conhecido da pessoa. Se for golpe, a pessoa real vai atender normalmente, sem saber de nada. Esse simples gesto derruba a maioria dos golpes, porque quebra a pressão da urgência.
Desconfie da pressa. Urgência extrema é a assinatura do golpe. Pedidos legítimos quase sempre toleram alguns minutos de verificação. Quando alguém insiste que você precisa pagar “agora, sem desligar”, o sinal de alerta deve acender.
Cuidado com ligações silenciosas. Se você atender uma ligação e do outro lado houver apenas silêncio, ou alguém estranho puxando conversa para te fazer falar, desconfie — pode ser uma tentativa de captar sua voz.
Revise sua exposição nas redes. Quanto mais áudio e vídeo seu (e dos seus familiares, especialmente idosos e crianças) estão públicos, mais material os golpistas têm. Considere deixar perfis privados e pensar duas vezes antes de postar vídeos longos falando.
Nunca autorize transferências só por voz ou mensagem. Especialmente no ambiente de trabalho: um telefonema “do chefe” pedindo uma transferência urgente pode ser falso. Empresas devem ter processos de dupla confirmação para qualquer pagamento.
O lado mais amplo: a corrida entre fraude e detecção
Vale entender que esse golpe é parte de um movimento maior. A mesma tecnologia de IA que gera vozes sintéticas está sendo usada para combatê-las.
Empresas de segurança já oferecem ferramentas de detecção de voz sintética, e gigantes como OpenAI, Google e Microsoft estão desenvolvendo “marcas d’água” digitais — assinaturas invisíveis embutidas no áudio gerado por IA, que permitem rastrear sua origem. A expectativa é que, até 2027, boa parte do conteúdo de áudio gerado por IA tenha alguma forma de identificação embutida.
Mas, enquanto essa infraestrutura de proteção amadurece, a defesa mais confiável continua sendo o bom senso humano e medidas simples como a palavra-código. A tecnologia é uma corrida; o cuidado pessoal é uma certeza.
Conclusão
O golpe da voz clonada é um exemplo perturbador de como a inteligência artificial, a mesma que nos ajuda a trabalhar melhor, pode ser usada para fins cruéis quando cai nas mãos erradas. Ele explora o que temos de mais humano — o cuidado com quem amamos — e por isso é tão eficaz.
Mas há um consolo importante: por mais sofisticada que seja a tecnologia, a defesa não precisa ser. Uma palavra-código combinada com a família, o hábito de desligar e ligar de volta, e a desconfiança saudável diante da pressa são proteções que qualquer pessoa pode adotar hoje, de graça.
Se este artigo for útil, talvez o gesto mais valioso seja justamente este: compartilhe com sua família, combine uma palavra-código com as pessoas que você ama — especialmente os mais velhos, que são os alvos preferidos desses golpes. Numa era em que a IA pode imitar a voz, é a confiança real, construída entre pessoas, que continua sendo impossível de falsificar.
Leia também: O que você nunca deve colar numa IA no trabalho — outra camada de segurança digital na era da IA.
Este texto tem caráter informativo e educativo sobre segurança digital. Em caso de golpe, registre boletim de ocorrência, comunique imediatamente seu banco e, no caso do Pix, solicite o Mecanismo Especial de Devolução (MED) junto à instituição financeira.
