Artigo
02/08/2025

Fraudes com Dados Sintéticos: o que é e como funciona este tipo de fraude

Explica como dados sintéticos e duplicidade de CPFs são usados para fraudes em bancos digitais.

Imagem de capa do artigo

Segundo o IBGE (Instituto Brasileiro de Geografia e Estatística), somos 212 milhões de brasileiros (Dados Junho/2024). No entanto, o número de CPFs ativos no país ultrapassa, com folga, esse total populacional. Esse descompasso é um indicativo claro de um problema estrutural: a proliferação de dados sintéticos e duplicidades de CPFs usados para fraudes em larga escala, especialmente na abertura de contas digitais.

O que são dados sintéticos?

Dados sintéticos são informações geradas artificialmente com o objetivo de simular dados reais. Em ambientes legítimos, eles são utilizados para treinar modelos de machine learning ou testar sistemas sem expor dados sensíveis. Porém, quando utilizados de forma maliciosa, tornam-se ferramentas poderosas para fraudes. Um exemplo é a criação de um "perfil sintético" — uma combinação de informações reais e falsas, como um CPF ativo, mas associado a nomes, endereços e contatos inexistentes.

Como funciona a duplicidade de CPFs?

A duplicidade de CPF ocorre quando o mesmo número de cadastro é vinculado a múltiplas identidades digitais diferentes. Esse fenômeno pode ser explorado por fraudadores de duas formas principais:

  • Perfis sintéticos múltiplos com um único CPF: O fraudador associa o mesmo número de CPF a vários perfis falsos, utilizando variações de nome, telefone e endereço. Cada perfil pode ser usado para abrir uma nova conta bancária ou contratar serviços de crédito.
  • Reciclagem de CPFs inativos ou desatualizados: Em muitos casos, CPFs de pessoas falecidas ou inativas são reutilizados para criar novas identidades, aproveitando brechas em cadastros públicos e privados.

Técnicas mais comuns utilizadas por fraudadores

  • Automação de cadastros: Bots que fazem ataques de preenchimento em massa, criando milhares de perfis com variações mínimas.
  • Análise de lacunas cadastrais: Exploração de bases de dados públicas ou vazadas para construir perfis suficientemente críveis.
  • Uso de documentos falsificados ou adulterados: Impressão de documentos com dados reais e fotos falsas, aproveitando a fragilidade de validações superficiais.
  • Abuso de sistemas de validação fracos: Plataformas que aceitam cadastro apenas com validação de CPF ativo na base da Receita Federal estão especialmente vulneráveis.

O impacto nos bancos digitais

A arquitetura moderna dos bancos digitais — baseada em onboarding 100% online — é ao mesmo tempo uma vantagem competitiva e um vetor de risco. A ausência de interação humana no processo de abertura de conta exige que os mecanismos de validação de identidade sejam extremamente robustos. A multiplicação de contas falsas compromete a segurança da operação, aumenta o risco de lavagem de dinheiro e pode gerar sanções regulatórias.

Como mitigar fraudes com dados sintéticos?

A prevenção exige uma abordagem multidisciplinar, que una tecnologia, governança de dados e compliance. Algumas estratégias eficazes incluem:

  • Validação biométrica forte: Reconhecimento facial com prova de vida e validação cruzada com bases oficiais.
  • Score de risco sintético: Modelos que identificam padrões suspeitos em perfis (e.g., telefone e e-mail descartáveis, ausência de histórico de crédito, cadastros múltiplos com o mesmo CPF).
  • Data enrichment com fontes confiáveis: Cruzamento em tempo real com bases de dados públicas, privadas e comportamentais.
  • Monitoramento contínuo: Não basta validar apenas na entrada. O comportamento da conta precisa ser acompanhado constantemente para detectar desvios.

A fraude com dados sintéticos e a duplicidade de CPFs são sintomas de um ecossistema ainda vulnerável, que precisa amadurecer em termos de segurança digital. A confiança é o principal ativo dos bancos digitais — e protegê-la exige vigilância contínua, investimento em tecnologia e colaboração entre instituições.

* https://g1.globo.com/politica/noticia/2020/09/02/brasil-tem-125-milhoes-de-cpfs-ativos-a-mais-que-a-populacao-total-e-tcu-cobra-receita-federal.ghtml

#FraudesFinanceiras #DadosSintéticos #CPFDuplicado #SegurançaDigital #BancosDigitais #Compliance #OnboardingSeguro #IdentidadeDigital #ValidaçãoBiométrica #CombateÀFraude

As opiniões dos autores convidados da nossa comunidade são independentes e não necessariamente representam a opinião da Okai.

Perguntas e respostas

O que o número de CPFs ativos ser maior que a população brasileira indica?
O fato de o número de CPFs ativos no Brasil ser superior à população total do país é um indicativo da proliferação de dados sintéticos e da duplicidade de CPFs. Segundo dados de junho de 2024 do IBGE, o Brasil possui 212 milhões de habitantes, enquanto o número de CPFs ativos ultrapassa esse total. Esse descompasso aponta para um problema estrutural de fraudes em larga escala, especialmente na abertura de contas digitais.
O que são dados sintéticos?
Dados sintéticos são informações geradas artificialmente com a finalidade de simular dados reais. Em contextos legítimos, são utilizados para treinar modelos de machine learning ou para testar sistemas sem a necessidade de expor dados sensíveis de pessoas reais. No entanto, quando usados de forma maliciosa, eles se tornam uma ferramenta para a aplicação de fraudes.
Como um "perfil sintético" pode ser usado para fraudes?
Um "perfil sintético" é uma identidade fraudulenta criada a partir da combinação de informações reais com informações falsas. Um exemplo comum é associar um número de CPF real e ativo a nomes, endereços e contatos que são completamente inexistentes. Esse perfil falso é então utilizado para cometer fraudes, como a abertura de contas em bancos digitais ou a contratação de serviços de crédito.
O que é a duplicidade de CPFs e como fraudadores a exploram?
A duplicidade de CPF acontece quando um único número de cadastro é associado a múltiplas identidades digitais distintas. Fraudadores exploram essa vulnerabilidade de duas maneiras principais:1. Criação de múltiplos perfis sintéticos: Um mesmo número de CPF é vinculado a vários perfis falsos, cada um com variações de nome, telefone e endereço, para abrir diferentes contas bancárias ou solicitar crédito.2. Reciclagem de CPFs inativos: CPFs de pessoas falecidas ou que não estão mais ativos são reutilizados para criar novas identidades fraudulentas, explorando falhas em bases de dados públicas e privadas.
Quais são as técnicas mais comuns utilizadas por fraudadores para criar contas falsas?
Os fraudadores utilizam diversas técnicas para criar perfis e contas falsas em escala. Entre as mais comuns estão:
  • Automação de cadastros: Uso de robôs (bots) para realizar ataques de preenchimento em massa, criando milhares de perfis falsos com pequenas variações entre eles.
  • Análise de lacunas cadastrais: Exploração de informações disponíveis em bases de dados públicas ou que foram vazadas para construir perfis que pareçam críveis.
  • Uso de documentos falsificados: Criação de documentos adulterados, que combinam dados reais (como um CPF válido) com fotos falsas, para enganar processos de validação superficiais.
  • Abuso de sistemas de validação fracos: Exploração de plataformas que exigem apenas a validação de um CPF ativo na base da Receita Federal, sem outras camadas de verificação.
Qual o impacto da fraude com dados sintéticos nos bancos digitais?
A fraude com dados sintéticos e a criação de contas falsas geram diversos impactos negativos para os bancos digitais. A arquitetura de onboarding 100% online, embora seja uma vantagem competitiva, representa um vetor de risco significativo se os mecanismos de validação de identidade não forem robustos. A multiplicação de contas fraudulentas compromete a segurança da operação, eleva o risco de crimes como a lavagem de dinheiro e pode resultar em sanções regulatórias para a instituição financeira.
Quais estratégias podem ser adotadas para mitigar fraudes com dados sintéticos e duplicidade de CPFs?
Para mitigar fraudes com dados sintéticos e CPFs duplicados, é necessária uma abordagem multidisciplinar que combine tecnologia, governança de dados e compliance. Algumas estratégias eficazes incluem:
  • Validação biométrica forte: Implementar reconhecimento facial com prova de vida (liveness detection) e realizar validação cruzada com bases de dados oficiais.
  • Score de risco sintético: Utilizar modelos de análise que identificam padrões suspeitos em perfis, como o uso de e-mails e telefones descartáveis, a ausência de histórico de crédito ou múltiplos cadastros com o mesmo CPF.
  • Enriquecimento de dados (Data enrichment): Cruzar as informações cadastrais em tempo real com fontes confiáveis, incluindo bases de dados públicas, privadas e de comportamento.
  • Monitoramento contínuo: Acompanhar constantemente o comportamento da conta após a abertura, e não apenas durante o cadastro, para detectar atividades e desvios suspeitos.
A proteção contra esse tipo de fraude exige vigilância contínua, investimento em tecnologia e colaboração entre as instituições.

Autor

Foto de perfil de Karen Maeda

Karen Maeda

Head de Compliance - PLD/FT, Riscos, Auditoria Interna e Controles Internos, Professora, Especialista em Antifraude e Prevenção a Fraudes Eletrônicas, Mentora.