O que o número de CPFs ativos ser maior que a população brasileira indica?

O fato de o número de CPFs ativos no Brasil ser superior à população total do país é um indicativo da proliferação de dados sintéticos e da duplicidade de CPFs. Segundo dados de junho de 2024 do IBGE, o Brasil possui 212 milhões de habitantes, enquanto o número de CPFs ativos ultrapassa esse total. Esse descompasso aponta para um problema estrutural de fraudes em larga escala, especialmente na abertura de contas digitais.

Como um "perfil sintético" pode ser usado para fraudes?

Um "perfil sintético" é uma identidade fraudulenta criada a partir da combinação de informações reais com informações falsas. Um exemplo comum é associar um número de CPF real e ativo a nomes, endereços e contatos que são completamente inexistentes. Esse perfil falso é então utilizado para cometer fraudes, como a abertura de contas em bancos digitais ou a contratação de serviços de crédito.

O que é a duplicidade de CPFs e como fraudadores a exploram?

A duplicidade de CPF acontece quando um único número de cadastro é associado a múltiplas identidades digitais distintas. Fraudadores exploram essa vulnerabilidade de duas maneiras principais:

Quais são as técnicas mais comuns utilizadas por fraudadores para criar contas falsas?

Os fraudadores utilizam diversas técnicas para criar perfis e contas falsas em escala. Entre as mais comuns estão:

Qual o impacto da fraude com dados sintéticos nos bancos digitais?

A fraude com dados sintéticos e a criação de contas falsas geram diversos impactos negativos para os bancos digitais. A arquitetura de onboarding 100% online, embora seja uma vantagem competitiva, representa um vetor de risco significativo se os mecanismos de validação de identidade não forem robustos. A multiplicação de contas fraudulentas compromete a segurança da operação, eleva o risco de crimes como a lavagem de dinheiro e pode resultar em sanções regulatórias para a instituição financeira.

Quais estratégias podem ser adotadas para mitigar fraudes com dados sintéticos e duplicidade de CPFs?

Para mitigar fraudes com dados sintéticos e CPFs duplicados, é necessária uma abordagem multidisciplinar que combine tecnologia, governança de dados e compliance. Algumas estratégias eficazes incluem:

Fraudes com Dados Sintéticos: o que é e como funciona este tipo de fraude

Segundo o IBGE (Instituto Brasileiro de Geografia e Estatística), somos 212 milhões de brasileiros (Dados Junho/2024). No entanto, o número de CPFs ativos no país ultrapassa, com folga, esse total populacional. Esse descompasso é um indicativo claro de um problema estrutural: a proliferação de dados sintéticos e duplicidades de CPFs usados para fraudes em larga escala, especialmente na abertura de contas digitais.

O que são dados sintéticos?

Dados sintéticos são informações geradas artificialmente com o objetivo de simular dados reais. Em ambientes legítimos, eles são utilizados para treinar modelos de machine learning ou testar sistemas sem expor dados sensíveis. Porém, quando utilizados de forma maliciosa, tornam-se ferramentas poderosas para fraudes. Um exemplo é a criação de um "perfil sintético" — uma combinação de informações reais e falsas, como um CPF ativo, mas associado a nomes, endereços e contatos inexistentes.

Como funciona a duplicidade de CPFs?

A duplicidade de CPF ocorre quando o mesmo número de cadastro é vinculado a múltiplas identidades digitais diferentes. Esse fenômeno pode ser explorado por fraudadores de duas formas principais:

Perfis sintéticos múltiplos com um único CPF: O fraudador associa o mesmo número de CPF a vários perfis falsos, utilizando variações de nome, telefone e endereço. Cada perfil pode ser usado para abrir uma nova conta bancária ou contratar serviços de crédito.
Reciclagem de CPFs inativos ou desatualizados: Em muitos casos, CPFs de pessoas falecidas ou inativas são reutilizados para criar novas identidades, aproveitando brechas em cadastros públicos e privados.

Técnicas mais comuns utilizadas por fraudadores

Automação de cadastros: Bots que fazem ataques de preenchimento em massa, criando milhares de perfis com variações mínimas.
Análise de lacunas cadastrais: Exploração de bases de dados públicas ou vazadas para construir perfis suficientemente críveis.
Uso de documentos falsificados ou adulterados: Impressão de documentos com dados reais e fotos falsas, aproveitando a fragilidade de validações superficiais.
Abuso de sistemas de validação fracos: Plataformas que aceitam cadastro apenas com validação de CPF ativo na base da Receita Federal estão especialmente vulneráveis.

O impacto nos bancos digitais

A arquitetura moderna dos bancos digitais — baseada em onboarding 100% online — é ao mesmo tempo uma vantagem competitiva e um vetor de risco. A ausência de interação humana no processo de abertura de conta exige que os mecanismos de validação de identidade sejam extremamente robustos. A multiplicação de contas falsas compromete a segurança da operação, aumenta o risco de lavagem de dinheiro e pode gerar sanções regulatórias.

Como mitigar fraudes com dados sintéticos?

A prevenção exige uma abordagem multidisciplinar, que una tecnologia, governança de dados e compliance. Algumas estratégias eficazes incluem:

Validação biométrica forte: Reconhecimento facial com prova de vida e validação cruzada com bases oficiais.
Score de risco sintético: Modelos que identificam padrões suspeitos em perfis (e.g., telefone e e-mail descartáveis, ausência de histórico de crédito, cadastros múltiplos com o mesmo CPF).
Data enrichment com fontes confiáveis: Cruzamento em tempo real com bases de dados públicas, privadas e comportamentais.
Monitoramento contínuo: Não basta validar apenas na entrada. O comportamento da conta precisa ser acompanhado constantemente para detectar desvios.

A fraude com dados sintéticos e a duplicidade de CPFs são sintomas de um ecossistema ainda vulnerável, que precisa amadurecer em termos de segurança digital. A confiança é o principal ativo dos bancos digitais — e protegê-la exige vigilância contínua, investimento em tecnologia e colaboração entre instituições.

* https://g1.globo.com/politica/noticia/2020/09/02/brasil-tem-125-milhoes-de-cpfs-ativos-a-mais-que-a-populacao-total-e-tcu-cobra-receita-federal.ghtml

#FraudesFinanceiras #DadosSintéticos #CPFDuplicado #SegurançaDigital #BancosDigitais #Compliance #OnboardingSeguro #IdentidadeDigital #ValidaçãoBiométrica #CombateÀFraude

Autor

Karen Maeda

Head de Compliance - PLD/FT, Riscos, Auditoria Interna e Controles Internos, Professora, Especialista em Antifraude e Prevenção a Fraudes Eletrônicas, Mentora.