Ana Brainiall

Encontre CPF, RG e email em documentos automaticamente

intermediario · 9 min · Por Ana Brainiall

O que é PII e por que LGPD te obriga a encontrar

PII (Personally Identifiable Information) é qualquer dado que identifica uma pessoa: nome, CPF, RG, email, telefone, endereço, dados bancários, foto, biometria. Pela LGPD (Lei 13.709/2018), se você guarda PII de usuários brasileiros, você precisa:

1. Saber onde cada PII está armazenada
2. Poder exportar todos os PII de um usuário sob requisição (art. 18)
3. Deletar completamente quando o usuário pede o "direito ao esquecimento"
4. Auditar quem acessou cada dado pessoal e quando

O problema: PII acaba espalhada em logs, emails, documentos Word, tickets de suporte, prints de tela, databases históricos. Encontrar PII manualmente é impossível em empresa com mais de 100 funcionários.

ilustração de uma empresa como uma caixa cheia de documentos/arquivos com lupas

Os tipos de PII específicos do Brasil

Modelos NER (Named Entity Recognition) internacionais detectam bem nome, email, telefone, endereço. Para Brasil, precisamos de reconhecimento específico:

A Brainiall usa um modelo ONNX customizado treinado em documentos brasileiros + regex validados para capturar esses tipos com 98%+ precisão.

Ilustração do curso

🎧 Ouça a narração completa (vídeo demo em produção)

Diferença entre detecção e anonimização

Detectar é só o primeiro passo. O que fazer depois depende do contexto:

O endpoint da Brainiall oferece todos os 4 modos via parâmetro mode.

Integrando com seu pipeline

Fluxo típico em empresa:

1. Discovery: scan periódico (semanal) em todas as fontes de dados — bancos, S3, logs, email
2. Classificação: marcar onde PII está, qual tipo, criticidade
3. Minimização: dados PII que não precisam mais = delete ou move para cold storage criptografado
4. Request fulfillment: quando usuário pede export/delete, localização rápida via index

A API de detecção é apenas uma camada desse pipeline. Você precisa também de infra de metadados, audit log, mapeamento.

diagrama de 4 etapas do ciclo de vida de PII — Discovery → Classification → Mini

Armadilhas comuns

Teste agora mesmo

No chat Brainiall peça "detecte PII neste texto: [cole conteúdo]". Ou via API em /api/nlp/pii. Para compliance escala-empresa, Business R$99 oferece batch API + retenção log auditoria por 12 meses.

🎁 Indique amigos, ganhe mês grátis

Cada 3 indicados que assinam Pro = R$29 de crédito no seu próximo ciclo.

Ver meu código →