Ana Brainiall

Encuentra CPF, RG y email en documentos automáticamente

intermediario · 9 min · Por Ana Brainiall

Qué es PII y por qué la LGPD te obliga a encontrarla

PII (Personally Identifiable Information) es cualquier dato que identifica a una persona: nombre, CPF, RG, email, teléfono, dirección, datos bancarios, foto, biometría. Según la LGPD (Lei 13.709/2018), si almacenas PII de usuarios brasileños, necesitas:

1. Saber dónde está almacenada cada PII
2. Poder exportar todos los PII de un usuario bajo solicitud (art. 18)
3. Eliminarlos completamente cuando el usuario ejerce el "derecho al olvido"
4. Auditar quién accedió a cada dato personal y cuándo

El problema: la PII termina dispersa en logs, emails, documentos Word, tickets de soporte, capturas de pantalla, bases de datos históricas. Encontrar PII manualmente es imposible en empresas con más de 100 empleados.

ilustração de uma empresa como uma caixa cheia de documentos/arquivos com lupas

Los tipos de PII específicos de Brasil

Los modelos NER (Named Entity Recognition) internacionales detectan bien nombres, emails, teléfonos y direcciones. Para Brasil, necesitamos reconocimiento específico:

Brainiall utiliza un modelo ONNX personalizado entrenado con documentos brasileños + expresiones regulares validadas para capturar estos tipos con una precisión superior al 98%.

Diferencia entre detección y anonimización

Detectar es solo el primer paso. Lo que haces después depende del contexto:

El endpoint de Brainiall ofrece los 4 modos mediante el parámetro mode.

Integrando con tu pipeline

Flujo típico en una empresa:

1. Discovery: escaneo periódico (semanal) en todas las fuentes de datos — bases de datos, S3, logs, email
2. Clasificación: marcar dónde está la PII, qué tipo es y su criticidad
3. Minimización: PII que ya no se necesita = eliminar o mover a cold storage cifrado
4. Atención de solicitudes: cuando el usuario pide exportar o eliminar sus datos, localización rápida mediante índice

La API de detección es solo una capa de ese pipeline. También necesitas infraestructura de metadatos, audit log y mapeo de datos.

diagrama de 4 etapas do ciclo de vida de PII — Discovery → Classification → Mini

Errores comunes a evitar

Pruébalo ahora mismo

En el chat de Brainiall escribe "detecta PII en este texto: [pega el contenido]". O vía API en /api/nlp/pii. Para compliance a escala empresarial, el plan Business por US$19 incluye batch API + retención de log de auditoría por 12 meses.

¿Te gustó el curso?

Desbloquea 17 cursos Pro + 40+ IAs en chat + generación de video, música y Studio completo.

Hazte Pro · US$5.99/mes

Cancela cuando quieras · Sin compromiso