Ana Brainiall

Trouvez automatiquement CPF, RG et email dans vos documents

intermediario · 9 min · Por Ana Brainiall

Qu'est-ce que la PII et pourquoi la LGPD vous oblige à la localiser

La PII (Personally Identifiable Information) désigne toute donnée permettant d'identifier une personne : nom, CPF, RG, email, téléphone, adresse, coordonnées bancaires, photo, biométrie. En vertu de la LGPD (Lei 13.709/2018), si vous stockez des PII d'utilisateurs brésiliens, vous devez :

1. Savoir chaque PII est stockée
2. Pouvoir exporter toutes les PII d'un utilisateur sur demande (art. 18)
3. Les supprimer intégralement lorsque l'utilisateur exerce son « droit à l'oubli »
4. Auditer qui a accédé à chaque donnée personnelle et à quel moment

Le problème : les PII se retrouvent éparpillées dans des logs, des emails, des documents Word, des tickets de support, des captures d'écran, des bases de données historiques. Localiser les PII manuellement est impossible dans une entreprise de plus de 100 employés.

ilustração de uma empresa como uma caixa cheia de documentos/arquivos com lupas

Les types de PII spécifiques au Brésil

Les modèles NER (Named Entity Recognition) internationaux détectent bien les noms, emails, numéros de téléphone et adresses. Pour le Brésil, une reconnaissance spécifique est nécessaire :

Brainiall utilise un modèle ONNX personnalisé, entraîné sur des documents brésiliens, combiné à des expressions régulières validées pour capturer ces types avec une précision supérieure à 98 %.

Différence entre détection et anonymisation

La détection n'est que la première étape. La suite dépend du contexte :

L'endpoint Brainiall propose ces 4 modes via le paramètre mode.

Intégration dans votre pipeline

Flux typique en entreprise :

1. Discovery : scan périodique (hebdomadaire) de toutes les sources de données — bases de données, S3, logs, emails
2. Classification : identifier où se trouvent les PII, leur type et leur niveau de criticité
3. Minimisation : les PII dont vous n'avez plus besoin → suppression ou déplacement vers un stockage froid chiffré
4. Traitement des demandes : lorsqu'un utilisateur demande un export ou une suppression, localisation rapide via l'index

L'API de détection n'est qu'une couche de ce pipeline. Vous aurez également besoin d'une infrastructure de métadonnées, d'un audit log et d'une cartographie des données.

diagrama de 4 etapas do ciclo de vida de PII — Discovery → Classification → Mini

Les pièges les plus courants

Testez dès maintenant

Dans le chat Brainiall, demandez « détectez les PII dans ce texte : [collez votre contenu] ». Ou via API sur /api/nlp/pii. Pour une conformité à l'échelle de l'entreprise, l'offre Business à €18 inclut une batch API et la conservation des logs d'audit pendant 12 mois.

Ce cours vous a plu?

Débloquez 17 cours Pro + 40+ IA dans le chat + génération vidéo, musique et Studio complet.

Passer Pro · €5,49/mois

Annulez à tout moment · Sans engagement