Ana Brainiall

Temukan CPF, RG, dan email dalam dokumen secara otomatis

intermediario · 9 min · Por Ana Brainiall

Apa itu PII dan mengapa LGPD mewajibkan Anda menemukannya

PII (Personally Identifiable Information) adalah data apa pun yang mengidentifikasi seseorang: nama, CPF, RG, email, telepon, alamat, data perbankan, foto, biometrik. Berdasarkan LGPD (Lei 13.709/2018), jika Anda menyimpan PII pengguna Brasil, Anda wajib:

1. Mengetahui di mana setiap PII disimpan
2. Mampu mengekspor semua PII pengguna atas permintaan (pasal 18)
3. Menghapus sepenuhnya ketika pengguna meminta "hak untuk dilupakan"
4. Mengaudit siapa yang mengakses setiap data pribadi dan kapan

Masalahnya: PII tersebar di log, email, dokumen Word, tiket dukungan, tangkapan layar, database historis. Menemukan PII secara manual adalah hal yang mustahil di perusahaan dengan lebih dari 100 karyawan.

ilustração de uma empresa como uma caixa cheia de documentos/arquivos com lupas

Jenis-jenis PII khusus Brasil

Model NER (Named Entity Recognition) internasional mendeteksi nama, email, telepon, dan alamat dengan baik. Untuk Brasil, kita membutuhkan pengenalan yang lebih spesifik:

Brainiall menggunakan model ONNX kustom yang dilatih pada dokumen Brasil + regex yang telah divalidasi untuk menangkap jenis-jenis ini dengan akurasi 98%+.

Perbedaan antara deteksi dan anonimisasi

Mendeteksi hanyalah langkah pertama. Apa yang dilakukan selanjutnya bergantung pada konteksnya:

Endpoint Brainiall menawarkan keempat mode melalui parameter mode.

Mengintegrasikan dengan pipeline Anda

Alur kerja umum di perusahaan:

1. Discovery: pemindaian berkala (mingguan) di semua sumber data — database, S3, log, email
2. Klasifikasi: menandai di mana PII berada, jenisnya, dan tingkat kritisnya
3. Minimisasi: data PII yang tidak lagi diperlukan = hapus atau pindahkan ke cold storage terenkripsi
4. Pemenuhan permintaan: ketika pengguna meminta ekspor/penghapusan, lokasi cepat melalui indeks

API deteksi hanyalah satu lapisan dari pipeline ini. Anda juga membutuhkan infrastruktur metadata, audit log, dan pemetaan.

diagrama de 4 etapas do ciclo de vida de PII — Discovery → Classification → Mini

Jebakan umum yang perlu diwaspadai

Coba sekarang juga

Di chat Brainiall, minta "deteksi PII dalam teks ini: [tempel konten]". Atau melalui API di /api/nlp/pii. Untuk kepatuhan skala perusahaan, paket Business Rp 199rb menawarkan batch API + penyimpanan log audit selama 12 bulan.

Suka kursusnya?

Buka 17 kursus Pro + 40+ AI di chat + pembuatan video, musik, dan Studio lengkap.

Jadi Pro · Rp 49rb/bulan

Batalkan kapan saja · Tanpa komitmen