Khôi phục ảnh gia đình cũ bằng AI
Vấn đề đặc thù của khuôn mặt trong ảnh cũ
Ảnh cũ thường bị hư hỏng theo nhiều cách: trầy xước, ố vàng, độ phân giải thấp, mờ nhòe, nén ảnh quá mức. Các thuật toán upscale thông thường có thể xử lý được nhiều vấn đề — nhưng lại thất bại với khuôn mặt. Tại sao? Vì khuôn mặt là vùng mà não bộ chúng ta nhạy cảm nhất với mọi khiếm khuyết. Một vết mờ trên bức tường bạn chẳng để ý. Nhưng một vết mờ trên gò má thôi cũng đủ phá hỏng cả bức ảnh.
GFPGAN (Generative Facial Prior GAN) được tạo ra chính xác để giải quyết điều này. Nó kết hợp hai mạng nơ-ron: một encoder trích xuất cấu trúc khuôn mặt từ ảnh bị hư hỏng (dù đã xuống cấp nghiêm trọng) và một bộ tạo StyleGAN được huấn luyện trên hàng triệu khuôn mặt thật, giúp tái tạo lại các chi tiết.

Cách prior khuôn mặt hoạt động
"Prior khuôn mặt" là thông tin thống kê mà mô hình nắm giữ về cách khuôn mặt người "nên trông như thế nào". StyleGAN được huấn luyện trên bộ dữ liệu FFHQ (70.000 khuôn mặt độ phân giải cao), học được mối liên hệ giữa:
- Hình dạng đầu → vị trí của mắt
- Độ tuổi ước tính → kết cấu da
- Ánh sáng → bóng đổ ở các vùng cụ thể
- Màu tóc → màu điển hình của lông mi
Khi bạn đưa vào một bức ảnh đã xuống cấp, GFPGAN trước tiên đưa ra ước tính tổng quát ("đây là khuôn mặt của một phụ nữ lớn tuổi, có thể da trắng, mắt nâu, tóc bạc"), sau đó dùng StyleGAN để điền vào các chi tiết phù hợp với ước tính đó.

Vấn đề đạo đức: độ trung thực vs độ tin cậy
Đây chính là điểm nhạy cảm nhất của việc khôi phục ảnh bằng AI: bức ảnh đã khôi phục không hoàn toàn là người đã xuất hiện trong đó. Mô hình tự tạo ra các chi tiết trông có vẻ hợp lý với một khuôn mặt chung chung phù hợp với mức độ hư hỏng quan sát được — nhưng có thể sai về hình dạng chính xác của mũi, màu mắt thực sự, hay hàm răng.
Đối với mục đích gia đình, điều này thường chấp nhận được — ngoại hình tổng thể vẫn đúng, và không ai sẽ so sánh pháp y với bản gốc vốn đã bị hư hỏng. Nhưng trong các bối cảnh đòi hỏi độ trung thực cao (nhận dạng pháp lý, báo chí lịch sử), bạn nên trình bày ảnh đã khôi phục cạnh bản gốc, chứ không phải thay thế bản gốc.
Các thực hành tốt nhất để có kết quả tối ưu
- Số hóa ở độ phân giải cao: quét ở tối thiểu 600 DPI, dù bức ảnh gốc nhỏ đến đâu. Càng nhiều pixel để mô hình xử lý = kết quả càng tốt.
- Cắt ảnh theo từng khuôn mặt: nếu ảnh có 5 người, hãy xử lý 5 vùng cắt riêng lẻ. Mô hình tập trung vào trung tâm; khuôn mặt ở góc ảnh sẽ cho kết quả kém hơn.
- Tránh nén ảnh đầu vào: JPEG bị nén sẽ mất đi chính xác các tần số cao mà GFPGAN cần để suy ra các chi tiết.
- Kết hợp với tô màu riêng biệt: GFPGAN giữ nguyên màu sắc của ảnh. Nếu muốn tô màu cho ảnh đen trắng, hãy chạy qua mô hình tô màu trước.
- Lưu giữ bản gốc: luôn giữ lại ảnh thô. Khôi phục là một cách diễn giải, không phải phục hồi hoàn toàn.

Giới hạn khi GFPGAN thất bại
- Ảnh trẻ em: mô hình được huấn luyện chủ yếu trên người lớn; khuôn mặt trẻ em đôi khi trông "già hơn" thực tế
- Che khuất nhiều (khẩu trang, kính râm, tay che mặt): có thể cố tái tạo toàn bộ khuôn mặt, bịa ra những gì không nhìn thấy
- Biểu cảm cực đoan (miệng há to khi hát, cười phá lên): prior khuôn mặt giả định biểu cảm trung tính; có thể làm mịn quá mức
- Phụ kiện văn hóa đặc thù (khăn xếp, trang điểm sân khấu): mô hình có thể xóa bỏ hoặc đơn giản hóa chúng
Thử ngay bây giờ
Gửi một bức ảnh cũ đã được quét vào chat Brainiall và yêu cầu "khôi phục khuôn mặt trong bức ảnh này, giữ nguyên màu sắc và bối cảnh". Pipeline tự động kết hợp phát hiện khuôn mặt + GFPGAN + tái tích hợp. Gói Pro 29R$ xử lý tới 100 lần khôi phục/tháng.