Upscale gambar ke 4K tanpa kehilangan kualitas
Mengapa "zoom" tradisional selalu menghasilkan gambar buram
Ketika Anda memperbesar foto di Photoshop menggunakan Bicubic atau Lanczos, algoritma mengisi piksel baru sebagai rata-rata tertimbang dari piksel tetangganya. Ini memang bersih secara matematis, tetapi hasilnya selalu buram — karena informasi yang tidak ada tidak bisa dimunculkan begitu saja. Anda mengambil gambar 512×512 (262rb piksel) dan menciptakan 768 ribu piksel perantara dari apa yang sudah ada.
AI modern menyelesaikan ini dengan cara yang fundamental berbeda: alih-alih menginterpolasi, AI menghasilkan apa yang kemungkinan besar seharusnya ada di sana. Model seperti Real-ESRGAN dilatih dengan jutaan pasang gambar (resolusi rendah, resolusi tinggi) dan belajar "menghayalkan" detail yang masuk akal — rambut, kulit, tekstur, tepi — yang konsisten dengan apa yang terlihat di gambar asli.

Apa yang "diketahui" model tentang foto nyata
Real-ESRGAN dan model sejenisnya dilatih pada dataset foto besar dalam berbagai skala. Mereka mempelajari prior statistik — yaitu, bagaimana piksel yang berdekatan "biasanya" terlihat ketika berada di area kulit vs kain vs logam vs daun. Ketika Anda memasukkan foto beresolusi rendah, model berkata: "kemungkinan area ini adalah pipi; pipi dalam resolusi tinggi memiliki karakteristik seperti ini".
Ini sangat powerful, namun memiliki efek samping: model akan menciptakan detail yang terlihat benar tetapi tidak sepenuhnya setia pada gambar asli. Untuk foto jurnalistik atau forensik hal ini bermasalah; untuk keperluan kreatif, inilah tepatnya yang Anda inginkan.
Kapan menggunakan Real-ESRGAN vs GFPGAN vs lainnya
Pilihan model bergantung pada apa yang Anda perbesar:
- Real-ESRGAN: penggunaan umum (foto, tangkapan layar, grafis). Menghasilkan ketajaman yang lebih "natural". Biaya komputasi menengah.
- GFPGAN: khusus untuk wajah. Jika gambar Anda mengandung orang, ada baiknya memproses wajah secara terpisah — GFPGAN merekonstruksi mata, mulut, dan rambut dengan kualitas jauh lebih baik untuk area tersebut.
- SwinIR: alternatif yang lebih konservatif — lebih sedikit "halusinasi", lebih tinggi kesetiaan. Lebih baik untuk gambar teknis atau dokumen.
- Pipeline kombinasi: Real-ESRGAN untuk keseluruhan gambar, lalu GFPGAN menggantikan hanya area wajah. Di Brainiall kami melakukan kombinasi ini secara otomatis ketika mendeteksi wajah dalam gambar.

Keterbatasan yang perlu Anda ketahui
- Teks dalam gambar: huruf kecil bisa menjadi coretan tak terbaca jika input sangat buruk. Model "tahu" seperti apa teks itu, tetapi tidak bisa membaca apa yang ada di sana — jika tidak bisa membedakan B dari 8 di gambar asli, AI akan memilih salah satu dan melanjutkan.
- Noise yang diperkuat: foto dengan banyak grain akan memiliki grain yang "diciptakan" bersama dengan detailnya. Terapkan denoise sebelum upscale untuk hasil yang bersih.
- Artefak JPEG: jika gambar asli memiliki blok kompresi JPEG yang terlihat, model bisa memperkuatnya. Gunakan preset "anti-artifact" jika tersedia.
- Komposisi bergaya: seni, lukisan, ilustrasi vektor bisa terlihat "terlalu fotografis" — gunakan model khusus untuk seni (misalnya Real-ESRGAN Anime) untuk kasus seperti ini.
Kasus penggunaan yang sepadan dengan usahanya
- Restorasi foto lama: hasil scan 600×400 → bisa dicetak dalam 4K
- E-commerce: foto produk dari supplier beresolusi rendah → berkualitas tinggi siap tampil di web
- Cetak: gambar web untuk banner atau billboard tanpa pikselasi
- Arsip lama: screenshot video game tahun 90-an, video yang direkam dari VHS, dan sebagainya.
Coba sekarang juga
Di chat Brainiall, kirim gambar beresolusi rendah dan minta "lakukan upscale 4x pada gambar ini". Sertakan dalam prompt apakah gambar mengandung wajah (untuk mengaktifkan kombinasi GFPGAN). Hasilnya dalam 3-8 detik, tergantung ukuran gambar. Paket Pro Rp29 sudah termasuk 100 upscale/bulan.