Ana Brainiall

Görüntüyü kalite kaybetmeden 4K'ya yükseltme

intermediario · 10 min · Por Ana Brainiall

Geleneksel "zoom" neden her zaman bulanıklaştırır

Photoshop'ta Bicubic veya Lanczos kullanarak bir fotoğrafı büyüttüğünüzde, algoritma yeni pikselleri komşularının ağırlıklı ortalaması olarak doldurur. Bu matematiksel açıdan temiz bir yöntemdir; ancak sonuç her zaman bulanık olur — çünkü var olmayan bilgi ortaya çıkamaz. 512×512 (262 bin piksel) bir görüntü aldınız ve ara 768 bin pikseli elinizdekilere dayanarak icat ettiniz.

Modern yapay zeka bunu temelden farklı bir şekilde çözer: enterpolasyon yapmak yerine, muhtemelen orada olması gerekeni üretir. Real-ESRGAN gibi modeller, milyonlarca (düşük çözünürlük, yüksek çözünürlük) çifti üzerinde eğitilmiş ve orijinal görüntüyle tutarlı olan saç, cilt, doku, kenar gibi makul ayrıntıları "hayal etmeyi" öğrenmiştir.

comparação lado a lado — à esquerda uma foto 512x512 ampliada com bicubic (borra

Modelin gerçek fotoğraflar hakkında "bildikleri"

Real-ESRGAN ve benzerleri, çeşitli ölçeklerdeki fotoğraflardan oluşan devasa veri setleri üzerinde eğitilmiştir. Bu modeller istatistiksel prior'lar öğrenir; yani yakın piksellerin cilt, kumaş, metal veya yaprak bölgesinde olduğunda "normalde" nasıl göründüğünü. Düşük çözünürlüklü bir fotoğraf verdiğinizde model şunu söyler: "Bu bölge muhtemelen bir yanak; yüksek çözünürlüklü yanaklar şu özelliklere sahiptir."

Bu güçlü bir yaklaşımdır; ancak bir yan etkisi vardır: model, doğru görünecek ama orijinal görüntüye sadık olmayan ayrıntılar icat edecektir. Gazetecilik veya adli fotoğraflarda bu sorunludur; yaratıcı kullanım için ise tam istediğiniz şeydir.

Real-ESRGAN, GFPGAN ve diğerleri: hangisini kullanmalısınız?

Model seçimi, büyüttüğünüz içeriğe bağlıdır:

tabela visual comparando 4 modelos — colunas: modelo, uso ideal, qualidade face,

Bilmeniz gereken sınırlamalar

Çabaya değer kullanım senaryoları

Hemen deneyin

Brainiall sohbetinde düşük çözünürlüklü bir görüntü gönderin ve "bu görüntüyü 4x büyüt" isteğinde bulunun. Görüntüde yüz varsa bunu prompt'a ekleyin (kombine GFPGAN'ı etkinleştirmek için). Boyuta bağlı olarak 3-8 saniye içinde sonuç alırsınız. Pro Plan ayda 100 upscale içerir.

API Entegrasyonu

Sohbete ek olarak, uygulamanıza entegre etmek için REST API'yi kullanın. Bearer token ile kimlik doğrulama (app.brainiall.com'dan alın).

curl -X POST https://chat.brainiall.com/api/images/upscale \
  -H "Authorization: Bearer $BRAINIALL_KEY" \
  -F "image=@input.jpg" \
  -F "scale=4" \
  -o output_4k.png
import requests, os
r = requests.post("https://chat.brainiall.com/api/images/upscale",
    files={"image": open("input.jpg", "rb")}, data={"scale": 4},
    headers={"Authorization": f"Bearer {os.environ["BRAINIALL_KEY"]}"} )
open("output_4k.png", "wb").write(r.content)

Kursu beğendin mi?

17 Pro kurs + sohbette 40+ AI + video, müzik ve tam Studio üretimi aç.

Pro Ol · ₺99/ay

İstediğin zaman iptal et · Taahhüt yok