Bild-Upscaling auf 4K ohne Qualitätsverlust
Warum ein klassisches "Zoomen" immer unscharf wird
Wenn Sie ein Foto in Photoshop mit Bicubic oder Lanczos vergrößern, füllt der Algorithmus die neuen Pixel als gewichteten Durchschnitt der Nachbarpixel. Das ist mathematisch sauber, aber das Ergebnis ist immer unscharf – denn Information, die nicht existierte, kann nicht einfach erscheinen. Sie nehmen ein 512×512-Bild (262k Pixel) und erfinden die 768.000 Zwischenpixel aus dem, was bereits vorhanden war.
Moderne KI löst dieses Problem auf eine grundlegend andere Weise: Statt zu interpolieren, generiert sie, was wahrscheinlich dort gewesen wäre. Modelle wie Real-ESRGAN wurden auf Millionen von Paaren (niedrig-auflösend, hochauflösend) trainiert und haben gelernt, plausible Details zu "halluzinieren" – Haare, Haut, Texturen, Kanten –, die konsistent mit dem sind, was im Originalbild zu sehen ist.

Was das Modell über echte Fotos "weiß"
Real-ESRGAN und verwandte Modelle wurden auf riesigen Datensätzen mit Fotos in verschiedenen Auflösungen trainiert. Sie erlernen statistische Priors – also, wie benachbarte Pixel in einer Hautpartie, einem Stoff, Metall oder einem Blatt typischerweise aussehen. Wenn Sie ein niedrig aufgelöstes Foto einreichen, sagt das Modell: "Diese Region ist wahrscheinlich eine Wange; Wangen sehen in hoher Auflösung so aus".
Das ist leistungsstark, hat aber einen Nebeneffekt: Das Modell erfindet Details, die plausibel wirken, aber nicht dem Originalbild treu sind. Bei journalistischen oder forensischen Fotos ist das problematisch; für kreative Zwecke ist es genau das, was Sie wollen.
Wann Real-ESRGAN vs. GFPGAN vs. andere einsetzen
Die Wahl des Modells hängt davon ab, was Sie hochskalieren möchten:
- Real-ESRGAN: Allgemeine Verwendung (Fotos, Screenshots, Grafiken). Erzeugt eine eher "natürliche" Schärfe. Mittlerer Rechenaufwand.
- GFPGAN: Speziell für Gesichter. Wenn Ihr Bild eine Person enthält, lohnt es sich, Gesichter separat zu verarbeiten – GFPGAN rekonstruiert Augen, Münder und Haare in dieser Region mit deutlich höherer Qualität.
- SwinIR: Konservativere Alternative – weniger "Halluzination", mehr Originaltreue. Besser für technische Bilder oder Dokumente.
- Kombinierte Pipeline: Real-ESRGAN für das gesamte Bild, anschließend GFPGAN nur für die Gesichtsregionen. Bei Brainiall kombinieren wir beides automatisch, wenn Gesichter im Bild erkannt werden.

Einschränkungen, die Sie kennen sollten
- Text im Bild: Kleine Buchstaben werden unleserlich, wenn das Ausgangsbild sehr schlecht ist. Das Modell "weiß", wie Text aussieht, kann aber nicht lesen, was dort stand – wenn ein B von einer 8 im Original nicht zu unterscheiden ist, wählt die KI eines davon.
- Verstärktes Rauschen: Fotos mit starkem Korn erhalten das "erfundene" Korn zusammen mit den Details. Wenden Sie vor dem Upscaling ein Denoise an, um ein sauberes Ergebnis zu erzielen.
- JPEG-Artefakte: Wenn das Original sichtbare JPEG-Kompressionsblöcke aufweist, kann das Modell diese verstärken. Verwenden Sie das Preset "Anti-Artefakt", wenn verfügbar.
- Stilisierte Kompositionen: Kunst, Gemälde und Vektorillustrationen können "überfotografiert" wirken – verwenden Sie in diesen Fällen spezifische Modelle für Kunst (z. B. Real-ESRGAN Anime).
Anwendungsfälle, die den Aufwand rechtfertigen
- Restaurierung alter Fotos: Digitalisierte 600×400-Aufnahmen → druckfertig in 4K
- E-Commerce: Lieferantenfotos in niedriger Auflösung → hochwertige, weboptimierte Bilder
- Druck: Webbilder für Banner oder Plakatwände ohne Verpixelung
- Alte Dateien: Screenshots von Videospielen aus den 90ern, in VHS aufgezeichnete Videos usw.
Jetzt direkt ausprobieren
Senden Sie im Brainiall-Chat ein niedrig aufgelöstes Bild und bitten Sie: "Skaliere dieses Bild um das 4-Fache hoch". Geben Sie im Prompt an, ob das Bild Gesichter enthält (um die kombinierte GFPGAN-Verarbeitung zu aktivieren). Ergebnis in 3–8 Sekunden, je nach Bildgröße. Der Pro-Plan für 29 R$ beinhaltet 100 Upscalings pro Monat.