Stable-Diffusion-Spickzettel: Fehlersuche & Optimierung

4. Mai 2023

Praktischer Stable-Diffusion-Spickzettel für SDXL, SD 3.5 und Flux. Behandelt Sampler, CFG, Auflösung, Negative Prompts, Modellauswahl und UI-Wahl. Aktualisiert im März 2026.

Stable-Diffusion-Spickzettel: Fehlersuche & Optimierung — Ein abgegriffener elfenbeinfarbener Stapel Karteikarten auf Leinen, zusammengehalten von einem bernsteinfarbenen Gummiband.

Aktualisiert im März 2026. Die ursprüngliche Version dieses Spickzettels wurde im Mai 2023 für SD 1.5 geschrieben. Seitdem hat sich fast alles verändert -- neue Architekturen (SDXL, SD 3.5, Flux), neue UIs (ComfyUI), neue Hardware (RTX 5090) und eine komplette Kehrtwende bei der Philosophie zu Negative Prompts. Das hier ist die aktuelle Version.

Das ist meine Arbeitsreferenz für Stable-Diffusion-Parameter. Kein Tutorial -- nur die Einstellungen, zu denen ich greife, wenn etwas nicht funktioniert oder wenn ich die Qualität weiter treiben will.

Welches Modell du verwenden solltest

Das ist inzwischen die erste Entscheidung, und sie ist wichtiger als jede Parameter-Feinjustierung.

Modell	Am besten für	Auflösung	Hinweise
Flux 2	Fotorealismus, Prompt-Treue	1024x1024+	Bestes Open-Weight-Modell für Fotorealismus im Jahr 2026. In Adobe Photoshop integriert [1]
SDXL	Allgemeine Nutzung	1024x1024	Riesiges Ökosystem an Fine-Tunes. Juggernaut XL, Realistic Vision, DreamShaper
SD 3.5 Large	Höchste Qualität (Stabilitys Flaggschiff)	1024x1024	MMDiT-Architektur. SD 3.0 wurde im April 2025 eingestellt [2]
SDXL Lightning	Geschwindigkeit	1024x1024	Generierung in 2-8 Schritten. Bessere Qualität als Turbo bei höherer Auflösung [3]
SD 1.5	Legacy-Workflows	512x512	Riesige Fine-Tune-Bibliothek, wird aber zunehmend abgelöst. SD 2.0/2.1 offiziell eingestellt

Wenn du frisch anfängst: Flux 2 für Fotorealismus, SDXL für alles andere. SD 3.5 ist gut, aber das Ökosystem ist kleiner.

Welche UI du verwenden solltest

UI	Am besten für
ComfyUI	Power-User. Node-basiert, besseres VRAM-Management, 15% schneller, beste Flux-Unterstützung. Seit 2025 der Branchenstandard für ernsthafte Arbeit [4]
Automatic1111	Einsteiger. Einfachere Oberfläche, riesige Erweiterungsbibliothek. Funktioniert für SDXL weiterhin ordentlich
Fooocus	Ein-Klick-Generierung. Minimale Konfiguration. Gut für schnelle Ergebnisse

Ich nutze ComfyUI. Die Lernkurve ist steiler (rechne mit 10-20 Stunden, bis es sich vertraut anfühlt), aber allein das VRAM-Management ist es wert -- es lässt SDXL auf 8 GB laufen, wo A1111 abstürzt.

Sampler

Die Sampler-Debatte ist weitgehend entschieden.

Meine Standardwahl:

DPM++ 2M Karras -- bestes Verhältnis aus Geschwindigkeit und Qualität. Das ist mein Default für fast alles.
DPM++ SDE Karras -- bei niedrigen Schrittzahlen etwas besser. Gut, wenn du schnell iterierst.
Euler a -- weiterhin zuverlässig. Mehr Varianz in den Ausgaben, gut zum Erkunden.

Wann du wechseln solltest:

Zu wenig Vielfalt in den Ausgaben? Probier DPM++ SDE oder Euler a.
Artefakte oder Übersättigung? Probier DPM++ 2M Karras oder plain Euler.
Geschwindigkeit über alles? Euler a oder DPM++ 2M (non-Karras).
Maximale Qualität? DPM++ 3M SDE Karras oder UniPC.

Schrittzahlen: 20-30 Schritte für die meisten Sampler. Lightning-Modelle brauchen nur 2-8.

CFG (Classifier Free Guidance)

Wie strikt das Modell deinem Prompt folgt statt seiner eigenen Interpretation.

Bereich	Wirkung
1-4	Sehr kreativ, lockere Interpretation. Oft inkohärent
5-7	Gute Balance für die meisten Arbeiten
7-10	Starke Prompt-Treue. Sweet Spot für SDXL-Fotorealismus
10-15	Risiko für Artefakte und überkochte Farben
15+	Fast immer zu viel. Artefakte garantiert

Hinweis: SD 3.5 nutzt einen anderen Guidance-Mechanismus. Das CFG-Konzept gilt weiterhin, aber die Skala verhält sich anders -- fang niedriger an (3-5) und justiere dann nach.

Auflösung

Die Zeiten von 512x512 sind vorbei.

Modell	Native Auflösung	Praktischer Bereich
SD 1.5	512x512	512x512 bis 768x768
SDXL	1024x1024	1024x1024 (Standard), 1024x768, 768x1024
SD 3.5	1024x1024	1024x1024+
Flux	1024x1024	1024x1024+, 4K auf High-End-GPUs möglich

Über die native Auflösung hinauszugehen riskiert Artefakte und Kompositionsprobleme. Nutze Hi-Res Fix oder Upscaling, statt direkt mit 2048x2048 zu generieren.

Clip Skip

Weniger relevant als früher.

SD 1.5: Clip skip 1-2 ist sehr wichtig. Anime-Modelle nutzen oft clip skip 2.
SDXL: Nutzt zwei Text-Encoder (CLIP + OpenCLIP). Clip skip wird meistens ignoriert -- die Architektur geht anders damit um.
SD 3.5 / Flux: Nicht auf dieselbe Weise anwendbar. Diese Modelle nutzen transformerbasiertes Text-Encoding.

Wenn du SDXL oder neuer nutzt: Mach dir um clip skip keine Sorgen. Wenn du SD 1.5 nutzt: Lass es für Fotorealismus bei 1, für Anime bei 2.

Negative Prompts

Die Philosophie hat sich umgedreht. 2023 lautete der Rat, lange Negative-Prompt-Listen zu verwenden. 2026 ist der Konsens: fang mit nichts an und füge nur hinzu, was du wirklich korrigieren musst.

Warum die Änderung:

SDXL und Flux verstehen natürliche Sprache deutlich besser als SD 1.5
Lange Negative Prompts können Kreativität tatsächlich einschränken und schlechtere Ergebnisse erzeugen
"bad anatomy" ist zu vage, um nützlich zu sein. "ugly" funktioniert nicht, weil SD nicht mit als "ugly" gelabelten Bildern trainiert wurde
Manche Modelle schneiden mit langen Negatives nachweislich schlechter ab [5]

Aktueller Ansatz:

Generiere zuerst ohne jeden Negative Prompt.
Wenn du ein konkretes Problem siehst (zusätzliche Finger, unscharfer Hintergrund), füge dafür ein gezieltes Negative hinzu.
Nutze Emphasis Weighting: (blurry:1.3) statt nur blurry.
Halt es kurz -- maximal 5-10 Begriffe.

GPU-Kurzreferenz

GPU	VRAM	Gut für
RTX 3060 12GB	12GB	SD 1.5, einfaches SDXL
RTX 4070 Ti	12GB	SDXL, etwas Flux
RTX 4090	24GB	Alles. Das Arbeitspferd
RTX 5090	32GB	Alles, einschließlich 4K und Batch-Generierung
8GB-Karten	8GB	Minimal brauchbar. ComfyUI hilft beim VRAM-Management

Ab 24 GB wird es für SDXL und Flux komfortabel, ohne ständig mit VRAM jonglieren zu müssen.

Schnelle Troubleshooting-Fixes

Problem	Versuch
Unscharfe Ausgabe	Schritte erhöhen. Prüfen, ob die Auflösung zur nativen Auflösung des Modells passt
Zusätzliche Finger/Gliedmaßen	`extra fingers, extra limbs` zum Negative Prompt hinzufügen. Oder ControlNet verwenden
Übersättigte Farben	CFG senken. Zu DPM++ 2M Karras wechseln
Komposition ist falsch	ControlNet (depth, canny, pose) nutzen, statt gegen den Prompt zu kämpfen
Generierung ist langsam	Lightning-Modell nutzen, Schritte reduzieren, ComfyUI für besseres VRAM verwenden
Kein VRAM mehr	Zu ComfyUI wechseln, Batch-Größe reduzieren, fp16 verwenden

Referenzen

1. Flux 2 and NVIDIA RTX AI Integration -- NVIDIAs Berichterstattung zu Flux 2 mit ComfyUI.
2. Stability AI Release Notes -- SD-3.0-Einstellung und 3.5-Release.
3. SDXL-Lightning by ByteDance -- Generierung in 2-8 Schritten bei 1024 px.
4. ComfyUI vs Automatic1111 2026 Comparison -- Performance- und Feature-Vergleich.
5. How to Use Negative Prompts Effectively -- Aktualisierter Leitfaden zur minimalistischen Negative-Prompt-Philosophie.
6. Understanding Stable Diffusion Samplers -- Sampler-Vergleich und Auswahlhilfe.
7. Best Stable Diffusion Models for 2026 -- Aktuelle Modelllandschaft.