Stable-Diffusion-Spickzettel: Fehlersuche & Optimierung

Praktischer Stable-Diffusion-Spickzettel für SDXL, SD 3.5 und Flux. Behandelt Sampler, CFG, Auflösung, Negative Prompts, Modellauswahl und UI-Wahl. Aktualisiert im März 2026.

Aktualisiert im März 2026. Die ursprüngliche Version dieses Spickzettels wurde im Mai 2023 für SD 1.5 geschrieben. Seitdem hat sich fast alles verändert -- neue Architekturen (SDXL, SD 3.5, Flux), neue UIs (ComfyUI), neue Hardware (RTX 5090) und eine komplette Kehrtwende bei der Philosophie zu Negative Prompts. Das hier ist die aktuelle Version.

Das ist meine Arbeitsreferenz für Stable-Diffusion-Parameter. Kein Tutorial -- nur die Einstellungen, zu denen ich greife, wenn etwas nicht funktioniert oder wenn ich die Qualität weiter treiben will.

Welches Modell du verwenden solltest

Das ist inzwischen die erste Entscheidung, und sie ist wichtiger als jede Parameter-Feinjustierung.

Modell Am besten für Auflösung Hinweise
Flux 2 Fotorealismus, Prompt-Treue 1024x1024+ Bestes Open-Weight-Modell für Fotorealismus im Jahr 2026. In Adobe Photoshop integriert [1]
SDXL Allgemeine Nutzung 1024x1024 Riesiges Ökosystem an Fine-Tunes. Juggernaut XL, Realistic Vision, DreamShaper
SD 3.5 Large Höchste Qualität (Stabilitys Flaggschiff) 1024x1024 MMDiT-Architektur. SD 3.0 wurde im April 2025 eingestellt [2]
SDXL Lightning Geschwindigkeit 1024x1024 Generierung in 2-8 Schritten. Bessere Qualität als Turbo bei höherer Auflösung [3]
SD 1.5 Legacy-Workflows 512x512 Riesige Fine-Tune-Bibliothek, wird aber zunehmend abgelöst. SD 2.0/2.1 offiziell eingestellt

Wenn du frisch anfängst: Flux 2 für Fotorealismus, SDXL für alles andere. SD 3.5 ist gut, aber das Ökosystem ist kleiner.

Welche UI du verwenden solltest

UI Am besten für
ComfyUI Power-User. Node-basiert, besseres VRAM-Management, 15% schneller, beste Flux-Unterstützung. Seit 2025 der Branchenstandard für ernsthafte Arbeit [4]
Automatic1111 Einsteiger. Einfachere Oberfläche, riesige Erweiterungsbibliothek. Funktioniert für SDXL weiterhin ordentlich
Fooocus Ein-Klick-Generierung. Minimale Konfiguration. Gut für schnelle Ergebnisse

Ich nutze ComfyUI. Die Lernkurve ist steiler (rechne mit 10-20 Stunden, bis es sich vertraut anfühlt), aber allein das VRAM-Management ist es wert -- es lässt SDXL auf 8 GB laufen, wo A1111 abstürzt.

Sampler

Die Sampler-Debatte ist weitgehend entschieden.

Meine Standardwahl:

  • DPM++ 2M Karras -- bestes Verhältnis aus Geschwindigkeit und Qualität. Das ist mein Default für fast alles.
  • DPM++ SDE Karras -- bei niedrigen Schrittzahlen etwas besser. Gut, wenn du schnell iterierst.
  • Euler a -- weiterhin zuverlässig. Mehr Varianz in den Ausgaben, gut zum Erkunden.

Wann du wechseln solltest:

  • Zu wenig Vielfalt in den Ausgaben? Probier DPM++ SDE oder Euler a.
  • Artefakte oder Übersättigung? Probier DPM++ 2M Karras oder plain Euler.
  • Geschwindigkeit über alles? Euler a oder DPM++ 2M (non-Karras).
  • Maximale Qualität? DPM++ 3M SDE Karras oder UniPC.

Schrittzahlen: 20-30 Schritte für die meisten Sampler. Lightning-Modelle brauchen nur 2-8.

CFG (Classifier Free Guidance)

Wie strikt das Modell deinem Prompt folgt statt seiner eigenen Interpretation.

Bereich Wirkung
1-4 Sehr kreativ, lockere Interpretation. Oft inkohärent
5-7 Gute Balance für die meisten Arbeiten
7-10 Starke Prompt-Treue. Sweet Spot für SDXL-Fotorealismus
10-15 Risiko für Artefakte und überkochte Farben
15+ Fast immer zu viel. Artefakte garantiert

Hinweis: SD 3.5 nutzt einen anderen Guidance-Mechanismus. Das CFG-Konzept gilt weiterhin, aber die Skala verhält sich anders -- fang niedriger an (3-5) und justiere dann nach.

Auflösung

Die Zeiten von 512x512 sind vorbei.

Modell Native Auflösung Praktischer Bereich
SD 1.5 512x512 512x512 bis 768x768
SDXL 1024x1024 1024x1024 (Standard), 1024x768, 768x1024
SD 3.5 1024x1024 1024x1024+
Flux 1024x1024 1024x1024+, 4K auf High-End-GPUs möglich

Über die native Auflösung hinauszugehen riskiert Artefakte und Kompositionsprobleme. Nutze Hi-Res Fix oder Upscaling, statt direkt mit 2048x2048 zu generieren.

Clip Skip

Weniger relevant als früher.

  • SD 1.5: Clip skip 1-2 ist sehr wichtig. Anime-Modelle nutzen oft clip skip 2.
  • SDXL: Nutzt zwei Text-Encoder (CLIP + OpenCLIP). Clip skip wird meistens ignoriert -- die Architektur geht anders damit um.
  • SD 3.5 / Flux: Nicht auf dieselbe Weise anwendbar. Diese Modelle nutzen transformerbasiertes Text-Encoding.

Wenn du SDXL oder neuer nutzt: Mach dir um clip skip keine Sorgen. Wenn du SD 1.5 nutzt: Lass es für Fotorealismus bei 1, für Anime bei 2.

Negative Prompts

Die Philosophie hat sich umgedreht. 2023 lautete der Rat, lange Negative-Prompt-Listen zu verwenden. 2026 ist der Konsens: fang mit nichts an und füge nur hinzu, was du wirklich korrigieren musst.

Warum die Änderung:

  • SDXL und Flux verstehen natürliche Sprache deutlich besser als SD 1.5
  • Lange Negative Prompts können Kreativität tatsächlich einschränken und schlechtere Ergebnisse erzeugen
  • "bad anatomy" ist zu vage, um nützlich zu sein. "ugly" funktioniert nicht, weil SD nicht mit als "ugly" gelabelten Bildern trainiert wurde
  • Manche Modelle schneiden mit langen Negatives nachweislich schlechter ab [5]

Aktueller Ansatz:

  1. Generiere zuerst ohne jeden Negative Prompt.
  2. Wenn du ein konkretes Problem siehst (zusätzliche Finger, unscharfer Hintergrund), füge dafür ein gezieltes Negative hinzu.
  3. Nutze Emphasis Weighting: (blurry:1.3) statt nur blurry.
  4. Halt es kurz -- maximal 5-10 Begriffe.

GPU-Kurzreferenz

GPU VRAM Gut für
RTX 3060 12GB 12GB SD 1.5, einfaches SDXL
RTX 4070 Ti 12GB SDXL, etwas Flux
RTX 4090 24GB Alles. Das Arbeitspferd
RTX 5090 32GB Alles, einschließlich 4K und Batch-Generierung
8GB-Karten 8GB Minimal brauchbar. ComfyUI hilft beim VRAM-Management

Ab 24 GB wird es für SDXL und Flux komfortabel, ohne ständig mit VRAM jonglieren zu müssen.

Schnelle Troubleshooting-Fixes

Problem Versuch
Unscharfe Ausgabe Schritte erhöhen. Prüfen, ob die Auflösung zur nativen Auflösung des Modells passt
Zusätzliche Finger/Gliedmaßen extra fingers, extra limbs zum Negative Prompt hinzufügen. Oder ControlNet verwenden
Übersättigte Farben CFG senken. Zu DPM++ 2M Karras wechseln
Komposition ist falsch ControlNet (depth, canny, pose) nutzen, statt gegen den Prompt zu kämpfen
Generierung ist langsam Lightning-Modell nutzen, Schritte reduzieren, ComfyUI für besseres VRAM verwenden
Kein VRAM mehr Zu ComfyUI wechseln, Batch-Größe reduzieren, fp16 verwenden

Referenzen

1. Flux 2 and NVIDIA RTX AI Integration -- NVIDIAs Berichterstattung zu Flux 2 mit ComfyUI.
2. Stability AI Release Notes -- SD-3.0-Einstellung und 3.5-Release.
3. SDXL-Lightning by ByteDance -- Generierung in 2-8 Schritten bei 1024 px.
4. ComfyUI vs Automatic1111 2026 Comparison -- Performance- und Feature-Vergleich.
5. How to Use Negative Prompts Effectively -- Aktualisierter Leitfaden zur minimalistischen Negative-Prompt-Philosophie.
6. Understanding Stable Diffusion Samplers -- Sampler-Vergleich und Auswahlhilfe.
7. Best Stable Diffusion Models for 2026 -- Aktuelle Modelllandschaft.


Verwandte Beiträge


Kommentare

Boris D. Teoharov

Autor

Hallo, ich bin Boris

Ich bin kein Schriftsteller. Ich bin kein Philosoph. Ich bin nur ein Backend-Engineer aus Bulgarien, irgendwo zwischen Laravel-Queues und Indizes mit Hunderten Millionen Zeilen.