Aide-mémoire Stable Diffusion : dépannage et optimisation

4 mai 2023

Aide-mémoire pratique pour Stable Diffusion avec SDXL, SD 3.5 et Flux. Couvre les samplers, le CFG, la résolution, les prompts négatifs, le choix du modèle et le choix de l'interface. Mis à jour en mars 2026.

Aide-mémoire Stable Diffusion : dépannage et optimisation — Une pile ivoire de fiches cornées sur du lin, tenue par un élastique ambré.

Mis à jour en mars 2026. La version originale de cet aide-mémoire a été écrite pour SD 1.5 en mai 2023. Presque tout a changé depuis -- nouvelles architectures (SDXL, SD 3.5, Flux), nouvelles interfaces (ComfyUI), nouveau matériel (RTX 5090) et renversement complet de la philosophie des prompts négatifs. Voici la version actuelle.

Ceci est ma référence de travail pour les paramètres de Stable Diffusion. Pas un tutoriel -- seulement les réglages que je vais chercher quand quelque chose ne marche pas ou quand je veux pousser la qualité.

Quel modèle utiliser

C'est maintenant la première décision, et elle compte plus que n'importe quel ajustement de paramètre.

Modèle	Idéal pour	Résolution	Notes
Flux 2	Photoréalisme, respect du prompt	1024x1024+	Meilleur modèle open-weight pour le photoréalisme en 2026. Intégré à Adobe Photoshop [1]
SDXL	Usage général	1024x1024	Énorme écosystème de fine-tunes. Juggernaut XL, Realistic Vision, DreamShaper
SD 3.5 Large	Qualité maximale (le fleuron de Stability)	1024x1024	Architecture MMDiT. SD 3.0 a été déprécié en avril 2025 [2]
SDXL Lightning	Vitesse	1024x1024	Génération en 2 à 8 étapes. Meilleure qualité que Turbo à haute résolution [3]
SD 1.5	Workflows hérités	512x512	Immense bibliothèque de fine-tunes, mais en voie d'abandon. SD 2.0/2.1 officiellement dépréciés

Si vous repartez de zéro : Flux 2 pour le photoréalisme, SDXL pour tout le reste. SD 3.5 est bon, mais son écosystème est plus petit.

Quelle interface utiliser

Interface	Idéale pour
ComfyUI	Utilisateurs avancés. Basée sur des nœuds, meilleure gestion de la VRAM, 15 % plus rapide, meilleur support de Flux. Standard industriel pour le travail sérieux depuis 2025 [4]
Automatic1111	Débutants. Interface plus simple, immense bibliothèque d'extensions. Fonctionne encore très bien pour SDXL
Fooocus	Génération en un clic. Configuration minimale. Bien pour des résultats rapides

J'utilise ComfyUI. La courbe d'apprentissage est plus raide (comptez 10 à 20 heures pour être à l'aise), mais la gestion de la VRAM vaut à elle seule l'effort -- il fait tourner SDXL sur 8 Go là où A1111 plante.

Samplers

Le débat sur les samplers est plus ou moins réglé.

Choix par défaut :

DPM++ 2M Karras -- meilleur rapport vitesse/qualité. C'est mon choix par défaut pour presque tout.
DPM++ SDE Karras -- légèrement meilleur avec peu d'étapes. Bon quand vous itérez vite.
Euler a -- toujours fiable. Plus de variété dans les sorties, utile pour explorer.

Quand changer :

Manque de diversité dans les sorties ? Essayez DPM++ SDE ou Euler a.
Artefacts ou sursaturation ? Essayez DPM++ 2M Karras ou Euler simple.
Besoin de vitesse avant tout ? Euler a ou DPM++ 2M (non-Karras).
Vous voulez la qualité maximale ? DPM++ 3M SDE Karras ou UniPC.

Nombre d'étapes : 20 à 30 étapes pour la plupart des samplers. Les modèles Lightning n'en demandent que 2 à 8.

CFG (Classifier Free Guidance)

À quel point le modèle suit strictement votre prompt plutôt que sa propre interprétation.

Plage	Effet
1-4	Très créatif, interprétation lâche. Souvent incohérent
5-7	Bon équilibre pour la plupart des travaux
7-10	Forte adhérence au prompt. Zone idéale pour le photoréalisme avec SDXL
10-15	Risque d'artefacts et de couleurs trop cuites
15+	Presque toujours trop. Artefacts garantis

Note : SD 3.5 utilise un mécanisme de guidance différent. Le concept de CFG s'applique encore, mais l'échelle se comporte autrement -- commencez plus bas (3-5) et ajustez.

Résolution

L'époque du 512x512 est finie.

Modèle	Résolution native	Plage pratique
SD 1.5	512x512	512x512 à 768x768
SDXL	1024x1024	1024x1024 (standard), 1024x768, 768x1024
SD 3.5	1024x1024	1024x1024+
Flux	1024x1024	1024x1024+, 4K possible sur GPU haut de gamme

Dépasser la résolution native risque de produire des artefacts et des problèmes de composition. Utilisez plutôt hi-res fix ou l'upscaling au lieu de générer directement en 2048x2048.

Clip Skip

Moins pertinent qu'avant.

SD 1.5 : Clip skip 1-2 compte beaucoup. Les modèles anime utilisent souvent clip skip 2.
SDXL : Utilise deux encodeurs de texte (CLIP + OpenCLIP). Clip skip est largement ignoré -- l'architecture le gère différemment.
SD 3.5 / Flux : Pas applicable de la même manière. Ces modèles utilisent un encodage de texte basé sur des transformers.

Si vous êtes sur SDXL ou plus récent : ne vous préoccupez pas de clip skip. Si vous êtes sur SD 1.5 : gardez-le à 1 pour le photoréalisme, 2 pour l'anime.

Prompts négatifs

La philosophie s'est retournée. En 2023, le conseil était d'utiliser de longues listes de prompts négatifs. En 2026, le consensus est : commencez sans rien et n'ajoutez que ce dont vous avez besoin pour corriger.

Pourquoi ce changement :

SDXL et Flux comprennent le langage naturel bien mieux que SD 1.5
Les longs prompts négatifs peuvent en fait restreindre la créativité et produire de moins bons résultats
"bad anatomy" est trop vague pour être utile. "ugly" ne fonctionne pas parce que SD n'a pas été entraîné sur des images étiquetées "ugly"
Certains modèles donnent des résultats nettement pires avec de longs négatifs [5]

Approche actuelle :

Générez d'abord sans aucun prompt négatif.
Si vous voyez un problème précis (doigts en trop, arrière-plan flou), ajoutez un négatif ciblé pour celui-ci.
Utilisez la pondération d'emphase : (blurry:1.3) au lieu de simplement blurry.
Gardez-le court -- 5 à 10 termes au maximum.

Référence rapide GPU

GPU	VRAM	Bien pour
RTX 3060 12GB	12GB	SD 1.5, SDXL de base
RTX 4070 Ti	12GB	SDXL, un peu de Flux
RTX 4090	24GB	Tout. La machine de travail
RTX 5090	32GB	Tout, y compris la 4K et la génération par lots
Cartes 8GB	8GB	Minimum viable. ComfyUI aide à gérer la VRAM

Le seuil des 24 Go est celui où les choses deviennent confortables pour SDXL et Flux sans jongler constamment avec la VRAM.

Correctifs rapides de dépannage

Problème	À essayer
Sortie floue	Augmentez les étapes. Vérifiez que la résolution correspond à la résolution native du modèle
Doigts/membres en trop	Ajoutez `extra fingers, extra limbs` au prompt négatif. Ou utilisez ControlNet
Couleurs sursaturées	Baissez le CFG. Passez à DPM++ 2M Karras
La composition est mauvaise	Utilisez ControlNet (depth, canny, pose) au lieu de vous battre avec le prompt
La génération est lente	Utilisez un modèle Lightning, réduisez les étapes, utilisez ComfyUI pour une meilleure VRAM
Manque de VRAM	Passez à ComfyUI, réduisez la taille du batch, utilisez fp16

Références

1. Flux 2 and NVIDIA RTX AI Integration -- Article NVIDIA sur Flux 2 avec ComfyUI.
2. Stability AI Release Notes -- Dépréciation de SD 3.0 et sortie de 3.5.
3. SDXL-Lightning by ByteDance -- Génération en 2 à 8 étapes à 1024 px.
4. ComfyUI vs Automatic1111 2026 Comparison -- Comparaison des performances et des fonctionnalités.
5. How to Use Negative Prompts Effectively -- Guide mis à jour sur la philosophie des prompts négatifs minimaux.
6. Understanding Stable Diffusion Samplers -- Guide de comparaison et de sélection des samplers.
7. Best Stable Diffusion Models for 2026 -- Panorama actuel des modèles.