Mis à jour en mars 2026. La version originale de cet aide-mémoire a été écrite pour SD 1.5 en mai 2023. Presque tout a changé depuis -- nouvelles architectures (SDXL, SD 3.5, Flux), nouvelles interfaces (ComfyUI), nouveau matériel (RTX 5090) et renversement complet de la philosophie des prompts négatifs. Voici la version actuelle.
Ceci est ma référence de travail pour les paramètres de Stable Diffusion. Pas un tutoriel -- seulement les réglages que je vais chercher quand quelque chose ne marche pas ou quand je veux pousser la qualité.
Quel modèle utiliser
C'est maintenant la première décision, et elle compte plus que n'importe quel ajustement de paramètre.
| Modèle | Idéal pour | Résolution | Notes |
|---|---|---|---|
| Flux 2 | Photoréalisme, respect du prompt | 1024x1024+ | Meilleur modèle open-weight pour le photoréalisme en 2026. Intégré à Adobe Photoshop [1] |
| SDXL | Usage général | 1024x1024 | Énorme écosystème de fine-tunes. Juggernaut XL, Realistic Vision, DreamShaper |
| SD 3.5 Large | Qualité maximale (le fleuron de Stability) | 1024x1024 | Architecture MMDiT. SD 3.0 a été déprécié en avril 2025 [2] |
| SDXL Lightning | Vitesse | 1024x1024 | Génération en 2 à 8 étapes. Meilleure qualité que Turbo à haute résolution [3] |
| SD 1.5 | Workflows hérités | 512x512 | Immense bibliothèque de fine-tunes, mais en voie d'abandon. SD 2.0/2.1 officiellement dépréciés |
Si vous repartez de zéro : Flux 2 pour le photoréalisme, SDXL pour tout le reste. SD 3.5 est bon, mais son écosystème est plus petit.
Quelle interface utiliser
| Interface | Idéale pour |
|---|---|
| ComfyUI | Utilisateurs avancés. Basée sur des nœuds, meilleure gestion de la VRAM, 15 % plus rapide, meilleur support de Flux. Standard industriel pour le travail sérieux depuis 2025 [4] |
| Automatic1111 | Débutants. Interface plus simple, immense bibliothèque d'extensions. Fonctionne encore très bien pour SDXL |
| Fooocus | Génération en un clic. Configuration minimale. Bien pour des résultats rapides |
J'utilise ComfyUI. La courbe d'apprentissage est plus raide (comptez 10 à 20 heures pour être à l'aise), mais la gestion de la VRAM vaut à elle seule l'effort -- il fait tourner SDXL sur 8 Go là où A1111 plante.
Samplers
Le débat sur les samplers est plus ou moins réglé.
Choix par défaut :
- DPM++ 2M Karras -- meilleur rapport vitesse/qualité. C'est mon choix par défaut pour presque tout.
- DPM++ SDE Karras -- légèrement meilleur avec peu d'étapes. Bon quand vous itérez vite.
- Euler a -- toujours fiable. Plus de variété dans les sorties, utile pour explorer.
Quand changer :
- Manque de diversité dans les sorties ? Essayez DPM++ SDE ou Euler a.
- Artefacts ou sursaturation ? Essayez DPM++ 2M Karras ou Euler simple.
- Besoin de vitesse avant tout ? Euler a ou DPM++ 2M (non-Karras).
- Vous voulez la qualité maximale ? DPM++ 3M SDE Karras ou UniPC.
Nombre d'étapes : 20 à 30 étapes pour la plupart des samplers. Les modèles Lightning n'en demandent que 2 à 8.
CFG (Classifier Free Guidance)
À quel point le modèle suit strictement votre prompt plutôt que sa propre interprétation.
| Plage | Effet |
|---|---|
| 1-4 | Très créatif, interprétation lâche. Souvent incohérent |
| 5-7 | Bon équilibre pour la plupart des travaux |
| 7-10 | Forte adhérence au prompt. Zone idéale pour le photoréalisme avec SDXL |
| 10-15 | Risque d'artefacts et de couleurs trop cuites |
| 15+ | Presque toujours trop. Artefacts garantis |
Note : SD 3.5 utilise un mécanisme de guidance différent. Le concept de CFG s'applique encore, mais l'échelle se comporte autrement -- commencez plus bas (3-5) et ajustez.
Résolution
L'époque du 512x512 est finie.
| Modèle | Résolution native | Plage pratique |
|---|---|---|
| SD 1.5 | 512x512 | 512x512 à 768x768 |
| SDXL | 1024x1024 | 1024x1024 (standard), 1024x768, 768x1024 |
| SD 3.5 | 1024x1024 | 1024x1024+ |
| Flux | 1024x1024 | 1024x1024+, 4K possible sur GPU haut de gamme |
Dépasser la résolution native risque de produire des artefacts et des problèmes de composition. Utilisez plutôt hi-res fix ou l'upscaling au lieu de générer directement en 2048x2048.
Clip Skip
Moins pertinent qu'avant.
- SD 1.5 : Clip skip 1-2 compte beaucoup. Les modèles anime utilisent souvent clip skip 2.
- SDXL : Utilise deux encodeurs de texte (CLIP + OpenCLIP). Clip skip est largement ignoré -- l'architecture le gère différemment.
- SD 3.5 / Flux : Pas applicable de la même manière. Ces modèles utilisent un encodage de texte basé sur des transformers.
Si vous êtes sur SDXL ou plus récent : ne vous préoccupez pas de clip skip. Si vous êtes sur SD 1.5 : gardez-le à 1 pour le photoréalisme, 2 pour l'anime.
Prompts négatifs
La philosophie s'est retournée. En 2023, le conseil était d'utiliser de longues listes de prompts négatifs. En 2026, le consensus est : commencez sans rien et n'ajoutez que ce dont vous avez besoin pour corriger.
Pourquoi ce changement :
- SDXL et Flux comprennent le langage naturel bien mieux que SD 1.5
- Les longs prompts négatifs peuvent en fait restreindre la créativité et produire de moins bons résultats
- "bad anatomy" est trop vague pour être utile. "ugly" ne fonctionne pas parce que SD n'a pas été entraîné sur des images étiquetées "ugly"
- Certains modèles donnent des résultats nettement pires avec de longs négatifs [5]
Approche actuelle :
- Générez d'abord sans aucun prompt négatif.
- Si vous voyez un problème précis (doigts en trop, arrière-plan flou), ajoutez un négatif ciblé pour celui-ci.
- Utilisez la pondération d'emphase :
(blurry:1.3)au lieu de simplementblurry. - Gardez-le court -- 5 à 10 termes au maximum.
Référence rapide GPU
| GPU | VRAM | Bien pour |
|---|---|---|
| RTX 3060 12GB | 12GB | SD 1.5, SDXL de base |
| RTX 4070 Ti | 12GB | SDXL, un peu de Flux |
| RTX 4090 | 24GB | Tout. La machine de travail |
| RTX 5090 | 32GB | Tout, y compris la 4K et la génération par lots |
| Cartes 8GB | 8GB | Minimum viable. ComfyUI aide à gérer la VRAM |
Le seuil des 24 Go est celui où les choses deviennent confortables pour SDXL et Flux sans jongler constamment avec la VRAM.
Correctifs rapides de dépannage
| Problème | À essayer |
|---|---|
| Sortie floue | Augmentez les étapes. Vérifiez que la résolution correspond à la résolution native du modèle |
| Doigts/membres en trop | Ajoutez extra fingers, extra limbs au prompt négatif. Ou utilisez ControlNet |
| Couleurs sursaturées | Baissez le CFG. Passez à DPM++ 2M Karras |
| La composition est mauvaise | Utilisez ControlNet (depth, canny, pose) au lieu de vous battre avec le prompt |
| La génération est lente | Utilisez un modèle Lightning, réduisez les étapes, utilisez ComfyUI pour une meilleure VRAM |
| Manque de VRAM | Passez à ComfyUI, réduisez la taille du batch, utilisez fp16 |
Références
1. Flux 2 and NVIDIA RTX AI Integration -- Article NVIDIA sur Flux 2 avec ComfyUI.
2. Stability AI Release Notes -- Dépréciation de SD 3.0 et sortie de 3.5.
3. SDXL-Lightning by ByteDance -- Génération en 2 à 8 étapes à 1024 px.
4. ComfyUI vs Automatic1111 2026 Comparison -- Comparaison des performances et des fonctionnalités.
5. How to Use Negative Prompts Effectively -- Guide mis à jour sur la philosophie des prompts négatifs minimaux.
6. Understanding Stable Diffusion Samplers -- Guide de comparaison et de sélection des samplers.
7. Best Stable Diffusion Models for 2026 -- Panorama actuel des modèles.
Articles liés
- Stable Diffusion Photorealism: Settings & GPU Limits Guide -- analyse approfondie pour obtenir des résultats photoréalistes avec les modèles actuels.

Commentaires