
यदि आप वीएफएक्स में काम करते हैं और अपने जेनरेटिव इमेज वर्कफ़्लो को अगले स्तर तक ले जाने के लिए उत्सुक हैं, तो कॉम्फीयूआई आपके लिए जरूरी है। इसका नोड-आधारित दृष्टिकोण, मॉड्यूलरिटी, और FLUX द्वारा जोड़ी गई शक्ति यह इसे उच्च-निष्ठा वाले टेक्स्ट2आईएमजी से लेकर कंट्रोलनेट, आईपी-एडेप्टर या लोरा प्रशिक्षण के साथ जटिल पाइपलाइनों तक सब कुछ तलाशने के लिए एक आदर्श वातावरण बनाता है। VFX के लिए ComfyUI: इंस्टॉलेशन और FLUX वर्कफ़्लो की व्याख्या.
इस गाइड में आपको व्यवस्थित तरीके से वह सब कुछ मिलेगा जिसकी आपको आवश्यकता है: ComfyUI में वर्कफ़्लो क्या है, इसे कैसे सेव और शेयर करें, FLUX को चरण दर चरण कैसे इंस्टॉल करें, आपको किस हार्डवेयर की आवश्यकता है, और सबसे अधिक उपयोग किए जाने वाले फ्लो (Txt2Img, Img2Img, Inpainting, LoRA, ControlNet, NF4, IPAdapter और लेटेंट स्केलिंग) का स्पष्ट विवरण। आपको VRAM कम करने के लिए FP8, NF4, या GGUF जैसे विकल्प भी दिखाई देंगेक्लाउड में फ्लक्स का उपयोग करने के लिए संसाधन, तथा व्यावहारिक सुझावों के साथ विंडोज-अनुकूलित कॉम्फीयूआई इंस्टॉलेशन।
ComfyUI में वर्कफ़्लो क्या है?
वर्कफ़्लो, निर्माण प्रक्रिया का दृश्य प्रतिनिधित्व है जिसे आप नोड्स को जोड़कर बनाते हैं। आप इसकी कल्पना लेगो-प्रकार के टुकड़ों के बोर्ड के रूप में कर सकते हैंप्रत्येक नोड एक कार्य करता है (मॉडल लोड करना, पाठ को कोड करना, नमूना लेना, डिकोड करना, आदि) और कनेक्शन उस पथ का वर्णन करते हैं जिस पर जानकारी अंतिम छवि प्राप्त होने तक चलती है।
पारिस्थितिकी तंत्र बहुत बड़ा है: स्थिर छवि, वीडियो, ऑडियो और यहां तक कि 3D ओपन-सोर्स समुदाय की बदौलत ये दोनों एक साथ मौजूद हैं। इसका नकारात्मक पक्ष यह है कि इसमें सीखने की प्रक्रिया होती है, क्योंकि यह समझना ज़रूरी है कि प्रत्येक घटक क्या करता है और रुकावटों या असंगत परिणामों से बचने के लिए उन्हें प्रभावी ढंग से कैसे संयोजित किया जाए।
शीघ्रता से आरंभ करने के लिए, आधिकारिक और बुनियादी प्रवाह (text2img और img2img) को देखना और फिर अधिक जटिल नोड्स पर जाना सबसे अच्छा है। सामुदायिक दस्तावेज़ीकरण और आधिकारिक ComfyUI उदाहरण इन्हें अक्सर अद्यतन किया जाता है, इसलिए नए संस्करणों के साथ बदलने वाले वर्कफ़्लो को फिर से शुरू करना या समीक्षा करना आसान होता है।
एक महत्वपूर्ण विवरण: ComfyUI वर्कफ़्लो को अंतिम छवि (PNG) में मेटाडेटा के रूप में एम्बेड कर सकता है। इससे आप केवल छवि साझा कर सकते हैं और संपूर्ण ग्राफ प्राप्त कर सकते हैं। इसे इंटरफ़ेस पर वापस खींचना।
वर्कफ़्लोज़ के साथ कैसे सीखें और प्रगति करें
मेरी सलाह है कि विकि-प्रकार के संसाधनों और सामुदायिक दीर्घाओं में प्रकाशित सरल उदाहरणों से शुरुआत करें। तार्किक क्रम इस प्रकार है: Txt2Img, Img2Img, और फिर ControlNet या LoRAजैसे-जैसे आप इनपुट, आउटपुट और प्लानर किस प्रकार सैंपलिंग को प्रभावित करते हैं, को समझेंगे, गाइड नोड्स, मास्क और अतिरिक्त स्थितियों को शामिल करना स्वाभाविक हो जाएगा।
यदि आप विभिन्न टोपोलॉजी देखना चाहते हैं, तो सार्वजनिक प्रवाहों के भंडार और पुनरुत्पादनीय उदाहरणों वाले पृष्ठ उपलब्ध हैं, जहां आप मेटाडेटा या .json फ़ाइलों के साथ चित्र डाउनलोड कर सकते हैं। पैरामीटर्स को आयात करना, उन्हें वैसे ही चलाना और फिर उनके माध्यम से पुनरावृति करना अच्छा अभ्यास है पूरे को तोड़े बिना प्रत्येक ब्लॉक के प्रभाव को समझना।
क्लाउड प्लेटफॉर्म पर आपको स्थानीय निर्भरताओं से संघर्ष किए बिना पाइपलाइन चलाने के लिए पूर्व-कॉन्फ़िगर किए गए वातावरण भी मिलेंगे। इसका लाभ यह है कि वे भारी नोड्स और मॉडलों को प्रीलोड करते हैंहालाँकि, यह सुनिश्चित करने के लिए कि परिणाम अपेक्षाओं के अनुरूप हैं, उपलब्ध संस्करणों और VRAM की जांच करना उचित है।
ComfyUI में वर्कफ़्लोज़ को सहेजना, आयात करना और निर्यात करना
ComfyUI दो मुख्य बचत विधियों का समर्थन करता है: मेटाडेटा (PNG) या JSON फ़ाइल वाली छवि ग्राफ़ का। पहला फ़ोरम में साझा करने के लिए सबसे सुविधाजनक है; दूसरा आपको फ़ाइल पर स्पष्ट नियंत्रण देता है, जो संस्करण निर्धारण के लिए उपयोगी है।
आयात करने के लिए, बस PNG या Json फ़ाइल को इंटरफ़ेस पर खींचें, या शॉर्टकट Ctrl (कमांड) + O का उपयोग करें। निर्यात करने के लिए, आप उत्पन्न छवि को सहेज सकते हैं या JSON के लिए निर्यात मेनू का उपयोग कर सकते हैं।यदि आप छवियों को संपीड़ित या स्थानांतरित करते हैं तो सावधान रहें: कुछ संपीड़न विधियां और कुछ चैनल मेटाडेटा को हटा देते हैं, जिसके कारण आप एम्बेडेड वर्कफ़्लो खो देंगे।
ComfyUI के निरंतर विकास के कारण, सभी पुरानी JSON फ़ाइलें नए संस्करणों में काम नहीं करतीं.यदि कुछ गलत हो जाए, तो प्रवाह को खोलें, अप्रचलित नोड्स को बदलें, या निर्भरताओं को उनके संगत संस्करण के साथ पुनः स्थापित करें; ComfyUI-Manager का उपयोग करने से गायब घटकों का पता लगाना और उनका समाधान करना बहुत तेज हो जाता है।
ComfyUI में FLUX: यह क्या है और यह क्यों महत्वपूर्ण है
FLUX.1 ब्लैक फॉरेस्ट लैब्स का एक मॉडल परिवार है जो उच्च-निष्ठा टेक्स्ट-टू-इमेज रूपांतरण पर केंद्रित है। लगभग 12 बिलियन मापदंडों के साथ इसकी हाइब्रिड वास्तुकला यह प्रॉम्प्ट के अनुपालन, जटिल दृश्यों को संभालने, तथा छवि के भीतर सुपाठ्य पाठ उत्पन्न करने के लिए अनुकूलित है, एक ऐसा कार्य जिसमें अन्य मॉडल प्रायः असफल हो जाते हैं।
दूसरा लाभ: इसकी बहुमुखी प्रतिभा। फोटोरियलिज़्म से लेकर कलात्मक शैलियों तकFLUX.1 अपनी दृश्य स्थिरता और बारीकियों के लिए जाना जाता है, जिसमें हाथों का रेंडरिंग भी शामिल है, जो जनरेटिव ग्राफ़िक्स का एक आम कमज़ोर पहलू है। इसमें कोई आश्चर्य की बात नहीं है कि इसकी तुलना स्टेबल डिफ्यूज़न या मिडजर्नी जैसे समाधानों से की जाती है, जो उपयोग में आसानी और गुणवत्ता के मामले में सबसे आगे हैं।
ब्लैक फॉरेस्ट लैब्स की स्थापना रॉबिन रोम्बाच ने की थी, जो स्टेबिलिटी एआई के मूल में काम करने वाले एक प्रमुख व्यक्ति थे। यदि आप प्रत्यक्ष रूप से देखना चाहते हैंइसकी आधिकारिक वेबसाइट है blackforestlabs.ai.
FLUX.1 तीन प्रकारों में वितरित किया जाता है: प्रो, देव और श्नेलप्रो व्यावसायिक वातावरण के लिए उच्चतम गुणवत्ता प्रदान करता है; डेव को उत्कृष्ट संतुलन के साथ गैर-व्यावसायिक उपयोग के लिए डिज़ाइन किया गया है; श्नेल गति और हल्केपन पर केंद्रित है, और अपाचे 2.0 लाइसेंस के तहत ओपन सोर्स है।
FLUX संस्करण के अनुसार हार्डवेयर आवश्यकताएँ
FLUX.1 Pro के लिए, यह अनुशंसित है 24 GB VRAM के साथ NVIDIA RTX 4090 प्रकार का GPU32 जीबी रैम और तेज़ एसएसडी। यह आउट-ऑफ-बॉक्सिंग से बचने के लिए FP16 का उपयोग करता है, और अधिकतम गुणवत्ता के लिए FP16 में टेक्स्ट एनकोडर का उपयोग करना सबसे अच्छा है।
FLUX.1 Dev में, एक 16 GB VRAM के साथ RTX 3080/3090 यह 16 जीबी रैम और लगभग 25 जीबी डिस्क स्पेस के साथ अच्छी तरह काम करता है। यह आपके GPU के आधार पर FP16 और कुछ मामलों में FP8 को भी सपोर्ट करता है।
FLUX.1 श्नेल के लिए, 12 GB VRAM के साथ RTX 3060/4060 8GB रैम और 15GB स्टोरेज पर्याप्त हैं। इसे स्पीड के लिए डिज़ाइन किया गया है, प्रो/डेवलपर संस्करणों की तुलना में परफॉर्मेंस में कुछ कमी की गई है।
यदि आपकी मेमोरी कम है, तो समुदाय FP8, NF4, या GGUF जैसे विकल्प प्रदान करता है। वे आवश्यक VRAM को बहुत कम कर देते हैं, प्रवाह के आधार पर 6 से 12 जीबी तक कॉन्फ़िगरेशन के साथ।
ComfyUI पर FLUX स्थापित करना: आवश्यक चरण
सबसे पहले, सुनिश्चित करें कि आप इसका उपयोग करते हैं ComfyUI का नवीनतम संस्करणFLUX एकीकरण के लिए नोड्स और सुविधाओं की आवश्यकता होती है जिन्हें अक्सर अद्यतन किया जाता है।
टेक्स्ट और CLIP एनकोडर डाउनलोड करें: क्लिप_एल.सेफटेन्सर्स और T5 XXL फ़ाइलों में से एक, t5xxl_fp16.safetensors (अगर आपके पास पर्याप्त VRAM/RAM है) या t5xxl_fp8_e4m3fn.safetensors (अगर आपका बजट कम है)। इन्हें ComfyUI/models/clip/ फ़ोल्डर में रखें। यदि आपने SD3 मीडियम का उपयोग किया है, तो हो सकता है कि आपके पास पहले से ही ये फ़ाइलें हों।.
VAE: डाउनलोड करें एई.सेफटेंसर और इसे ComfyUI/models/vae/ पर ले जाएँ। अगर आप इसे आसानी से ढूँढना चाहते हैं, तो इसका नाम बदलकर flux_ae.safetensors कर दें। यह VAE अंतिम डिकोडिंग में सुधार करता है और यह गुणवत्ता की कुंजी है।
UNET: इनमें से चुनें flux1-dev.safetensors या flux1-schnell.safetensors अपनी स्मृति के अनुसार, और इसे ComfyUI/models/unet/ में रखें। इसके साथ, आपके पास FLUX प्रवाह चलाने के लिए आधार होगा। स्थानीय स्तर पर.
ComfyUI में FLUX वर्कफ़्लो के लिए एक व्यावहारिक मार्गदर्शिका
FLUX के साथ Txt2Img
घटकों को लोड करके प्रारंभ करें: UNETLoader, DualCLIPLoader और VAELoaderCLIPTextEncode नोड आपके प्रॉम्प्ट को एनकोड करता है; EmptyLatentImage प्रारंभिक अव्यक्त छवि बनाता है; BasicGuider FLUX के UNET के साथ सशर्त तर्क को संयोजित करके प्रक्रिया का मार्गदर्शन करता है।
के साथ नमूना चुनें के-सैंपलरसेलेक्टयह RandomNoise के साथ नॉइज़ उत्पन्न करता है और BasicScheduler के साथ सिग्मा रैम्प को परिभाषित करता है। SamplerCustomAdvanced सब कुछ एकीकृत करता है: नॉइज़, गाइड, सैंपलर, सिग्मा और लेटेंट। अंततः, VAEDecode अव्यक्त सिग्नल को छवि में परिवर्तित कर देता है। और SaveImage के साथ आप परिणाम को सहेज सकते हैं।
Img2Img FLUX के साथ
पाइपलाइन एक प्रारंभिक छवि जोड़ती है: लोडइमेज + इमेजस्केल आकार समायोजित किया जाता है, और VAEEncode इसे अव्यक्त पर सेट करता है। प्रॉम्प्ट को CLIPTextEncode से एन्कोड किया जाता है और इसकी शक्ति को FluxGuidance से समायोजित किया जाता है। ModelSamplingFlux पुनर्स्थान और आयामों को नियंत्रित करता हैKSamplerSelect, RandomNoise, और BasicScheduler सैंपलिंग को संभालते हैं। SamplerCustomAdvanced कंडीशनल को इनपुट लेटेंट के साथ मर्ज करता है, और VAEDecode आउटपुट तैयार करता है।
फ्लक्स के साथ लोरा
शैली या सुविधाओं को परिष्कृत करने के लिए, जोड़ें लोरालोडरमॉडलओनली UNETLoader, DualCLIPLoader, और VAELoader के साथ। टेक्स्ट को एनकोड करने और FluxGuidance लागू करने के बाद, आप EmptyLatentImage के साथ लेटेंट इमेज बनाते हैं, ModelSamplingFlux के साथ सैंपलिंग परिभाषित करते हैं, और SamplerCustomAdvanced चलाते हैं। VAEDecode के साथ आपको पहले से ही LoRA से प्रभावित छवि मिलती है. विशिष्ट उदाहरण: flux1-dev पर realism_lora.safetensors.
FLUX के साथ कंट्रोलनेट
VFX के लिए दो बहुत उपयोगी मामले: गहराई और चतुर किनारे। गहराई के लिए, प्रीप्रोसेस करें MiDaS-डेप्थमैपप्रीप्रोसेसरडेप्थ कंट्रोलनेट लोड करें और इसे ApplyFluxControlNet के साथ लागू करें। सशर्त अव्यक्त तरंगरूप उत्पन्न करने के लिए XlabsSampler का उपयोग करें, और फिर VAEDecode छवि का उत्पादन करता है.
कैनी के लिए, उपयोग करें कैनीएजप्रीप्रोसेसर, कैनी कंट्रोलनेट लोड करें और योजना को दोहराएं: ApplyFluxControlNet → XlabsSampler → VAEDecode. यह अतिरिक्त नियंत्रण आकार और संरचना पर सटीकता प्रदान करता है।.
फ्लक्स के साथ इनपेंटिंग
UNET, VAE और CLIP लोड करें, तथा सकारात्मक और नकारात्मक संकेत तैयार करें। LoadAndResizeImage छवि और मास्क लाता हैImpactGaussianBlurMask की मदद से ट्रांज़िशन को सुचारू किया जाता है। InpaintModelConditioning कंडीशनिंग, इमेज और मास्क को एक साथ जोड़ता है। सैंपलर, नॉइज़ और सिग्मा को कॉन्फ़िगर करने के बाद, SamplerCustomAdvanced मास्क किए गए क्षेत्र का पुनर्निर्माण करता है। VAEDecode पैच को लगातार एकीकृत करता है बिना आराम किए।
फ्लक्स NF4
NF4 क्वांटाइजेशन से मेमोरी कम हो जाती है। घटकों को लोड करें चेकपॉइंटलोडरNF4 और आदिम नोड्स के साथ ऊँचाई/चौड़ाई परिभाषित करता है। ModelSamplingFlux पैरामीटर सेट करता है; EmptySD3LatentImage अव्यक्त छवि बनाता है; BasicScheduler और RandomNoise शोर को व्यवस्थित करते हैं। SamplerCustomAdvanced अव्यक्त संकेत उत्पन्न करता है और VAEDecode इसे एक छवि में अनुवादित करता है।स्केलिंग के लिए, अल्टीमेटएसडीअपस्केल, अपस्केलमॉडललोडर और एक अतिरिक्त सकारात्मक प्रॉम्प्ट के साथ, बहुत अंतर पैदा करता है।
FLUX के साथ IPadapter
जब आप संदर्भ छवि का उपयोग करके कंडीशन करना चाहते हैं, तो उपयोग करें लोडफ्लक्सआईपीएडाप्टर और अप्लाईफ्लक्सआईपीएडाप्टर clip_vision_l.safetensors के साथ। ImageScale की मदद से संदर्भ छवि को स्केल करें, प्रॉम्प्ट तैयार करें, और XlabsSampler चलाएँ। VAEDecode के साथ आप देखेंगे कि आउटपुट सौंदर्य या विशेषताओं से प्रभावित होता है गाइड छवि से.
FLUX के लिए LoRA ट्रेनर
ComfyUI में सीधे LoRA को प्रशिक्षित करने के लिए, कार्यप्रवाह में शामिल हैं: फ्लक्सट्रेनमॉडलसेलेक्ट, ऑप्टिमाइज़रकॉन्फ़िगरेशन और ट्रेनडेटासेटजनरलकॉन्फ़िगरेशनInitFluxLoRATraining आरंभ करता है, FluxTrainLoop चरणों को निष्पादित करता है, और FluxTrainValidate आवधिक सत्यापन उत्पन्न करता है।
VisualizeLoss के साथ आप नुकसान को ट्रैक करते हैं; ImageBatchMulti और ImageConcatFromBatch वे सत्यापनों को समूहीकृत करते हैं; FluxTrainSave चेकपॉइंट्स को सहेजता है, और FluxTrainEnd प्रक्रिया को बंद कर देता है। यदि आप चाहें, तो UploadToHuggingFace के साथ परिणाम को Hugging Face पर अपलोड करें और साझा करें।
फ्लक्स लेटेंट अपस्केलर
विस्तार से मापने के लिए, आकार को परिभाषित करें SDXLEmptyLatentSizePicker+ और लेटेंटअपस्केल और लेटेंटक्रॉप को श्रृंखलाबद्ध करता है। सॉलिडमास्क और फेदरमास्क द्वारा बनाए गए मास्क के साथ, लेटेंटकंपोज़िटमास्क्ड स्केल किए गए लेटेंट को मूल के साथ मिश्रित करता है। InjectLatentNoise+ VAEDecode से पहले विवरण को बढ़ाता हैऔर ImageSmartSharpen+ के साथ टच-अप करने से यह प्रक्रिया पूरी हो जाती है। SimpleMath+ जैसे कैलकुलेशन नोड्स अनुपातों को संरेखित करने में मदद करते हैं।
वैकल्पिक संस्करण: VRAM को कम करने के लिए FP8, NF4 और GGUF
अगर आपके पास संसाधन कम हैं, तो आपके पास विकल्प हैं। Comfy.org के FP8 चेकपॉइंट और Kijai जैसे लेखक। आपको एकल फ़ाइल के साथ FLUX का उपयोग करने की अनुमति देता है ComfyUI/models/checkpoints/ में। dev और schnell वेरिएंट के बीच अंतर करने के लिए नाम बदलने या फ़ोल्डरों में अलग करने की सलाह दी जाती है।
NF4 (bitsandbytes) के साथ, प्लगइन स्थापित करें ComfyUI_bitsandbytes_NF4 और उपयोग करें फ्लक्स1-देव-बीएनबी-एनएफ4-वी2 मॉडल/चेकपॉइंट में। यह संस्करण पहले संस्करण की तुलना में विवरणों में सुधार करता है।
सिटी96 का GGUF क्वांटाइजेशन, प्लगइन के साथ कॉम्फीयूआई-जीजीयूएफइससे मानक और भी नीचे चला जाता है: FLUX GGUF मॉडल, t5-v1_1-xxl-encoder-gguf एनकोडर डाउनलोड करें`clip_l.safetensors` और `ae.safetensors` फ़ाइलों को उनके संबंधित फ़ोल्डरों में रखा जाना चाहिए। 6 GB VRAM के साथ सुविधाजनक उपयोग के मामले हैं।
क्लाउड और अन्य संसाधनों में FLUX.1 का उपयोग करना
यदि आप कुछ भी इंस्टॉल नहीं करना चाहते हैं, तो आप FLUX को आज़मा सकते हैं हगिंग फेस स्पेस: फ्लक्स.1-देव y फ्लक्स.1-schnell। मे भी दोहराने, मिस्टिक.एआई o fal.ai. ये प्रॉम्प्ट और कॉन्फ़िगरेशन को मान्य करने के लिए उपयोगी विकल्प हैं स्थानीय मॉडल डाउनलोड करने से पहले.
प्रेरणा और तैयार वर्कफ़्लो के लिए, देखें ComfyUI के आधिकारिक उदाहरण और वर्कफ़्लो गैलरी जैसे ओपनआर्ट. याद रखें कि कई छवियों में मेटाडेटा होता हैताकि आप ग्राफ को पुनः प्राप्त करने के लिए उन्हें ComfyUI में खींच सकें।
अधिक सामग्री: का संग्रह फ्लक्स के लिए लोरा जैसा यथार्थवादलोरा या संकलन में एक्सलैब्स-एआईFLUX के लिए ControlNet संग्रह y संघ; आईपी-एडाप्टर en एक्सलैब्स-एआईकम VRAM के साथ LoRA को प्रशिक्षित करने के लिए, प्रयास करें फ्लक्सजिम या ऑस्ट्रिस से रेप्लिकेट ट्रेनर; FLUX.1 डेवलपर के लिए एक ड्रीमबूथ गाइड है डिफ्यूज़र रेपो में.
Windows 11 पर बेहतरीन प्रदर्शन के साथ ComfyUI इंस्टॉल करें
यदि आप स्वच्छ स्थापना चाहते हैं, तो यह एक सिद्ध तरीका है। यह NVIDIA 40/50 श्रृंखला कार्ड के साथ बहुत अच्छी तरह से काम करता है और यह आपको सामान्य गलतियों से बचने में मदद करता है।
1) NVIDIA ऐप और स्टूडियो ड्राइवर को यहां से इंस्टॉल करें एनवीडिया.कॉम. पुनः आरंभ करें. 2) CUDA टूलकिट से डेवलपर.nvidia.com (वैकल्पिक लेकिन यदि आप वेनव का उपयोग नहीं करते हैं तो ट्राइटन के साथ अलर्ट से बचने के लिए उपयोगी है)। 3) एफएफएमपीईजी BtbN रिपॉजिटरी से, पथ में C:\ffmpeg\bin जोड़ें। 4) Windows के लिए Git git-scm.com5) पायथन 3.12 x64 से Python.org, सभी उपयोगकर्ताओं के लिए py लांचर के साथ और पर्यावरण चर में जोड़ें।
5.5) यदि आप venv चुनते हैं, तो इसे बनाएं पायथन -m वेनव CUVenv और इसे CUVenv\Scripts\activate.bat के साथ सक्रिय करें। वहाँ से, venv के भीतर कोई भी प्रासंगिक pip या git कमांड चलाएँ। आपकी स्टार्टअप स्क्रिप्ट वातावरण को सक्रिय कर सकती है और ComfyUI चला सकती है एक ही बार में।
6) ComfyUI को क्लोन करें गिट क्लोन https://github.com/comfyanonymous/ComfyUI.git D:\CU7) D:\CU पर जाएं और pip install -r requirements.txt चलाएं। 8) यदि pip पथ के बाहर स्क्रिप्ट की चेतावनी देता है, तो सिस्टम वैरिएबल में पायथन स्क्रिप्ट पथ जोड़ें और पुनः आरंभ करें। 9) PyTorch CUDA 12.8 स्थापित करें `pip install torchvision torchaudio --index-url https://download.pytorch.org/whl/cu128` का उपयोग करके टॉर्च इंस्टॉल करें। अगर कुछ भी गड़बड़ लगे, तो टॉर्च को अनइंस्टॉल करें और उसी कमांड का उपयोग करके उसे फिर से इंस्टॉल करें।
9 bis) ComfyUI को लॉन्च करें पायथन main.py और 127.0.0.1:8188 खोलें। 10) pip install -U triton-windows के साथ विंडोज के लिए ट्राइटन स्थापित करें। 11) सेज अटेंशन 2.2 के साथ ध्यान की गति बढ़ाएं: CP312 के लिए संगत व्हील CU128/Torch2.8 डाउनलोड करें, इसे pip के साथ स्थापित करें और –use-sage-attention ध्वज के साथ ComfyUI प्रारंभ करें।
12) ComfyUI-Manager स्थापित करें: ComfyUI/custom_nodes में चलाएँ git क्लोन https://github.com/ltdrdata/ComfyUI-Manager comfyui-manager13) इन पंक्तियों के साथ एक बूट .bat फ़ाइल बनाएं: cd D:\CU और python main.py –use-sage-attention. आरंभ करते समय, मैनेजर को पहली बार में थोड़ा समय लगेगा।; जांचें कि इंटरफ़ेस में प्रबंधक टैब दिखाई देता है।
14) टेम्पलेट्स को सही फ़ोल्डरों (चेकपॉइंट्स, क्लिप, यूनेट, वीएई) में रखें और अपने प्रवाह खोलें। यदि कोई वर्कफ़्लो अपना स्वयं का सेज नोड लाता है, तो आप उसे छोड़ सकते हैं यदि आप पहले से ही ध्वज के साथ शुरू कर रहे हैंसुझाव: संसाधन-गहन प्रोग्राम खोलने से बचें, अगर आपकी मेमोरी कम चल रही है तो विंडोज़ वर्चुअल मेमोरी कॉन्फ़िगर करें, और ComfyUI रिपॉजिटरी में प्रदर्शन चर्चाएँ देखें। अगर आपको मेमोरी चेतावनियाँ मिलती हैं, तो सिंगल-फ़ाइल FP8 संस्करण का उपयोग करने पर विचार करें।
यदि आप डाउनलोड करने योग्य मैनुअल चाहते हैं, तो यहां एक उपयोगी पीडीएफ उपलब्ध है इस लिंक. स्थापना को सरल बनाने और वेनव का प्रस्ताव करने के लिए कुछ गाइडों को संशोधित किया गया हैवेनव का उपयोग करते समय, हमेशा वातावरण में पाइप और गिट चलाना याद रखें।
उपयोग संबंधी सुझाव, अनुकूलता और सर्वोत्तम अभ्यास
मेटाडेटा या JSON के साथ PNGs को खींचकर प्रवाह आयात करें और प्रबंधक के साथ नोड संस्करण की जांच करें। छवियाँ साझा करते समय, मेटाडेटा को हटाने वाले संपीड़न से बचें।यदि JSON नए संस्करण में टूट जाता है, तो अप्रचलित नोड्स को बदलें या संगत संस्करण स्थापित करें।
कई FLUX LoRAs के साथ काम करने के लिए, हाल ही में ComfyUI बिल्ड में उच्च बिजली की खपत की रिपोर्टें हैं; GGUF या विशिष्ट लोडर का परीक्षण करें VRAM को न्यूनतम करने के लिए। ControlNet में, एक स्थिर कंपोज़िटिंग रिग स्थापित करने के लिए डेप्थ या कैनी से शुरुआत करें।
क्लाउड पर तैनाती करते समय, VRAM और निष्पादन कतारों की जांच करें। स्थानीय स्तर पर, एक तेज़ एसएसडी और अद्यतन ड्राइवर ही सब कुछ बदल देते हैं।अपनी पाइपलाइन को खंडों में प्रलेखित करें: मॉडल लोडिंग, कंडीशनिंग, सैंपलिंग, डिकोडिंग और पोस्ट-प्रोसेसिंग। इससे किसी भी खराबी की स्थिति में डिबगिंग आसान हो जाएगी।
उपरोक्त सभी के साथ, अब आप ComfyUI के साथ वास्तव में मजबूत VFX पाइपलाइन का निर्माण कर सकते हैं: क्या आप समझते हैं कि वर्कफ़्लो क्या है और मेटाडेटा खोए बिना इसे कैसे सहेजा जाए?आप FLUX और इसके वेरिएंट (Dev, Schnell और FP8, NF4, GGUF विकल्प) को इंस्टॉल कर सकते हैं, आप जानते हैं कि दैनिक अभ्यास के प्रमुख वर्कफ़्लोज़ (Txt2Img, Img2Img, Inpainting, ControlNet, LoRA, IPAdapter और Upscale) को कैसे चलाया जाए और आपके पास सिस्टम को ठीक, स्थिर और तेज़ रखने के लिए Triton, Sage Attention और ComfyUI-Manager के साथ एक अनुकूलित Windows इंस्टॉलेशन है।





