विज़ुअल इफेक्ट्स के लिए ComfyUI ट्यूटोरियल: चरण-दर-चरण मार्गदर्शिका

  • कॉम्फीयूआई छवि और वीडियो दोनों के लिए एसडी, कंट्रोलनेट, लोरा और एसडीएक्सएल के साथ वीएफएक्स के लिए ग्रैन्युलर नोड-स्तरीय नियंत्रण प्रदान करता है।
  • एनिमेटडिफ, हुनयुआनवीडियो, एलटीएक्स वीडियो और वान 2.1 सुचारू और सुसंगत क्लिप बनाने के लिए पारिस्थितिकी तंत्र का विस्तार करते हैं।
  • प्रशासक नोड्स को स्थापित/अद्यतन करना तथा सही मॉडल और निर्भरताओं के साथ पुनरुत्पादनीय प्रवाह को बनाए रखना आसान बनाता है।
  • क्लाउड विकल्प हार्डवेयर बाधाओं को कम करते हैं; स्थानीय विकल्प अधिकतम नियंत्रण और विस्तृत प्रोटोटाइपिंग प्रदान करते हैं।

आरामदायकयूआई

यदि आप बिना नियंत्रण खोए एआई-संचालित छवि और वीडियो निर्माण में पूरी तरह से उतरना चाहते हैं, तो आप सही जगह पर आए हैं: कॉम्फीयूआई एक नोड-आधारित इंटरफ़ेस है जो आपको लेगो ईंटों की तरह अपनी स्वयं की पाइपलाइन बनाने की सुविधा देता है। इस गाइड में आप शुरू से लेकर विस्तार से सीखेंगे कि ComfyUI में विज़ुअल इफेक्ट्स (VFX) वर्कफ़्लो कैसे सेट करें।, छवि और वीडियो दोनों के लिए, कुछ भी महत्वपूर्ण छूटे बिना।

मूल बातों के अतिरिक्त, हम टेक्स्ट-टू-इमेज प्रवाह, इमेज-टू-इमेज प्रवाह, इनपेंटिंग, आउटपेंटिंग, स्केलिंग, कंट्रोलनेट, एसडीएक्सएल, लोरा और एम्बेडिंग पर भी नजर डालेंगे। हम एनिमेटडिफ, हुनयुआनवीडियो, एलटीएक्स वीडियो और वान 2.1 के साथ वीडियो की ओर कदम बढ़ाएंगेइसमें आवश्यकताएँ, इंस्टॉलेशन, प्रमुख पैरामीटर, और शॉर्टकट व नोड मैनेजर के साथ उत्पादकता संबंधी सुझाव शामिल हैं। अगर आप जटिल इंस्टॉलेशन से बचना चाहते हैं, तो हम क्लाउड विकल्पों पर भी चर्चा करेंगे।

कॉम्फीयूआई क्या है और यह वीएफएक्स के लिए आदर्श क्यों है?

कॉम्फीयूआई स्थिर प्रसार के लिए एक नोड-आधारित जीयूआई है जो आपको शुरू से अंत तक डेटा प्रवाह को देखने और संशोधित करने की सुविधा देता है। प्रत्येक नोड एक विशिष्ट कार्य करता है (मॉडल लोड करना, टेक्स्ट को कोड करना, सैंपलिंग करना, VAE को डिकोड करना, आदि) और केबलों से जुड़ा होता है जो इनपुट और आउटपुट को दर्शाते हैं। यह दर्शन VFX के लिए एकदम सही है: आपको ठीक-ठीक पता होता है कि सिग्नल कहाँ से आता है, कहाँ रूपांतरित होता है, और परिणाम को कैसे प्रभावित करना है।

मोनोलिथिक इंटरफेस की तुलना में, कॉम्फीयूआई अपनी पारदर्शिता और लचीलेपन के लिए अलग है। इस स्वतंत्रता की कीमत है अधिक तीव्र शिक्षण प्रक्रिया और कुछ दृश्य विकर्षण। (प्रत्येक वर्कफ़्लो को अलग-अलग तरीके से तैयार किया जा सकता है), लेकिन इसका पुरस्कार यह है कि आप शीघ्रता से प्रोटोटाइप बना सकते हैं, सटीक रूप से डीबग कर सकते हैं, तथा वर्कफ़्लो को पुनरुत्पादनीय तरीके से साझा कर सकते हैं।

ComfyUI बनाम AUTOMATIC1111

कई उपयोगकर्ता AUTOMATIC1111 का उपयोग करते हैं, जो स्थिर प्रसार के लिए क्लासिक है। ComfyUI में हल्कापन, पारदर्शिता और प्रोटोटाइपिंग क्षमताएं बढ़ी हैंA1111 ज़्यादा एकरूप और सीधा लगता है, लेकिन कम बारीक। अगर आप अंदरूनी कार्यप्रणाली को समझना चाहते हैं और VFX का पूरा फ़ायदा उठाना चाहते हैं, तो ComfyUI एक सुरक्षित विकल्प है।

प्रारंभिक चरण और बुनियादी नियंत्रण

कैनवास के साथ इंटरैक्ट करना सरल है: व्हील या पिंच जेस्चर के साथ ज़ूम करें, स्थानांतरित करने के लिए खींचें, और एक नोड के आउटपुट से दूसरे के इनपुट तक खींचकर कनेक्शन बनाएं। आपको लोड चेकपॉइंट, CLIP टेक्स्ट एनकोड, KSampler या VAE जैसे ब्लॉक (नोड्स) दिखाई देंगे, और केबल जो डेटा पथ का प्रतिनिधित्व करते हैं।

पाठ से छवि: आधारभूत प्रवाह और आवश्यक नोड्स

मानक पाइपलाइन में चेकपॉइंट लोड करना, प्रॉम्प्ट को एनकोड करना, लेटेंट में सैंपलिंग करना और पिक्सल में डिकोडिंग करना शामिल है। यह वह ढांचा है जिस पर ComfyUI में लगभग सब कुछ बनाया गया है।.

लोड चेकपॉइंट के साथ मॉडल चयन

लोड चेकपॉइंट नोड तीन भागों को प्रदान करता है: मॉडल (शोर पूर्वानुमान नेटवर्क), क्लिप (टेक्स्ट एनकोडर) और वीएई (पिक्सेल से लेटेंट तक और इसके विपरीत जाने के लिए)। MODEL, KSampler को फीड करता है, CLIP टेक्स्ट नोड्स पर जाता है, तथा VAE का उपयोग अंतिम परिणाम को डिकोड करने के लिए किया जाता है।चेकपॉइंट के बिना कोई गेम नहीं है, इसलिए ऐसा चेकपॉइंट चुनें जो आपके वर्कफ़्लो के अनुकूल हो।

CLIP टेक्स्ट एनकोड के साथ सकारात्मक और नकारात्मक संकेत

दो CLIP टेक्स्ट एनकोड नोड्स का उपयोग करें: सबसे ऊपर वाला नोड्स सकारात्मक के लिए और सबसे नीचे वाला नोड्स नकारात्मक के लिए। पाठ को उच्च-रिज़ॉल्यूशन एम्बेडिंग में परिवर्तित किया जाता है जो प्रसार का मार्गदर्शन करता हैआप अवधारणाओं को अधिक या कम महत्व देने के लिए वाक्यविन्यास (शब्द:1.2) के साथ शब्दों को महत्व दे सकते हैं।

के-सैंपलर निर्माण और पैरामीटर

के-सैंपलर

जब आप इसे कतार (क्यू प्रॉम्प्ट) में डालेंगे तो नमूनाकरण शुरू हो जाएगा। के-सैम्पलर बीज, चरण, सैम्पलर, अनुसूचक और शोर-निरोध क्षमता को नियंत्रित करता हैएक निश्चित बीज पुनरुत्पादन क्षमता प्रदान करता है; अधिक चरण आमतौर पर विवरण में सुधार करते हैं (समय की कीमत पर); text2img में denoise=1 पूर्ण शोर हटाने की प्रक्रिया को लागू करता है।

खाली अव्यक्त छवि: रिज़ॉल्यूशन और बैच

खाली अव्यक्त छवि नोड प्रारंभिक अव्यक्त कैनवास बनाता है। ऊँचाई और चौड़ाई 8 के गुणज में होनी चाहिएसामान्य आकार: SD 1.5 के लिए 512/768 और SDXL के लिए 1024। यदि आप प्रति रन एकाधिक छवियाँ चाहते हैं, तो बैच आकार समायोजित करें।

VAE: संपीड़न और पुनर्निर्माण

VAE पिक्सेल और लेटेंट के बीच एनकोड और डिकोड करता है। यह कुछ हानि या कलाकृतियों के बदले में दक्षता और हेरफेर योग्य अव्यक्त स्थान प्रदान करता है।text2img में, आप इसका उपयोग मुख्य रूप से अंत में (VAE डिकोड) पिक्सेल में छवि प्राप्त करने के लिए करेंगे।

छवि से छवि, SDXL और इनपेंटिंग/आउटपेंटिंग

छवि दर छवि

यह वर्कफ़्लो एक प्रॉम्प्ट और एक आधार छवि को जोड़ता है। चेकपॉइंट चुनें, छवि लोड करें, संकेतों की समीक्षा करें, और शोर कम करने की सुविधा समायोजित करें के-सैम्पलर में यह तय करने के लिए कि आप मूल से कितनी दूर हैं (कम शोर = स्रोत के अधिक समान)।

ComfyUI पर SDXL

ComfyUI अपनी मॉड्यूलरिटी के कारण SDXL का शीघ्र और कुशलतापूर्वक समर्थन करता है। सकारात्मक/नकारात्मक संकेत तैयार करें और उचित नमूना के साथ प्रक्रिया शुरू करें; अव्यक्त का इष्टतम रिज़ॉल्यूशन याद रखें (आमतौर पर 1024)।

इनपेंटिंग

विशिष्ट क्षेत्रों को संशोधित करने के लिए, छवि लोड करें, मास्क संपादक खोलें, और मास्क को नोड में सहेजें। यह वर्कफ़्लो मानक मॉडल का उपयोग करता है; यदि आप "इनपेंटिंग" चेकपॉइंट का उपयोग करते हैं, तो VAE एनकोड (इनपेंट) का उपयोग करें। मानक VAE एनकोड और सेट नॉइज़ लेटेंट मास्क नोड्स के स्थान पर, यह परिवर्तन का वर्णन करने के लिए प्रॉम्प्ट और एक विशिष्ट डीनॉइज़ शक्ति जैसे 0.6 सेट करता है।

आउटपेंटिंग

आउटपेंटिंग के लिए पैड इमेज के साथ छवि सीमाओं से परे विस्तार करें: सुचारू संक्रमण के लिए बाएं/ऊपर/दाएं/नीचे और पंख नियंत्रण करें। VAE एनकोड में (इनपेंटिंग के लिए) grow_mask_by समायोजित करें (बेहतर >10) अधिक प्राकृतिक और अच्छी तरह से एकीकृत भराई प्राप्त करने के लिए।

स्केलिंग: पिक्सेल बनाम लेटेंट

पिक्सेल अपस्केल

अपस्केल पिक्सेल

दो तरीके: अपस्केल इमेज के साथ एल्गोरिदम (बाइक्यूबिक, बिलिनियर, निकटतम-सटीक) द्वारा, या लोड अपस्केल मॉडल + अपस्केल इमेज (मॉडल का उपयोग करके) के साथ मॉडल द्वारा। एल्गोरिदम तेज़ हैं लेकिन कम परिष्कृत हैं; मॉडल अधिक समय लेते हैं और आमतौर पर बेहतर विवरण प्रदान करते हैंऔर आप सैर-सपाटे को एक साथ जोड़ सकते हैं After Effects के लिए 50 इफेक्ट्स का पैक.

अव्यक्त का अपस्केल

तथाकथित हाई-रेज़ लेटेंट फ़िक्स, लेटेंट स्पेस में सीधे स्केल करता है, जिससे पुनर्निर्माण के दौरान विवरण समृद्ध होता है। यह मूल से थोड़ा हटकर हो सकता है और धीमा भी है, लेकिन यह जानकारी जोड़ता है केवल पिक्सल को फैलाने के बजाय.

त्वरित तुलना

पिक्सेल अपस्केलिंग: तेज़, बिना नई जानकारी जोड़े, संभव स्मूथिंग। अव्यक्त अपस्केलिंग: धीमी, यह विवरण जोड़ता है लेकिन आधार छवि को बदल सकता है।संदर्भ और आवश्यक निष्ठा के अनुसार चुनें।

कंट्रोलनेट: संरचना का उत्तम नियंत्रण

कंट्रोलनेट मॉडल की संरचना का सम्मान सुनिश्चित करने के लिए सीमाएं, मुद्रा, गहराई या विभाजन जैसे दिशानिर्देश प्रदान करता है। यह वीएफएक्स के लिए एक अत्यंत शक्तिशाली उपकरण है क्योंकि यह लगातार संरचना और गति को ठीक करता है।लीनियरआर्ट, डेप्थ या ओपनपोज़ का प्रयास करें और निष्ठा/रचनात्मकता को संतुलित करने के लिए ताकत को समायोजित करें।

ComfyUI एडमिनिस्ट्रेटर: कस्टम नोड्स अद्यतित

गायब नोड्स स्थापित करें

यदि कोई वर्कफ़्लो उन नोड्स का अनुरोध करता है जो आपके पास नहीं हैं, तो प्रबंधक का उपयोग करें: बटन प्रबंधक, "अनुपलब्ध कस्टम नोड्स स्थापित करें", ComfyUI को पुनरारंभ करें और ब्राउज़र को पुनः लोड करें। इससे यह सुनिश्चित होता है कि आप साझा प्रवाह को हूबहू दोहराएंगे।.

नोड्स अपडेट करें

मैनेजर से, अपडेट की जाँच करें और "कस्टम नोड्स स्थापित करें" पर क्लिक करें। यदि पैकेज के आगे "अपडेट" दिखाई देता है, तो उसे लागू करें, पुनः आरंभ करें और रीफ़्रेश करें। नोड्स को अद्यतन रखने से त्रुटियों से बचाव होता है और कार्यक्षमता में सुधार होता है.

कैनवास पर नोड्स खोजें

नोड खोजक को खोलने और उन्हें नाम से जोड़ने के लिए खाली कैनवास पर डबल-क्लिक करें। इससे जटिल श्रृंखलाओं के संयोजन में तेजी आती है। ब्राउज़िंग मेनू के बिना.

एम्बेडिंग (पाठ उलटा)

आरामदायकयूआई

एम्बेडिंग को सक्रिय करने के लिए, सकारात्मक या नकारात्मक प्रॉम्प्ट पर एम्बेडिंग:नाम टाइप करें। फ़ाइल को ComfyUI/models/embeddings में रखें ComfyUI इसे तभी लागू करेगा जब उसे कोई मेल मिलेगा। यह विशिष्ट शैलियों या अवधारणाओं को शामिल करने का एक प्रभावशाली तरीका है।

एम्बेडिंग स्वतः पूर्णता

स्वतः पूर्ण करने के लिए ComfyUI-Custom-Scripts पैकेज स्थापित करें। एक बार सक्रिय होने पर, “embedding:” टाइप करना शुरू करने पर आपके उपलब्ध एम्बेड प्रदर्शित होंगेबड़े संग्रह के साथ काम में तेजी लाना।

एम्बेडिंग वजन

आप इसे शब्दों की तरह ही महत्व दे सकते हैं: (embedding:Name:1.2) प्रभाव को बढ़ाता है और (embedding:Name:0.8) इसे कम करता है। वज़न समायोजित करने से आपको दृश्य प्रभाव पर बेहतर नियंत्रण मिलता है.

LoRA: VAE को छुए बिना शैली को अपनाता है

LoRA, आधार चेकपॉइंट के MODEL और CLIP को संशोधित करके शैलियाँ, वर्ण या ऑब्जेक्ट्स को शामिल करता है, तथा VAE को बरकरार रखता है। बुनियादी प्रक्रिया: चेकपॉइंट चुनें, एक या अधिक LoRA जोड़ें, संकेतों की समीक्षा करें, और कतार शुरू करें.

कई कैस्केडिंग LoRAs

आप एक ही प्रवाह में कई LoRAs लागू कर सकते हैं; वे क्रमिक रूप से संयुक्त होते हैं। शैलियों को रचनात्मक रूप से मिश्रित करने के लिए क्रम और भार के साथ प्रयोग करें जब तक वांछित संतुलन प्राप्त न हो जाए।

लोरा

शॉर्टकट और ट्रिक्स जो घंटों बचाते हैं

कॉपी/पेस्ट: प्रविष्टियों को रखते हुए पेस्ट करने के लिए Ctrl+C, Ctrl+V और Ctrl+Shift+V दबाएं। Ctrl से अनेक नोड्स चुनें, चयन बॉक्स बनाएँ, और Shift से उन्हें स्थानांतरित करें त्वरित लेआउट के लिए.

Ctrl+M से नोड को म्यूट करने से वह अस्थायी रूप से हट जाता है; किसी नोड के ऊपरी बाएँ कोने में स्थित बिंदु को दबाकर उसे छोटा करें बड़ी परियोजनाओं में कैनवास को साफ़ करने के लिए।

जनरेशन कतार: Ctrl+Enter. ComfyUI केवल इनपुट बदलने पर ही नोड्स को पुनः निष्पादित करता है; लंबी श्रृंखलाओं की पुनर्गणना से बचने और समय बचाने के लिए बीजों को ठीक करता है।

PNG एम्बेडेड प्रवाह: मेटाडेटा से वर्कफ़्लो को पुनः प्राप्त करने के लिए उत्पन्न छवि को ComfyUI में खींचें। यह पाइपलाइनों को साझा करने और संस्करणित करने का एक उत्कृष्ट तरीका है बिना कोई टुकड़ा खोए। अगर आप वीडियो से बेहतर सीखते हैं, तो देखें 10 अभूतपूर्व वीडियो ट्यूटोरियल.

वीडियो के लिए ComfyUI: AnimateDiff चरण दर चरण

एनिमेटडिफ आपको पाठ, चित्र या वीडियो से अनुक्रम उत्पन्न करने की अनुमति देता है। NVIDIA वाले विंडोज़ के लिए, 10 GB VRAM इष्टतम है (कम रिज़ॉल्यूशन या Txt2Vid के साथ न्यूनतम 8 GB); मांग वाली परियोजनाओं में आप 2 कंट्रोलनेट्स के साथ लगभग 10 जीबी की उम्मीद कर सकते हैं।

स्थापना और निर्भरताएँ

नोड्स को क्लोन करने के लिए Git इंस्टॉल करें और पोर्टेबल ComfyUI निकालने के लिए 7-Zip इंस्टॉल करें। FFmpeg वैकल्पिक है (कम्बाइनर नोड्स से GIF/MP4 पैकेजिंग के लिए)यदि यह PATH में नहीं है, तो स्ट्रीम्स ढीले फ्रेम उत्पन्न करना जारी रखती हैं।

पोर्टेबल ComfyUI डाउनलोड करें और आरंभ करने के लिए पहली बार run_nvidia_gpu चलाएँ। कस्टम नोड्स फ़ोल्डर में, क्लोन करें ComfyUI-AnimateDiff-Evolved, ComfyUI-Manager, ComfyUI-Advanced-ControlNet और ComfyUI-VideoHelperSuite।

प्रबंधक से, “कंट्रोलनेट सहायक प्रीप्रोसेसर्स” और “फ़िज़नोड्स” स्थापित करें। सब कुछ सही ढंग से लोड करने के लिए ComfyUI को पुनः आरंभ करें और आयात त्रुटियों से बचें.

आवश्यक मॉडल

संगत SD 1.5 चेकपॉइंट को उपयुक्त फ़ोल्डर में रखें और यदि आवश्यक हो तो एक सामान्य VAE भी रखें। मोशन मॉड्यूल डाउनलोड करें (उदाहरण के लिए, AnimateDiff, TemporalDiff, या AD Stabilized Motion के मूल मॉड्यूल) और उन्हें अपने पथ पर कॉपी करें। ControlNet के लिए, Lineart, Depth, और OpenPose (pth/yaml) जोड़ें।

मुख्य वर्कफ़्लो: Vid2Vid और Txt2Vid

Vid2Vid: छवि/वीडियो इनपुट नोड के साथ फ़्रेम की एक निर्देशिका लोड करता है, अवधि और नमूनाकरण के लिए image_load_cap, skip_first_images और select_every_nth को नियंत्रित करता है। एकसमान संदर्भ विकल्प महत्वपूर्ण है: संदर्भ लंबाई ~16, निरंतरता के लिए ओवरलैप, और केवल Txt2Vid के लिए बंद लूप.

Txt2Vid: एक प्राथमिक फ्रेम नोड (बिना किसी इमेज लोडर के) का उपयोग करता है और सीधे प्रॉम्प्ट से उत्पन्न होता है। KSampler में Denoise=1 के साथ आपको पूर्णतः उत्पादक प्रभाव प्राप्त होगा, कल्पनाशील क्लिप के लिए आदर्श।

बैच प्रॉम्प्ट शेड्यूलिंग

फ़िज़नोड्स का बैचप्रॉम्प्टशेड्यूल आपको प्रति फ़्रेम प्रॉम्प्ट बदलने की अनुमति देता है। यह सामान्य हेडर और क्लोज़र के लिए pre_text और app_text का उपयोग करता है, और "फ़्रेम: प्रॉम्प्ट" युग्मों को परिभाषित करता है। अंतिम तत्व में अंतिम अल्पविराम से सावधान रहें, इससे त्रुटि हो सकती है; यदि आप किसी निर्देश को अंतरालों के बीच रखना चाहते हैं तो यह उसकी प्रतिलिपि बनाता है।

नमूनाकरण और संयोजन सेटिंग्स

VFX के लिए ComfyUI: परिचय, स्थापना और कार्यप्रवाह

वीडियो के लिए KSampler को अधिक चरणों की आवश्यकता होती है (न्यूनतम 25 और इसे बढ़ाना बेहतर है)। Euler_a सैम्पलर का प्रयास करें और CFG को अपनी पसंद के अनुसार समायोजित करें।Vid2Vid में, स्रोत क्लिप के करीब पहुँचने के लिए शोर कम करें। कंबाइन नोड GIF/MP4 निर्यात करता है: फ़्रेम_रेट, लूप_काउंट, फ़ॉर्मेट और यह निर्धारित करें कि आप पिंग-पोंग चाहते हैं या नहीं।

व्यावहारिक सुझाव: स्थिर चित्रों के लिए कंट्रोलनेट की शक्ति को कम करें, ओपनपोज़ का प्रयास करें, "हायर्स" सुधार के लिए दूसरे के.एस.एम्प्लर का उपयोग करें। विशिष्ट गतिविधियों को समृद्ध करने के लिए मोशन लोरा का प्रयास करें और कंट्रोलनेट्स को संयम से संयोजित करता है।

ComfyUI में अन्य वीडियो इंजन

HunyuanVideo (img2vid उपशीर्षक द्वारा निर्देशित)

अपनी छवि 512x512 पर तैयार करें और फ्लोरेंस2रन के साथ एक उपशीर्षक तैयार करें। StringReplace का उपयोग करके “image/photo/illustration” जैसे शब्दों को “video” से बदलें मॉडल प्रशिक्षण के साथ संरेखित करने के लिए। HunyuanVideo Sampler + रैपर का उपयोग करके अव्यक्त स्थान में परिवर्तित करें, Lora Select लागू करें और combiner के साथ निर्यात करें।

LTX वीडियो (LTX नोड पाइपलाइन)

ComfyUI-LTXVideo नोड्स और मॉडल स्थापित करें (PixArt-XL एनकोडर शामिल है)। CLIP में प्रॉम्प्ट लिखें, EmptyLTXVLatentVideo के साथ वीडियो लेटेंट बनाएं और LTXVScheduler को समायोजित करेंचरणों की संख्या गुणवत्ता बढ़ाती है, और max_shift, base_shift, stretch, और terminal जैसे पैरामीटर क्लिप की गतिशीलता को आकार देते हैं। SaveAnimatedWEBP (lossless true, गुणवत्ता 100) के साथ सहेजें या अन्य प्रारूपों में निर्यात करें।

WAN 2.1 (टेक्स्ट से वीडियो, इमेज से वीडियो, वीडियो से वीडियो)

ComfyUI, Wan 2.1 के लिए प्रवाह को भी एकीकृत करता है। इसके उपयोग में Txt2Vid, Img2Vid और Vid2Vid शामिल हैं, पिछले पाइपलाइनों के समान पैरामीटर नियंत्रण और उपयोग के मामले के आधार पर अस्थायी स्थिरता में लाभ।

मोशन ग्राफ़िक्स: विभाजन, गहराई और सम्मिश्रण

वीडियो से मोशन ग्राफिक्स एनिमेशन के लिए, LoadVideoInput से शुरू करें, पहले फ्रेम छोड़ें और प्रत्येक Nth फ्रेम का चयन करें, और ImageScaleToMegapixels के साथ ~1MP तक स्केल करें। यह प्रीप्रोसेसिंग VRAM लोड और ऑपरेटिंग गति को समायोजित करता है पीढ़ी में। आप यह भी देख सकते हैं कि कैसे प्रीमियर में शीर्षक बनाएँ ग्राफिक्स और क्रेडिट को एकीकृत करने के लिए.

GroundingDINO और SAM का उपयोग करके विषय को पाठ से GroundingDinoSAMSegment के साथ विभाजित करें। GrowMaskWithBlur के साथ मास्क को बड़ा करें और MaskToImage के साथ इसे एक छवि में परिवर्तित करें अधिक मजबूत रूपरेखा के लिए.

TimeFeatureNode के साथ एक समय संकेत बनाएं और उसे FeatureScaler (रैखिक, लघुगणकीय, घातांकीय) के साथ मॉड्यूलेट करें। इससे आप क्लिप के साथ गहराई (Z) विस्थापन या मास्क स्थिति को नियंत्रित कर सकेंगे अधिक सिनेमाई प्रभाव के लिए.

FlexMaskDepthChamber के साथ गहराई पर निर्भर रीपेंट मास्क उत्पन्न करें, जिसमें विषय मास्क, समय संकेत और क्लिप का गहराई मानचित्र शामिल हो। किसी भी समय सक्रिय क्षेत्र को परिभाषित करने के लिए Z फ्रंट/Z बैक को समायोजित करें। और एक विश्वसनीय 3D प्रभाव प्राप्त करें।

जनरेटिव चरण में, चेकपॉइंट लोड करें, LoRAs लागू करें, प्रॉम्प्ट कॉन्फ़िगर करें, और यदि उपयुक्त हो तो कंट्रोलनेट जोड़ें। एनिमेटडिफ आपको फ्रेम देगा; फिर स्मूथनेस को दोगुना करने के लिए RIFE VFI के साथ इंटरपोलेशन करेगा और सहज संक्रमण.

यदि आप पासों को मिश्रित करना चाहते हैं: विभिन्न संकेतों के साथ कई संस्करण उत्पन्न करें, ImageIntervalSelectPercentage के साथ खंडों का चयन करें, ImageBlend के साथ संक्रमणों को मिश्रित करें और ImageBatchMulti के साथ संयोजित करें। RIFE VFI से अंतिम बार गुजरने पर एनीमेशन एकदम चिकना हो जाता है और निर्यात के लिए तैयार है।

ComfyUI ऑनलाइन और क्लाउड विकल्प

कैपकट लोगो

यदि आप कुछ भी इंस्टॉल नहीं करना चाहते हैं, तो ComfyUI के साथ पूर्व-कॉन्फ़िगर की गई क्लाउड सेवाएं उपलब्ध हैं, जिनमें सैकड़ों नोड्स/मॉडल और दर्जनों तैयार वर्कफ़्लोज़ हैं। वे त्वरित परीक्षणों के लिए या टेम्पलेट्स साझा करने वाली टीमों के लिए उपयोगी हैं स्थानीय एजेंसियों से संपर्क किए बिना। एक त्वरित और आसान विकल्प के रूप में, यहाँ संसाधन भी उपलब्ध हैं CapCut में एनिमेशन और दृश्य प्रभाव.

एक अन्य विकल्प ड्रीमिना जैसे क्लाउड-आधारित वीडियो जनरेटर का उपयोग करना है: सरल इंटरफ़ेस, कोई स्थानीय VRAM नहीं, और 20-60 सेकंड में परिणाम। यह एचडी अपस्केल, फ्रेम इंटरपोलेशन और साउंडट्रैक जेनरेशन जैसी अतिरिक्त सुविधाएं प्रदान करता है।आरंभ करने के लिए मुफ्त दैनिक क्रेडिट के साथ, यह एक सुव्यवस्थित विकल्प है जब गति बारीक नियंत्रण से अधिक महत्वपूर्ण होती है।

प्रदर्शन, आवश्यकताएँ और समय

स्थानीय स्तर पर, छवि से वीडियो के लिए कॉम्फीयूआई को आमतौर पर मॉडल (एनिमेटडिफ, हुनयुआनवीडियो, एलटीएक्स वीडियो) और रिज़ॉल्यूशन के आधार पर 8 से 24 जीबी वीआरएएम की आवश्यकता होती है। शक्तिशाली GPU पर भी, एक पीढ़ी में 10-30 मिनट लग सकते हैं यदि क्लिप लंबी है या यदि आप एकाधिक कंट्रोलनेट और हाई-पास फिल्टर का उपयोग करते हैं, तो लोड क्लाउड में प्रदाता पर स्थानांतरित हो जाता है।

कॉम्फीयूआई का सॉफ्टवेयर निःशुल्क है, लेकिन यदि आप लंबे समय तक काम करते हैं तो हार्डवेयर और बिजली पर खर्च करना पड़ता है। क्लाउड उस व्यय से बचता है, तथा बदले में सेवा और शुल्क या क्रेडिट पर निर्भर करता है।मूल्यांकन करें कि आपके कार्यप्रवाह को सबसे अधिक लाभ किससे मिलता है।

सामान्य समस्या निवारण

यदि आपको शून्य त्रुटियाँ या "अस्तित्व में नहीं हैं" वाले नोड दिखाई देते हैं, तो संभवतः आपके फ़ोल्डरों में मॉडल गायब हैं या निर्भरताएँ अनइंस्टॉल हैं। सत्यापित करें कि प्रत्येक नोड का अपना संबद्ध मॉडल है और किसी भी अनुपलब्ध पैकेज को स्थापित करने के लिए प्रबंधक का उपयोग करें।यदि आप पहले से ही अन्य कार्यों के लिए ComfyUI का उपयोग करते हैं तो परस्पर विरोधी रिपॉजिटरी से बचें।

सुसंगत VFX के लिए सर्वोत्तम अभ्यास

जब आप श्रृंखला के खंडों को समायोजित कर रहे हों तो पुनरुत्पादन के लिए बीजों को लॉक कर दें। वर्कफ़्लो मेटाडेटा के साथ छवियों को सहेजें और नोड और मॉडल संस्करणों पर टिप्पणी करेंवीडियो में, संदर्भ लंबाई और ओवरलैप को सावधानीपूर्वक परिभाषित करें, और कंट्रोलनेट्स और LoRAs का स्पष्ट क्रम बनाए रखें।

शॉट के प्रकार और विवरण के स्तर के आधार पर अपस्केल पिक्सेल और लेटेंट के बीच रणनीतिक रूप से स्विच करें। Vid2Vid में, आधार गति का सम्मान करने के लिए शोर कम करें।Txt2Vid में, दृश्य स्थिरता प्राप्त करने के लिए स्टेप्स और सैंपलर को पुश करें।

अपने टूलबॉक्स का विस्तार करने के लिए मैनेजर से कंट्रोलनेट प्रीप्रोसेसर्स (कैनी, डेप्थ, ओपनपोज़...) को एकीकृत करें। और याद रखें: कम कंट्रोलनेट क्षमता अक्सर वीडियो में बेहतर प्रदर्शन करती है।फ़िल्टर किए गए स्वरूप से बचना और प्राकृतिक रूप बनाए रखना।

यदि आपके मामले में उपशीर्षक गाइड, विभिन्न समय गतिशीलता नियंत्रण, या वैकल्पिक पाइपलाइनों की आवश्यकता है, तो हुनयुआनवीडियो और एलटीएक्स वीडियो का पता लगाना सुनिश्चित करें। Wan 2.1 में Txt2Vid, Img2Vid और Vid2Vid के लिए ठोस विकल्प भी जोड़े गए हैं सुसंगत मापदंडों और प्रतिस्पर्धी परिणामों के साथ।

जो लोग गति और शून्य घर्षण चाहते हैं, वे ऑनलाइन सेवाओं पर भरोसा कर सकते हैं, जबकि जो लोग सर्जिकल नियंत्रण और पूर्ण पुनरुत्पादन की आवश्यकता रखते हैं, वे स्थानीय कॉम्फीयूआई के साथ चमकेंगे। आपने जो भाग देखे हैं - नोड्स, पैरामीटर्स, शॉर्टकट्स और फ्लो - उनके साथ अब आपके पास शीर्ष स्तरीय वीएफएक्स तैयार करने का रोडमैप है। स्थिर चित्रों और वीडियो अनुक्रमों दोनों में, लचीले और स्केलेबल तरीके से।

रंग और प्रकाश प्रभाव
संबंधित लेख:
विशेष प्रभावों का अध्ययन करें: अपने आप को वीएफएक्स की दुनिया में क्यों समर्पित करें