ailiteracynepal 🇳🇵
पाठ आकार

अध्याय ४ · खण्ड II · 12 मिनेट

सम्पादन र नियन्त्रण

शून्यबाट उत्पादन भन्दा अघि — छवि-देखि-छवि, इनपेन्टिङ, र एआईलाई उपयोगी सम्पादन साझेदार बनाउने तकनिक।

खाली स्लेटबाट उत्पादन छवि एआईको देखिने प्रयोग हो। सम्पादन — तपाईंसँग पहिले नै भएको छवि लिएर परिमार्जन गर्ने — अधिकांश व्यावहारिक कामका लागि उपयोगी प्रयोग हो। यो खण्ड त्यो तकनिकबारे हो जसले तपाईंलाई “मैले मोडेललाई छवि माग्नुभयो” बाट “मैले मोडेललाई मेरो छवि परिमार्जन गर्न भन्नुभयो” मा सार्छ।

सम्पादनका तीन मोड

आधुनिक छवि उपकरणले तीन फरक प्रकारका सम्पादन समर्थन गर्छन्, धेरै फरक प्रयोगका साथ।

छवि-देखि-छवि (img2img)। तपाईं सुरुवाती छवि र प्रम्प्ट दिनुहुन्छ। मोडेलले इनपुटबाट प्रेरणा लिने नयाँ छवि उत्पादन गर्छ। आउटपुट इनपुटको कति नजिक रहन्छ “बल” स्लाइडरमार्फत तपाईं नियन्त्रण गर्नुहुन्छ — कम बल नजिक रहन्छ, उच्च बल टाढा बहकिन्छ। यसका लागि उपयोगी: स्केचका विविधता प्रयास, फोटोको शैली पुन: डिजाइन, फरक मूड लागू।

इनपेन्टिङ। तपाईं छवि दिनुहुन्छ र बदल्न चाहेको क्षेत्र मास्क गर्नुहुन्छ। मोडेलले मास्क गरिएको क्षेत्र मात्र पुन: उत्पादन गर्छ, बाँकी राख्दै। यसका लागि उपयोगी: कुनै वस्तु हटाउने, एक तत्व बदल्ने (रूख देखि भवन), हात सच्याउने, अनुहार बदल्ने। व्यावहारिक कामका लागि सबैभन्दा उपयोगी छवि सम्पादन तकनिक।

आउटपेन्टिङ। इनपेन्टिङको विपरीत — विद्यमान छविलाई सीमाभन्दा बाहिर विस्तार। यसका लागि उपयोगी: आकार अनुपात बदल्ने, कडाइले काटिएको फोटोमा आकाश थप्ने, प्यानोरामा बनाउने। कम सामान्य तर चाहिँदा प्रभावशाली।

उदाहरण: फोटो उद्धार

तपाईंले पोखराको कार्यशालामा आफ्नो टोलीको फोटो खिच्नुभयो। संरचना उत्कृष्ट छ, तर आकाशमा बिजुलीको तार छ, र एक टोली सदस्यको अनुहार क्यामेराको लेन्स फ्लेयरले आधा छोपिएको छ।

इनपेन्टिङ बिना तपाईंका विकल्प: यससँग बस्ने, फोटो सम्पादक भर्ती गर्ने, वा Photoshop को क्लोन-स्ट्याम्प उपकरणसँग सङ्घर्ष गर्ने। इनपेन्टिङसँग:

  1. उपकरणमा छवि खोल्नुहोस् (Photoshop को Generative Fill, Adobe Firefly, वा निर्मित AI भएको कुनै आधुनिक सम्पादक)।
  2. बिजुलीको तार मास्क गर्नुहोस्। प्रम्प्ट: “clear blue sky”. उत्पादन गर्नुहोस्। तार हट्यो, आकाश स्वाभाविक रूपमा भरियो।
  3. लेन्स फ्लेयर मास्क गर्नुहोस्। प्रम्प्ट: “clear face, sharp focus, matching skin tone”. उत्पादन गर्नुहोस्। फ्लेयर हट्यो, अनुहार विश्वसनीय रूपमा पुनर्स्थापित।
  4. सकियो। पाँच मिनेट।

फोटो अब प्रयोगयोग्य छ। मूलको कुनै पनि पुन: सट गरिएन। मूलको आशय — कार्यशालामा टोली फोटो — सुरक्षित छ। यो छवि सम्पादन सबैभन्दा उपयोगी मोडमा हो: नयाँ कला नबनाई बरु तपाईंसँग वास्तवमा भएको काम समाप्त गर्ने।

सन्दर्भ छवि र ControlNet

बढी उन्नत नियन्त्रणका लागि केही उपकरणले तपाईंलाई सन्दर्भ छवि दिन अनुमति दिन्छन् जसले आउटपुटका फरक पक्षलाई बाँध्छन्।

  • संरचना सन्दर्भ — सन्दर्भजस्तै पोज/संरचनासहितको छवि उत्पादन।
  • शैली सन्दर्भ — सन्दर्भ छविको रङ प्यालेट र ब्रशवर्क मिलाउनुहोस्।
  • गहिराइ सन्दर्भ — दृश्यको 3D संरचना मिलाउनुहोस्।
  • पोज सन्दर्भ — सन्दर्भमा देखाइएको ठ्याक्कै पोजमा व्यक्ति उत्पादन।

यी सुविधा (कहिलेकाहीं खुला-स्रोत संसारमा ControlNet भनिने) शक्तिशाली र अलिकति फिडलिङ छन्। अधिकांश प्रयोगकर्ताका लागि अधिक हो। डिजाइनर र गम्भीर प्रयोगकर्ताका लागि, “खेलौनाका रूपमा AI” बाट “उत्पादन उपकरणका रूपमा AI” को पुल।

व्यावहारिक प्रवेश बिन्दु: धेरै उपकरणले अब तपाईंलाई सरल रूपमा सन्दर्भ छवि अपलोड गर्न र “यो छविको शैली मिलाउनुहोस्” वा “यो छविको संरचना मिलाउनुहोस्” लेख्न दिन्छन्। जटिलता सरल UI पछाडि लुकेको छ।

शिल्पका रूपमा पुनरावृत्ति

छवि कार्य आधारभूत रूपमा पुनरावृत्ति हो। विशिष्ट पेसेवर कार्यप्रवाह यस्तो देखिन सक्छ:

  1. ४-८ प्रारम्भिक विविधता उत्पादन।
  2. सबैभन्दा सम्भावित १-२ छनोट।
  3. भाँचिएका भाग सच्याउन इनपेन्ट (हात, पाठ, प्रकाश)।
  4. उच्च रिजोलुसनमा अपस्केल।
  5. अन्तिम पालिशका लागि नियमित सम्पादकमा छोऔँहोस्।

प्रत्येक चरण छिटो छ — मिनेट, घण्टा होइन — तर प्रत्येक चरण महत्त्वपूर्ण छ। अन्तिम उत्पाद विरलै पहिलो उत्पादन हो। यो साना, सावधान परिष्कारको परिणाम हो।

सम्पादन उपकरण अझै कहाँ सङ्घर्ष गर्छन्

तीन इमानदार सीमा:

  1. पहिचान ठ्याक्कै सुरक्षित गर्ने। अनुहार इनपेन्ट गर्दा सामान्यतया त्यसलाई थोरै बदल्छ। विशिष्ट मानिसको फोटोका लागि यो समस्या हो — सम्पादित फोटो उही व्यक्ति देखिँदैन। उपकरण छिटो सुधारिँदै छन्; २०२६ मा समस्या घटेको छ तर गएको छैन।

  2. धेरै सम्पादनमा निरन्तरता राख्ने। क्रमिक सम्पादन जोडिँदै बहकिन्छ। पाँचौं सम्पादित संस्करण पहिलोभन्दा उही छवि कम लाग्छ। उच्च-निष्ठा संरक्षणका लागि सक्दा सबै सम्पादन एक पासमा गर्नुहोस्।

  3. 3D संरचना बुझ्न चाहिने सम्पादन। कुर्सीहरूको लाइनबाट एउटा कुर्सी हटाउने (जहाँ अर्को कुर्सी पछाडि लुकेको थियो) ले के लुकाइएको थियो अनुमान चाहिन्छ। मोडेलले कहिलेकाहीं यो अद्भुत रूपमा सही र कहिलेकाहीं हास्यास्पद गलत गर्छ।

व्यावहारिक सल्लाह

जोडिँदै जाने तीन बानी:

सटीक मास्क गर्नुहोस्। ढिलो मास्कले मोडेललाई सुरक्षित गर्न चाहेका कुरा बदल्ने स्वतन्त्रता दिन्छ। कडा मास्कले यसलाई वास्तवमा बदल्न चाहेको क्षेत्रमा सीमित गर्छ। मास्कमा खर्चिएको समय सम्पादन गुणस्तरमा सबैभन्दा ठूलो एकल कारक हो।

सही कामका लागि सही उपकरण प्रयोग गर्नुहोस्। Photoshop को Generative Fill सामान्य टच-अपका लागि उत्कृष्ट छ। Adobe Firefly डिजाइन-संचालित कामका लागि राम्रो। खुला-स्रोत उपकरण (ControlNet सहित) सूक्ष्म नियन्त्रणका लागि उत्तम। एउटै उपकरणमा सबै नगर्ने प्रयास गर्नुहोस्।

संस्करण बचाउनुहोस्। सम्पादनको प्रत्येक राउन्ड नयाँ फाइलको रूपमा बचत गरिनुपर्छ। कहिलेकाहीं तेस्रो संस्करण राम्रो थियो र तपाईंले पछि मात्र थाहा पाउनुभयो। डिस्क ठाउँ सस्तो छ।

आफ्नो बुझाइ जाँच्नुहोस्

छोटो जाँच

तपाईंसँग राम्रो तस्बिर छ तर आकाश काट्ने कुरूप बिजुलीको तार छ। कुन तकनिक सबैभन्दा उपयुक्त छ?

अब के?

हामी छवि कार्य यहीँ बन्द गर्छौं। अर्को खण्ड अडियो र भिडियोबारे हो — वाक्-देखि-पाठ, स्वर क्लोनिङ, सङ्गीत, र छिटो सुधार हुने भिडियो मोडेल। यी मोडालिटी सबैभन्दा छिटो विकास हुँदैछन्, र तिनसँगका व्यावहारिक र नैतिक विचार पाठ वा छविको तुलनामा तेजिलो छन्।