ailiteracynepal 🇳🇵
पाठ आकार

अध्याय ४ · खण्ड I · 14 मिनेट

छवि उत्पादन

आधुनिक छवि जनरेटर कसरी काम गर्छन्, तिनलाई कसरी प्रम्प्ट गर्ने, र २०२६ मा कमी कहाँ देखिन्छ।

२०२० मा पाठ प्रम्प्टबाट छवि उत्पादन अनुसन्धान कौतुहल थियो। २०२६ सम्म यो Word र PowerPoint भित्रको सुविधा, फोन हुने जो कोहीले पनि प्रयोग गर्न सक्ने रू. १,५००-मासिक सदस्यता बनेको छ। छवि उत्पादन जेनेरेटिभ एआईको सबैभन्दा दृश्य रूपमा प्रभावशाली प्रयोग हो, र दुरुपयोग गर्न सबैभन्दा सम्भावित — राम्रो र खराब कारणका लागि।

यो खण्ड यसलाई राम्ररी प्रयोग गर्ने बारे हो। यी उपकरणले वास्तवमा के गर्छन्, तिनलाई कसरी प्रम्प्ट गर्ने, र कमी कहाँ देखिन्छ ढाक्छौं।

छवि मोडेल वास्तवमा कसरी काम गर्छन्

आधुनिक छवि जनरेटर भाषा मोडेलभन्दा फरक जनावर हो, तर परिवारको समानता नजिक छ। प्रमुख वास्तुकला डिफ्युजन मोडेल हो, जुन यसरी काम गर्छ:

  1. तालिम। मोडेललाई अर्बौं (छवि, क्याप्शन) जोडी देखाउनुहोस्। कस्ता छविले कस्ता वर्णनसँग मिल्छन् सिकाउनुहोस्।
  2. उत्पादन। शुद्ध शोर — TV-स्थिर छवि — बाट सुरु गर्नुहोस्। अनि, तपाईंको पाठ प्रम्प्टले मार्गदर्शन गर्दै, छविलाई पुनरावृत्ति रूपमा डिनोइज गर्नुहोस्, चरण-दर-चरण, जबसम्म प्रम्प्टसँग मिल्ने सुसंगत तस्बिर देखिँदैन।

त्यो वर्णन प्राविधिक छ तर परिणाम सहज छ: प्रत्येक उत्पादन नयाँ छवि हो। मोडेलले भण्डारण गरिएको तस्बिर निकाल्दैन; यसले सिकेका ढाँचाबाट रचना गरिरहेको छ, तपाईंको प्रम्प्टले तानेको दिशामा।

तपाईंले प्रयोग गर्ने उपकरण:

  • Midjourney — सबैभन्दा बलियो सौन्दर्य; आफ्नै एप र Discord मा चल्छ; सदस्यता।
  • DALL·E 3 — ChatGPT Plus मा एकीकृत; सौन्दर्यका हिसाबले कमजोर तर सजिलो पहुँच।
  • Stable Diffusion (र संस्करण — Flux, SDXL) — खुला-स्रोत; तपाईं चाहनुहुन्छ भने आफ्नै GPU मा चलाउन सक्नुहुन्छ; अनन्त अनुकूलन योग्य।
  • Ideogram — विशेष गरी छविभित्र पाठ सञ्चालन गर्न परिचित।
  • Adobe Firefly, Canva, Imagen — तपाईंले अघि नै तिर्ने डिजाइन उपकरण भित्र छवि उत्पादन।

२०२६ मा अधिकांश सामान्य प्रयोगका लागि तपाईंले अघि नै तिर्ने उपकरणमा जे छ सही उत्तर हो। मोडेलहरूबीचको सौन्दर्य भिन्नता वास्तविक छ तर सानो छ।

राम्रो छवि प्रम्प्टको संरचना

छवि प्रम्प्टले पाठ प्रम्प्टभन्दा फरक आकार लिन्छन्। पाँच तत्व, यो क्रममा:

  1. विषय। तस्बिरमा के छ?
  2. सेटिङ/सन्दर्भ। कहाँ? विषय वरिपरि के छ?
  3. शैली। फोटो? चित्रकला? चित्रण? कुन शैलीको चित्रकला?
  4. मूड/वातावरण। उज्यालो? गहिरो? सिनेमेटिक? सपनाजस्तो?
  5. संरचना/क्यामेरा। नजिकको? चौडा सट? माथिबाट? Bokeh?

कमजोर प्रम्प्ट:

एक नेपाली महिला

यसले तपाईंलाई केही दिनेछ, तर सामान्य। केन्द्रित प्रम्प्ट:

३० वर्षीय नेपाली महिला रङ्गीन कुर्ता-सुरुवालमा, पाटनको नेवारी इँटाको घरको आँगनमा सुनको घडीमा, मीठो प्राकृतिक प्रकाश, फोटोग्राफिक शैली, उथलो गहिराइको क्षेत्र, मीठो रङ, क्यामेरा बाहिर हेर्दै

प्रत्येक खण्डले विशिष्टता थप्छ। मोडेलसँग बढी आधार छ।

काम गर्ने शैली एङ्कर

केही शैली संकेत जसले अधिकांश मोडेलमा निरन्तर आउटपुटलाई असर गर्छन्:

फोटोग्राफिक शैली: “photograph, 35mm film, golden hour, shallow depth of field, bokeh, cinematic lighting” — यथार्थवादी फोटो उत्पादन गर्छ।

चित्रण शैली: “watercolour illustration, ink and wash, pen drawing, vector flat, isometric, cartoon” — कलात्मक आउटपुट उत्पादन गर्छ।

युग/आन्दोलन: “Studio Ghibli style, 1960s travel poster, Soviet propaganda poster, Mughal miniature painting, ukiyo-e woodblock” — परिचित शैलीको सौन्दर्य भाषा उधारो लिन्छ। उपयोगी तर अति प्रयोग गर्दा सादोपनको जोखिम।

मूड: “soft, dreamy, ominous, austere, joyful, melancholy, sun-soaked, rain-washed” — भावनात्मक रेजिस्टर सेट गर्छ।

क्यामेरा भाषा: “close-up, wide shot, low angle, drone shot, over-the-shoulder, fisheye, double exposure” — संरचनालाई असर गर्छ।

काम गर्ने बानी: तपाईंलाई राम्ररी काम लागेका वाक्यांशको सानो पाठ फाइल राख्नुहोस्। सम्बन्धित परियोजनाका लागि त्यसबाट टाँस्नुहोस्। वाक्यांश लाइब्रेरी छवि उत्पादनमा तपाईंले गर्ने सबैभन्दा ठूलो व्यावहारिक उत्पादकता लाभमध्ये एक हो।

नकारात्मक प्रम्प्ट

अधिकांश उपकरणले नकारात्मक प्रम्प्ट स्वीकार्छन् — बच्ने कुराहरू। मोडेलले तपाईंले नचाहेको कुरा थपिरहँदा उपयोगी।

सामान्य उदाहरण:

  • “no text, no watermarks, no logos” — स्टक-फोटो शैलीका छविका लागि।
  • “no extra fingers, no deformed hands” — पोर्ट्रेटका लागि।
  • “no Hollywood stereotypes of Nepal” — मोडेलले कुनै नेपाली विषयका लागि पहाड-र-भिक्षु डिफल्ट लिँदा।

नकारात्मक प्रम्प्ट गार्डरेलजस्ता हुन्। कम प्रयोग गर्नुहोस्; अति प्रयोगले अनावश्यक विवरणसँगै उपयोगी विवरण पनि दबाउन सक्छ।

कमी कहाँ देखिन्छ

२०२६ मा अपेक्षा गर्नुपर्ने असफलता मोडको सूची।

छविभित्र पाठ। अधिकांश मोडेलले अझै बङ्ग्याएका अक्षर लेख्छन्। “Welcome to Pokhara” एउटा साइनमा अंग्रेजीजस्तो देखिने तर होइन भन्ने बकवास निस्किन्छ। Ideogram र Flux ले पाठ बेस सञ्चालन गर्छन्; महत्त्वपूर्ण पाठ ओभरलेका लागि पाठ बिना छवि उत्पादन गर्नुहोस् र ग्राफिक्स सम्पादकमा पाठ थप्नुहोस्।

हात। हातमा सुधार आएको छ तर अझै दुर्व्यवहार गर्छन् — छ औंला, गलत ठाउँमा तीन घुँडा, अनौठो जोडिएको बूढी औंला। हातको नजिकको सट वा अन्तरक्रियाका लागि पुन: प्रयासको अपेक्षा गर्नुहोस्।

विशिष्ट वास्तविक मानिस। प्रम्प्टमा नाम सहित पनि मोडेलले नामिएको व्यक्तिसँग सादृश्य देखिने कुरा निकाल्छन्, वास्तविक व्यक्ति होइन। आउटपुट सौन्दर्यपरक रूपमा सही र तथ्यगत रूपमा गलत हुन्छ।

विशिष्ट सांस्कृतिक वस्तु। “परम्परागत नेवारी महिलाको म्हेचा (चाँदीको पेटी)” मागेमा नेवारी गहनाको अनुभव भएको कुरा निस्किन सक्छ तर म्हेचा होइन। मोडेलहरू प्रमुख पश्चिमी तालिम डाटाबाहिरका सांस्कृतिक विशिष्ट विवरणमा अस्पष्ट छन्।

गन्ती। “आँगनमा पाँचवटा कुखुरा” प्राय: तीन वा सात कुखुरा उत्पादन गर्छ। गन्ती छवि उत्पादनमा अविश्वसनीय छ।

प्रतिबिम्ब, छाया, र सममिति। ऐनाहरू जसले असम्भव प्रतिबिम्ब देखाउँछन्; छाया जुन गलत दिशामा जान्छ; अनुहार जुन सूक्ष्म रूपमा असममित हुन्छन्। मोडेलले यिनी कस्ता देखिन्छन् सिकेको छ, भौतिक रूपमा कसरी काम गर्छन् होइन।

उदाहरण: एनजीओ हीरो छवि

तपाईं ग्रामीण पानी पहुँचमा काम गर्ने नेपाली एनजीओका लागि वेबसाइट बनाउँदै हुनुहुन्छ। तपाईंलाई हीरो छवि चाहिएको छ: वास्तविक-अनुभव भएको तर निमन्त्रणा गर्ने, क्लिश नभई काम बुझाउने।

पुनरावृत्ति सत्र:

प्रम्प्ट १:

नेपालमा ग्रामीण पानी पहुँचको तस्बिर

परिणाम: सामान्य पहाडी गाउँ। क्लिश। स्टक-अनुभव।

प्रम्प्ट २ — विषय विशिष्टता थप्नुहोस्:

सिन्धुपाल्चोकको ग्रामीण गाउँमा ९ वर्षीय नेपाली केटी स्टीलको गाग्रो ट्याप स्ट्यान्डबाट भर्दै, बिहान, मीठो घाम, फोटोग्राफिक, अलि फीका रंग, स्वाभाविक क्षण, फोटोजर्नालिस्टिक शैली

राम्रो। विशिष्ट, आधारित।

प्रम्प्ट ३ — आउटपुट देखेपछि परिष्कार:

माथिको जस्तै, तर थप: पछाडि स्पष्ट निलो प्लास्टिक पाइप देखिने, टिनको छाना भएको सरल घर, कुनै पोज नगरिएको अभिव्यक्ति, बग्ने पानीतर्फ हेर्दै

आउटपुट अहिले प्रयोगयोग्य छ। तीन पुनरावृत्ति, कुल पाँच मिनेट। पुनरावृत्ति बिना तपाईंले या त खराब छवि स्वीकार्ने थियो वा छोड्ने थियो।

छवि जनरेटरसँग काम गर्ने द्रुत नियम

  1. पुनरावृत्ति गर्नुहोस्। पहिलो आउटपुट विरलै उत्तम हुन्छ। ३-४ विविधता प्रयास गर्नुहोस्।
  2. विशिष्ट हुनुहोस्। अस्पष्ट प्रम्प्टले अस्पष्ट आउटपुट उत्पादन गर्छ।
  3. पाठ बिना उत्पादन गर्नुहोस्, छुट्टै पाठ थप्नुहोस्। उपकरणले गर्न नसक्ने कुरामा नलड्नुहोस्।
  4. आफ्ना वाक्यांश बचाउनुहोस्। के काम गर्छ सानो व्यक्तिगत लाइब्रेरी बनाउनुहोस्।
  5. सांस्कृतिक विशिष्टता प्रमाणित गर्नुहोस्। स्थानीयले समात्ने विवरणमा मोडेललाई विश्वास नगर्नुहोस्।
  6. मोडालिटीसँग उपकरण मिलाउनुहोस्। फोटोरियल चाहिन्छ? फोटोरियलका लागि परिचित उपकरण रोज्नुहोस्। चित्रण चाहिन्छ? त्यसका लागि परिचित।

आफ्नो बुझाइ जाँच्नुहोस्

छोटो जाँच

डिजाइनर “स्वच्छ पानी, स्वस्थ जीवन” नेपाली पाठ प्रमुख रूपमा देखिने पोस्टर चाहन्छन्। २०२६ मा सबैभन्दा विश्वसनीय कार्यप्रवाह कुन हो?

छोटो जाँच

"एक नेपाली महिला" जस्तो कमजोर छवि प्रम्प्टले सामान्य आउटपुट उत्पादन गर्ने प्रवृत्ति देखाउँछ। सबैभन्दा विश्वसनीय एकल सुधार के हो?

अब के?

हामीले शून्यबाट उत्पादन ढाक्यौं। अर्को खण्ड नियन्त्रण बारे हो — छवि-देखि-छवि सम्पादन, मास्किङ, नयाँ उत्पादन गर्नुको साटो विद्यमान छवि परिमार्जन गर्ने। यहाँ छवि एआईले वास्तविक डिजाइन काम प्रतिस्थापन गर्न थाल्छ।