अध्याय ५ · खण्ड II · 14 मिनेट
पूर्वाग्रह र सांस्कृतिक अन्धा क्षेत्र
जहाँ मोडेलले "प्राविधिक रूपमा सही" आउटपुट उत्पादन गर्छ जुन चुपचाप नेपाललाई गलत बुझ्छ — र बाहिर जानुअघि कसरी समात्ने।
भ्रम जेनेरेटिभ एआईको चर्को असफलता मोड हो — स्पष्ट रूपमा गलत कुरा जुन तपाईं औंल्याउन सक्नुहुन्छ। पूर्वाग्रह र सांस्कृतिक अन्धा क्षेत्र चुप एक हो — आउटपुट जुन प्राविधिक रूपमा सही, सरल, र विश्वासी छ, तर तपाईंको विशिष्ट सन्दर्भलाई मोडेलले देख्न नसक्ने तरिकामा सूक्ष्म रूपमा गलत बनाउँछ।
नेपाली प्रयोगकर्ताका लागि यो सबैभन्दा महत्त्वपूर्ण असफलता मोड हो। हरेक प्रमुख मोडेलपछाडिको तालिम डाटा अत्यधिक रूपमा पश्चिमी, अंग्रेजी-भाषा, सहरी, र मध्यम-वर्गीय छ। तपाईंले तपाईंको सन्दर्भमा कार्यका लागि मोडेलबाट सहयोग माग्दा यसले तपाईंको समावेश नभएको वितरणबाट निकाल्छ।
सरल उदाहरण
तपाईंले मोडेललाई “बिदाको खाना खाँदै गरेको विशिष्ट परिवारको छवि” माग्नुहुन्छ। निर्देशन बिना तपाईंले लगभग निश्चित रूपमा पाउनुहुन्छ: उपनगरीय पश्चिमी भान्सामा चार जनाको सेतो परिवार टर्की-र-क्र्यानबेरीको खानामा।
यो मोडेल नेपाली परिवारको विरुद्ध पूर्वाग्रही भएको होइन। यो मोडेलले तालिम डाटा दिँदा सबैभन्दा तथ्याङ्कीय रूपमा सामान्य छवि उत्पादन गरिरहेको हो। डिफल्ट पश्चिमी डिफल्ट हो किनकि तालिम वितरण पश्चिमी छ। नेपाली परिवार सधैं उपलब्ध थियो; यो मात्र सबैभन्दा सम्भावित आउटपुट थिएन।
समाधान सानो छ: “भक्तपुरको परम्परागत नेवारी घरमा दशैं तिहारको खाना खाँदै सात जनाको नेपाली बाहुन परिवार, आमाले सेल रोटी पस्किँदै, पूरै घर दियोले उज्यालो।” निर्दिष्ट गर्नुहोस्, र मोडेलले उत्पादन गर्न सक्छ। निर्दिष्ट नगर्नुहोस्, र यो तालिम वितरणको केन्द्रमा फर्किन्छ।
पूर्वाग्रह पाठमा कहाँ देखिन्छ
ध्यान दिनुपर्ने सूक्ष्म पाठ ढाँचा:
नाम। “कथाका पात्रका लागि पाँच नमूना नाम” माग्नुहोस् र तपाईंले सामान्यतया पाँच पश्चिमी नाम पाउनुहुनेछ — “Sarah, James, Maria, David, Lisa।” समाधान फेरि निर्दिष्ट गर्नु: “पाँच नेपाली नाम — तीन महिला, दुई पुरुष, फरक जातीय समुदायबाट।”
उदाहरण र समानता। अवधारणा व्याख्या गर्दा मोडेलले आफ्नो तालिम वितरणसँग गुञ्जायमान हुने उदाहरण रोज्छन् — अमेरिकी बेसबल, युरोपेली इतिहास, सिलिकन भ्यालीका स्टार्टअप। नेपाली दर्शकका लागि तपाईं भन्न सक्नुहुन्छ: “नेपाली उदाहरण प्रयोग गर्नुहोस् — खल्ती, पठाओ, वा धान खेती।”
स्वर र औपचारिकता। पश्चिमी अंग्रेजीमा तालिम पाएका मोडेलहरूको अमेरिकी व्यापार-सामान्य डिफल्ट हुन्छ। नेपाली पत्राचारलाई प्राय: बढी औपचारिक सम्मानजनक, बढी सम्बन्धात्मक सन्दर्भ, ज्येष्ठतालाई बढी आदर चाहिन्छ। निर्दिष्ट गर्नुहोस् नभए आउटपुट अनौठो रूपमा सपाट लाग्नेछ।
घरधुरीबारे निहित मान्यता। पश्चिमी-डिफल्ट आउटपुटले नाभिकीय परिवार, व्यक्तिगत निर्णय-निर्माण, सहरी पूर्वाधार, र ज्येष्ठका लागि अलग आवासलाई मान्छन्। नेपालमा यिनैमध्ये कुनै पनि सार्वभौमिक सत्य छैन। घरको जीवन, परिवारका निर्णय, ज्येष्ठ हेरचाहबारे आउटपुटले निर्दिष्ट नगरेसम्म चुपचाप नमिलाउनेछन्।
पैसा र तलब सन्दर्भ। मोडेलहरूले डलर वा युरोमा डिफल्ट गर्छन्। नेपाल-विशिष्ट सामग्रीका लागि रू. र यथार्थवादी स्थानीय तलब दायरा निर्दिष्ट गर्नुहोस्।
भौगोलिक डिफल्ट। “व्यस्त शहर” काठमाडौंको असनलाई होइन, न्यूयोर्क वा टोकियोलाई डिफल्ट गर्छ। “ग्रामीण क्षेत्र” कर्णालीलाई होइन, अमेरिकी मध्यपश्चिमलाई डिफल्ट गर्छ।
यिनैमध्ये कुनै पनि बग होइन। यी सम्भाव्यता डिफल्ट हुन्। तिनी अस्तित्वमा छन् भनेर जान्नु धेरैजसो लडाइँ हो; बाँकी लडाइँ निरन्तर निर्दिष्ट गर्नु हो।
पूर्वाग्रह छविमा कहाँ देखिन्छ
छवि पूर्वाग्रह बढी दृश्य र प्राय: बढी प्रकट हुन्छ।
“डाक्टर।” पश्चिमी पुरुष, सेतो कोट, स्टेथोस्कोप। डिफल्ट। नेपाली सन्दर्भका लागि लिङ्ग, जातीयता, र सेटिङ निर्दिष्ट गर्नुहोस्।
“पेसेवर।” पश्चिमी व्यापार सूट, आधुनिक कार्यालय। न्यूरोडको सानो कार्यालयमा कुर्ता-पाइजामा, वा सोलुखुम्बुमा दौरा सुरुवाल मा शिक्षक चाहनुहुन्छ भने निर्दिष्ट गर्नुहोस्।
“विवाह।” डिफल्ट क्रिश्चियन विवाह — सेतो पोशाक, गाढा सूट, चर्च। नेपाली विवाहका लागि समुदाय (हिन्दू, बौद्ध, नेवारी, आदि), स्थान (मण्डप, गुम्बा, आँगन), र पहिरन निर्दिष्ट गर्नुहोस्।
“परम्परागत नेपाली घर।” आउटपुट: सौन्दर्यपरक रूपमा नेपाल-कोडेड छवि — सिँढीदार खेत, पहाड, प्रार्थना झण्डा — तर वास्तुकलात्मक विशिष्टता प्राय: गलत। गुल्मीको परम्परागत बाहुन घर बर्दियाको परम्परागत थारू घरभन्दा धेरै फरक देखिन्छ; मोडेलले तालिम डाटामा सबैभन्दा सामान्य रूढिवादी, सामान्यतया पहाड-पर्यटन छवि रोज्नेछ।
“बच्चा।” पश्चिमी डिफल्ट। नेपाली बच्चाका लागि जातीयता (खस, मधेसी, थारू, नेवारी, आदि) र पहिरन निर्दिष्ट गर्नुहोस्।
मोडेलले सौन्दर्यपरक रूपमा विश्वसनीय आउटपुट उत्पादन गरिरहेको छ — तिनी नेपाललाई पर्यटन पोस्टरले देखाएको जस्तै देखाउँछन्। स्थानीय विशिष्टतालाई प्रयत्न चाहिन्छ।
पूर्वाग्रह स्वर र भिडियोमा कहाँ देखिन्छ
उही ढाँचा लागू हुन्छन् तर थप असफलता मोडसँग।
स्वर संश्लेषण। नेपाली स्वर सुधारिएका छन् तर अधिकांश डिफल्ट सहरी काठमाडौं नेपाली छन्। क्षेत्रीय उच्चारण, मिथिला नेपालीको लय, मगर-प्रभावित बोलीको प्रोसोडी — यी या त संश्लेषण विकल्पबाट छुटेका छन् वा बाध्य लाग्छन्।
भिडियो। डिफल्ट मानिस, डिफल्ट सेटिङ, डिफल्ट शारीरिक भाषा। विशिष्टता बिना उत्पन्न “नेपाली विवाह भिडियो” स्टक भारतीय वा बङ्गलादेशी विवाह भिडियोजस्तो देखिनेछ, नेपाली होइन। दृश्य शब्दभण्डार छिमेकी देशबाट उधारो लिइएको हो, नेपालबाट विशेष रूपमा सिकिएको होइन।
निकालिएका निर्णयमा पूर्वाग्रह
सबैभन्दा परिणामकारी श्रेणी। जेनेरेटिभ मोडेललाई निर्णय मा सहयोग गर्न प्रयोग गरिँदा — रोजगारी आवेदक स्क्रिनिङ, क्रेडिटयोग्यता मूल्याङ्कन, निबन्ध मूल्याङ्कन, कुन ग्राहक प्राथमिकता दिने निर्णय — मोडेलको ढाँचा पहिचानमा पूर्वाग्रहले पूर्वाग्रही निर्णयमा अनुवाद गर्छ।
ठोस उदाहरण:
- रिजुम सारांश गर्न प्रयोग गरिएको मोडेलले पश्चिमी-सुनिने नाम र अंग्रेजी-माध्यम शिक्षालाई नेपाली ग्रामीण पृष्ठभूमिभन्दा बढी अनुकूल मूल्याङ्कन गर्नेछ।
- विद्यार्थी निबन्ध “ग्रेड” गर्न प्रयोग गरिएको मोडेलले पश्चिमी अलङ्कारिक संरचनालाई नेपालीभन्दा उच्च मूल्याङ्कन गर्नेछ।
- ग्राहक सपोर्ट टिकट तत्कालता मूल्याङ्कन गर्न प्रयोग गरिएको मोडेलले केही नेपाली समुदायमा सामान्य कम जोडदार स्वरमा व्यक्त गरिएका चिन्तालाई कम मूल्याङ्कन गर्न सक्छ।
यी सूक्ष्म छन्, एकल आउटपुटबाट पत्ता लगाउन गाह्रो छन्, र जोडिँदै जान्छन्। कुनै पनि निर्णय-असर पार्ने सन्दर्भमा जेनेरेटिभ एआई प्रयोग गर्दै हुनुहुन्छ भने तपाईंलाई चाहिन्छ:
- सचेत हुनुहोस् कि पूर्वाग्रह उपस्थित छ र परिणाममा असर पार्न सक्छ।
- अडिट गर्नुहोस् ज्ञात-बराबर इनपुट फिड गरेर र आउटपुट बराबर छ कि छैन जाँचेर।
- खुलासा गर्नुहोस् निर्णयबाट प्रभावित मानिसलाई एआई प्रयोग।
- बाटो प्रदान गर्नुहोस् मानव समीक्षाका लागि।
हामी अध्याय ६ मा फर्कनेछौं, तर सिद्धान्त अहिले उल्लेख गर्न लायक छ: निर्णयको दाउ जति उच्च छ, अन्तर्निहित न्यायलाई जेनेरेटिभ मोडेलमा सुम्पन उति कम उपयुक्त छ।
काम गर्ने बानी: आक्रामक रूपमा निर्दिष्ट गर्नुहोस्
धेरै पटक फिर्ता दिने ढाँचा। सांस्कृतिक विशिष्टतासहितको कुनै पनि कार्य अघि प्रम्प्टमा स्पष्ट रूपमा सन्दर्भ निर्दिष्ट गर्न ३० सेकेन्ड लिनुहोस्।
निकाल्ने सानो लाइब्रेरी:
- “दर्शक नेपाली, मूलतः काठमाडौं-आधारित, सामान्यतया द्विभाषिक नेपाली-अंग्रेजी हुन्।”
- “नेपाली उदाहरण प्रयोग गर्नुहोस् — खल्ती, पठाओ, दालभात, OCR, देवनागरी।”
- “नेपाली जातीय समुदायहरूको दायराबाट नाम प्रयोग गर्नुहोस्।”
- “मूल्यलाई NPR मा उल्लेख गर्नुहोस्।”
- “स्वर: औपचारिक नेपाली पत्राचार, उपयुक्त रूपमा सम्मानजनक।”
- “सेटिङ: विशिष्ट काठमाडौंको सानो व्यापार मान्नुहोस्, सिलिकन भ्यालीको स्टार्टअप होइन।”
यी थप प्रम्प्ट लम्बाइमा लगभग केही खर्च लाग्दैन। आउटपुट भिन्नता तुरुन्तै र उल्लेखनीय छ।
आफ्नो बुझाइ जाँच्नुहोस्
छोटो जाँच
—तपाईंले छवि मोडेललाई थप निर्दिष्ट बिना “विशिष्ट विवाह” माग्नुहुन्छ। आउटपुट सबैभन्दा सम्भावित के हो?
अब के?
हामीले दुई मुख्य असफलता मोड — भ्रम र पूर्वाग्रह — ढाक्यौं। अर्को खण्ड ती अवस्थाबारे हो जहाँ तपाईंले जेनेरेटिभ एआईतर्फ हात नबढाउनुपर्ने हो, तपाईंको प्रम्प्टिङ र प्रमाणीकरण जति सावधान भए पनि।