अध्याय ६ · खण्ड I · 12 मिनेट
गोपनीयता र डाटा
तपाईंले के साझा गर्नुहुन्छ, के भण्डारण हुन्छ, र गोप्य कामका लागि विकल्प।
तपाईंले उपभोक्ता जेनेरेटिभ एआई उपकरण — ChatGPT, Claude, Gemini, Midjourney — मा टाइप गर्ने हरेक कुरा विदेशी सर्भरमा पठाइन्छ, त्यहाँ प्रशोधन गरिन्छ, र प्राय: लग गरिन्छ। अधिकांश उपभोक्ता उपकरणका डिफल्ट सेटिङले प्रदायकलाई भविष्यका मोडेल सुधार गर्न तपाईंका वार्तालाप प्रयोग गर्न अनुमति दिन्छन्। धेरै प्रयोगकर्तालाई थाहा छैन। धेरैलाई थाहा हुनुपर्छ।
यो खण्ड व्यावहारिक मार्गदर्शक हो। के भण्डारण हुन्छ, के हुँदैन, र काम साँच्चै गोप्य हुँदा के गर्ने।
२०२६ मा डिफल्ट व्यवहार
प्रमुख उपभोक्ता च्याटबटका लागि डिफल्ट लगभग यस्तो देखिन्छ:
- तपाईंको प्रम्प्ट प्रदायकको सर्भरमा पठाइन्छ। यो हुनुपर्छ — त्यहीँ मोडेल चल्छ।
- तपाईंको वार्तालाप कुनै अवधिका लागि भण्डारण हुन्छ (प्राय: ३० दिन, कहिलेकाहीं लामो, कहिलेकाहीं प्लानअनुसार अनिश्चित)।
- वार्तालाप भविष्यका मोडेल सुधार गर्न प्रयोग गर्न सकिन्छ — स्पष्ट रूपमा अप्ट-आउट नगरेसम्म।
- वार्तालापको सानो प्रतिशत मानव सुरक्षा/गुणस्तर टोलीहरूले समीक्षा गर्छन्।
यो “तपाईंको डाटा प्रकाशित छ” वा “कसैले पनि पढ्न सक्छ” जस्तो होइन। प्रमुख प्रदायकले सुरक्षालाई गम्भीरतापूर्वक लिन्छन्। तर डाटा तपाईंको यन्त्रबाट जान्छ, अरूका सर्भरमा बस्छ, र तपाईंलाई थाहा नभएका मानिसले छुन सक्छन्।
अधिकांश दैनिक प्रयोगका लागि — इमेल मस्यौदा, मन्थन, सामान्य प्रश्न सोध्ने — यो ठीक छ। जानकारी संवेदनशील थिएन। गोप्य प्रयोगका लागि ठीक छैन।
गोप्य के हो
काम गर्ने सूची। तपाईंले स्पष्ट रूपमा अन्यथा जाँचेको छैन भने निम्नलाई गोप्य मान्नुहोस्:
- अन्यका व्यक्तिगत डाटा। नाम, फोन नम्बर, ठेगाना, ग्राहक/बिरामी/विद्यार्थीका चिकित्सा रेकर्ड, वित्तीय रेकर्ड।
- व्यापार गोप्यता। आन्तरिक रणनीति कागजात, घोषित नभएको उत्पादन विवरण, वित्तीय अनुमान, कर्मचारी प्रदर्शन समीक्षा।
- व्यापार रहस्यसहितको स्रोत कोड वा घोषित नभएका सुरक्षा कमजोरी।
- सरकार-वर्गीकृत सामग्री। नेपालको आधिकारिक गोप्यता शासनअन्तर्गत गोप्य, सीमित, वा गुप्त भनिएको कुनै पनि कुरा।
- NDA अन्तर्गतको सामग्री। तपाईंले गैर-प्रकटीकरण हस्ताक्षर गर्नुभएको कुनै पनि कुरा।
- तपाईं अगाडिको पृष्ठमा देख्न सहज नहुने सामग्री।
सार्वजनिक सन्देश बोर्डमा नटाँस्ने भए डाटा सञ्चालन सर्तहरू स्पष्ट रूपमा जाँच नगरीकनै उपभोक्ता च्याटबटमा नटाँस्नुहोस्।
गोपनीयताका तीन स्तर, तीन सम्बन्धित उपकरण
व्यावहारिक ढाँचा।
स्तर १ — जे पनि चल्छ। सार्वजनिक सामग्री, सामान्य प्रश्न, कुनै गोप्य जानकारी छैन। तपाईं चाहेको कुनै पनि उपकरण प्रयोग गर्नुहोस्। डिफल्ट उपभोक्ता च्याटबट ठीक छन्।
स्तर २ — व्यापार गोप्य तर विनियमित होइन। आन्तरिक रणनीति, घोषित नभएको सामग्रीको मस्यौदा, व्यापार रहस्य बिनाको स्रोत कोड। व्यापार-स्तरको उपकरण प्रयोग गर्नुहोस् — ChatGPT Enterprise, Claude for Work, Microsoft Copilot Enterprise, Google Workspace AI सुविधा। यिनमा “हामी तपाईंको डाटामा तालिम दिनेछैनौं” स्पष्ट सर्त छन्। पढ्नुहोस्।
स्तर ३ — विनियमित, वर्गीकृत, वा साँच्चै संवेदनशील। बिरामी रेकर्ड, कानुनी कार्यवाही, वर्गीकृत सरकारी सामग्री, बैंकिङ ग्राहक डाटा। या त: (क) स्पष्ट नियामकीय अनुपालनसहितको उपकरण प्रयोग गर्नुहोस् (HIPAA, GDPR, बराबर स्थानीय ढाँचा), वा (ख) तपाईंको आफ्नै पूर्वाधारमा पूर्ण रूपमा चल्ने मोडेल प्रयोग गर्नुहोस् — खुला-स्रोत मोडेल जस्तै Llama, Mistral, वा Qwen, तपाईंको आफ्नै सर्भरमा तैनाथ।
स्तर ३ बाटो गाह्रो छ। यसलाई प्राविधिक सेटअप चाहिन्छ। यसले तपाईंलाई पूर्ण सार्वभौमिकता पनि दिन्छ — डाटा कहिल्यै तपाईंको नियन्त्रणबाट बाहिर जाँदैन। संवेदनशील नेपाली डाटा सञ्चालन गर्ने सङ्गठनहरू — अस्पताल, अदालत, बैंक, सरकार — का लागि यो एक मात्र स्वीकार्य बाटो हो।
“निजी” मोड स्विच
अधिकांश उपभोक्ता च्याटबटसँग अब “मेरा वार्तालाप मोडेल तालिमका लागि प्रयोग नगर्नुहोस्” जस्तो सेटिङ छ। फेला पार्नुहोस्। चालू गर्नुहोस्।
- ChatGPT — Settings → Data Controls → “Chat history & training” → off।
- Claude — Settings → Privacy → “Help improve Claude” → off।
- Gemini — तपाईंको Google खातामा गतिविधि नियन्त्रण।
यसले लगिङ हटाउँदैन। तपाईंको वार्तालाप दुरुपयोग समीक्षाका लागि ३० दिनसम्म राखिन सक्छ। तर यसले तालिम-डाटा जोखिम हटाउँछ र प्रदायकलाई संकेत दिन्छ कि तपाईं त्यो प्रयोगमा सहमत हुनुहुन्न।
व्यापार योजना (ChatGPT Team, Claude for Work, आदि) का लागि तपाईंको डाटामा तालिम डिफल्ट रूपमा बन्द छ। यो तपाईंले तिर्ने एक कुरा हो।
सङ्गठनका लागि काम गर्ने ढाँचा
तपाईंको सङ्गठनले जेनेरेटिभ एआई प्रयोग गर्छ भने सेट गर्न योग्य तीन नीति:
- तह प्रणाली। कुन डाटा कुन तहको उपकरणमा जाने निर्णय गर्नुहोस्। “सार्वजनिक डाटा → निःशुल्क ChatGPT। आन्तरिक डाटा → उद्यम उपकरण। ग्राहक डाटा → स्व-होस्ट मात्र।”
- तालिम अप्ट-आउट। उपभोक्ता प्रयोगका लागि पनि सबै कर्मचारीले आफ्नो खातामा तालिम अप्ट-आउट टगल गरेको सुनिश्चित गर्नुहोस्।
- रेड-लाइन सूची। कुनै पनि बाह्य उपकरणमा कहिल्यै नटाँसिनुपर्ने श्रेणीहरूको स्पष्ट सूची। छोटो बनाउनुहोस्। विशिष्ट बनाउनुहोस्। यसमा मानिसहरूलाई तालिम दिनुहोस्।
यी तीन नीतिले अधिकांश यथार्थवादी जोखिम ढाक्छन्। गाह्रो भाग नीति होइन — यो टाँस्नुअघि मानिसले वास्तवमा रोक्ने संस्कृति सिर्जना गर्नु हो।
स्व-होस्ट मोडेल: सार्वभौम विकल्प
गोप्य कामका लागि सबैभन्दा सुरक्षित छनोट तपाईंले नियन्त्रण गर्ने पूर्वाधारमा मोडेल चलाउनु हो।
यो पहिले अव्यावहारिक थियो — फ्रन्टियर मोडेलले विशाल गणना चाहिन्थ्यो। २०२६ मा अवस्था बदलिएको छ:
- खुला-स्रोत मोडेलहरू (Llama 3.1+, Qwen 2.5+, Mistral Large) फ्रन्टियर क्षमतामा पुग्छन् र चलाउन निःशुल्क हुन्।
- उचित रूपमा स्पेस गरिएको सर्भरले उपयोगी मोडेल होस्ट गर्न सक्छ — फ्रन्टियर च्याटबट भन्दा ढिलो, तर निजी।
- साना मोडेल (७-८ अर्ब प्यारामिटर) एकल GPU मा चल्छन्; ठूला (७०-४०५B) लाई धेरै GPU चाहिन्छ।
- होस्टिङ सेवा (Together, Anyscale, RunPod, स्थानीयका लागि Ollama) ले गहिरो ML विशेषज्ञता बिना तैनाथी पहुँचयोग्य बनाउँछ।
संवेदनशील डाटा सञ्चालन गर्ने नेपाली संस्थाहरूका लागि यो बाटो महत्त्वपूर्ण छ। नेपाली स्वास्थ्य मन्त्रालयले US-होस्टेड मोडेलमा निदान प्रम्प्ट चलाउनु हुँदैन। नेपाली कानुन फर्मले ChatGPT मा ग्राहक गोप्य सामग्री अपलोड गर्नुहुँदैन। स्व-होस्ट मोडेलको प्राविधिक बार पर्याप्त घटेको छ कि यो अब व्यावहारिक छलफल हो, इच्छा सूची होइन।
व्यक्तिगत बानी
व्यक्तिगत प्रयोगकर्ताका लागि तीन बानीले अधिकांश जोखिम ढाक्छन्:
- तपाईंले प्रयोग गर्ने हरेक उपभोक्ता उपकरणमा तालिम अप्ट-आउट टगल गर्नुहोस्।
- तपाईंले टाँस्न इन्कार गर्ने प्रकारको जानकारीको मानसिक सूची राख्नुहोस्।
- गोप्य कामका लागि स्पष्ट गोपनीयता सर्तसहितको उपकरण प्रयोग गर्नुहोस् — महँगो भए पनि।
यी तीन बानी निरन्तर अभ्यास गरिँदा व्यक्तिगत गोपनीयता जोखिमको ठूलो अंश हटाउँछन्। बाँकी जोखिम सञ्चालन हो (गलत क्लिक, असावधानीको क्षण) — र संवेदनशील टाँस्न अघि सावधान भएर सञ्चालन गरिन्छ।
आफ्नो बुझाइ जाँच्नुहोस्
छोटो जाँच
—काठमाडौंको अस्पतालका डाक्टर बिरामी केस नोट सारांश गर्न जेनेरेटिभ एआई प्रयोग गर्न चाहन्छन्। नोटमा पहिचान योग्य बिरामी जानकारी छ। सबैभन्दा उपयुक्त उपकरण छनोट के हो?
अब के?
हामीले गोपनीयता ढाक्यौं। अर्को खण्ड तपाईंको प्रयोगमा इमानदारी बारे हो — उद्धरण, खुलासा, साहित्यिक चोरी, र विद्यालय, रोजगारदाता, र ग्राहकहरूले जेनेरेटिभ एआई वरिपरि अझै काम गरिरहेका इमानदारी प्रश्न।