ailiteracynepal 🇳🇵
पाठ आकार

अध्याय २ · खण्ड II · 14 मिनेट

उदाहरणले देखाउने

कहिलेकाहीं एउटा राम्रो उदाहरण अनुच्छेद निर्देशनभन्दा महत्त्वपूर्ण हुन्छ। few-shot प्रम्प्टिङ नामक प्रविधि, र यो कहिले प्रयोग गर्ने।

अघिल्लो खण्ड बताउने बारेमा थियो। यो खण्ड देखाउने बारेमा छ। धेरै कार्यका लागि — विशेष गरी सही आउटपुट शब्दमा वर्णन गर्न गाह्रो हुने — मोडेललाई एक-दुई उदाहरण देखाउँदा कुनै पनि निर्देशनभन्दा नाटकीय रूपमा राम्रो परिणाम आउँछ।

यो तकनिकलाई few-shot प्रम्प्टिङ भनिन्छ। फेन्सी नामले सरल विचार लुकाउँछ: तपाईंको प्रम्प्टमा १-५ काम गरिएका इनपुट → आउटपुट उदाहरण समावेश गर्नुहोस्, अनि मोडेललाई नयाँ इनपुट दिनुहोस्। यसले उदाहरणबाट ढाँचा तत्काल सिक्छ।

निर्देशन सङ्घर्ष गर्ने केस

कल्पना गर्नुहोस् तपाईं नेपाली रेस्टुरेन्टको ग्राहक फिडब्याकलाई तीन वर्गमा वर्गीकरण गर्न चाहनुहुन्छ: प्रशंसा, उजुरी, सुझाव। तपाईं प्रम्प्ट लेख्नुहुन्छ:

प्रत्येक फिडब्याकलाई प्रशंसा, उजुरी, वा सुझावमा वर्गीकरण गर्नुहोस्।

फिडब्याक: “मोमो धेरै राम्रो थियो तर तातो थिएन।”

मोडेलले केही उत्तर दिनेछ — तर निरन्तर रूपमा होइन। “मोमो राम्रो थियो तर चिसो” प्रशंसा (राम्रो थियो) हो कि उजुरी (चिसो थियो) हो? फरक मोडेलले फरक छान्नेछन्। उही मोडेलले फरक दिनमा फरक छान्नेछ।

अब उदाहरणसँग प्रयास गर्नुहोस्:

प्रत्येक फिडब्याकलाई प्रशंसा, उजुरी, वा सुझावमा वर्गीकरण गर्नुहोस्।

उदाहरण:

  • “खाना मीठो थियो।” → प्रशंसा
  • “सेवा ढिलो थियो।” → उजुरी
  • “मेनुमा पनिर थप्नुहोस्।” → सुझाव
  • “भोलि पनि आउनेछु।” → प्रशंसा
  • “प्लेट सफा थिएन।” → उजुरी

फिडब्याक: “मोमो धेरै राम्रो थियो तर तातो थिएन।”

मोडेलले अब ढाँचा देख्छ: फिडब्याकमा सकारात्मक र नकारात्मक मिसिँदा खानाको गुणस्तरबारेका उजुरी प्रशंसामाथि जित्छन्। यसले निरन्तर उजुरी छनोट गर्छ। उही मोडेल, उही कार्य, फरक प्रम्प्ट — धेरै बढी विश्वसनीय आउटपुट।

Few-shot कहिले प्रयोग गर्ने

रफ नियम। यी अवस्थामा few-shot तर्फ हात बढाउनुहोस्:

  1. कार्य दोहोरिने। तपाईं धेरै इनपुटमा उही रूपान्तरण लागू गर्दै हुनुहुन्छ। उदाहरणले निरन्तर आउटपुट लक गर्छन्।
  2. आउटपुट ढाँचा सटीक। JSON, तालिका, सारांशको विशिष्ट शैली। उदाहरण वर्णनभन्दा महत्त्वपूर्ण हुन्छ।
  3. सही उत्तर सूक्ष्म। माथिको चिसो-मोमो जस्तो केस, जहाँ उचित मानिसले बहस गर्न सक्छन्। उदाहरणले तपाईंको न्याय देखाउँछन्।
  4. विशिष्ट शैली चाहिने। “नेपाली पत्रिकाको सम्पादकीयजस्तो लेख” अस्पष्ट छ; पत्रिका सम्पादकीयका दुई अनुच्छेद देखाउनु सटीक छ।

यी केसमा few-shot छोड्नुहोस्:

  • कार्य एक पटकको हो (तपाईंलाई निरन्तरता चाहिँदैन)।
  • कार्य यति खुला छ कि उदाहरणले मोडेललाई अति सीमित गर्थ्यो।
  • तपाईंसँग उदाहरण छैनन् र छिटो बनाउन सक्नुहुन्न।

उदाहरण: संरचित डाटा निकाल्ने

एक सामान्य व्यावहारिक प्रयोग: तपाईंसँग ५० लाइनको फोहोर ग्राहक फिडब्याक छ, र तपाईं ती सफा तालिकामा चाहनुहुन्छ। निर्देशन एक्लै शोरमय छ; few-shot यसलाई निर्धारणीय बनाउँछ।

प्रम्प्ट:

प्रत्येक फिडब्याकबाट निकाल्नुहोस्: श्रेणी (प्रशंसा/उजुरी/सुझाव), भावना (सकारात्मक/तटस्थ/नकारात्मक), र एक-वाक्यको अंग्रेजी सारांश। JSON वस्तुको रूपमा निकाल्नुहोस्।

उदाहरण:

इनपुट: “खाना मीठो थियो र बेरा पनि नम्र हुनुहुन्थ्यो।” आउटपुट: {"category": "praise", "sentiment": "positive", "summary": "Food was tasty and the waiter was polite."}

इनपुट: “एक घण्टा कुर्नुपर्‍यो, खानाको रंग पनि अनौठो थियो।” आउटपुट: {"category": "complaint", "sentiment": "negative", "summary": "Long wait and unusual-looking food."}

इनपुट: “वेज मोमोको चटनी अलि पिरो बनाउनुहोस्।” आउटपुट: {"category": "suggestion", "sentiment": "neutral", "summary": "Make the veg momo chutney spicier."}

अब निम्न ५० फिडब्याकलाई उही ढाँचामा प्रशोधन गर्नुहोस्:

तपाईंले फिर्ता पाउने उच्च विश्वसनीयतासहित ५० JSON वस्तु हुन्, जुन तपाईं सीधै स्प्रेडसिटमा टाँस्न सक्नुहुन्छ। उदाहरण बिना, असङ्गत क्षेत्र, नेपालीमा अंग्रेजी सारांश, सुझाव लेबल लगाइएका उजुरी पाउनुहुने थियो — हातले फिक्स गर्ने काम जसले समय बचत मेटाउँछ।

यो किन काम गर्छ

प्राविधिक नाम in-context learning हो। मोडेलले तपाईंका उदाहरणबाट आफ्ना भारहरू बदल्दैन — यो तीन उदाहरणमा “तालिम पाएको” होइन। तर ती उदाहरणलाई सन्दर्भको रूपमा सर्तसहित, अर्को-टोकन भविष्यवाणी ती ढाँचामा धेरै केन्द्रित बन्छ। मानौं मोडेल वार्तालापको अवधिका लागि छोटो रूपमा विशेषज्ञ बन्छ।

यो आधुनिक ठूला भाषा मोडेलको सबैभन्दा उल्लेखनीय गुणमध्ये एक हो, र पहिलो पटक देखापर्दा अप्रत्याशित थियो। साना मोडेलले यो दृढ रूपमा देखाउँदैनन्। फ्रन्टियर मोडेलले अद्भुत रूपमा देखाउँछन्।

उदाहरण कसरी छनोट गर्ने

राम्रो few-shot प्रम्प्ट उत्पादन गर्ने तीन बानी:

  1. एज केस ढाक्नुहोस्। अस्पष्ट श्रेणी छ — जस्तै प्रशंसा-मिश्रित-उजुरी — भने प्रत्येक पक्षको एक उदाहरण समावेश गर्नुहोस्। तपाईंको टाइ-ब्रेकिङ नियम मोडेललाई अनुमान गर्न नछोड्नुहोस्।

  2. इनपुट वितरण मिलाउनुहोस्। तपाईंका वास्तविक इनपुट ८०% नेपाली र २०% अंग्रेजी छन् भने उदाहरणले पनि त्यही प्रतिबिम्बित गर्नुपर्छ। नेपाली इनपुटका लागि अंग्रेजी-मात्र उदाहरण नप्रयोग गर्नुहोस्।

  3. उदाहरण छोटो राख्नुहोस्। लामा उदाहरणले टोकन खेर फाल्छन्। ढाँचा देखाउने न्यूनतम उदाहरण प्रयोग गर्नुहोस्।

उपयोगी विवेक जाँच: कार्य कहिल्यै नदेखेको विचारशील मानवलाई प्रम्प्ट सुम्पनुहोस्। के उदाहरण मात्र उनीहरूलाई अर्को केस गर्न पर्याप्त हुन्थ्यो? हो भने मोडेल पनि सक्छ।

Few-shot कहिले जाल हो

एक वास्तविक असफलता मोड। तपाईंका उदाहरण विशिष्ट दिशामा पूर्वाग्रही छन् — मानौं तपाईंले तीनै प्रशंसा को उदाहरण लिनुभयो — मोडेलले अस्पष्ट नयाँ इनपुटका लागि प्रशंसा तर्फ झुक्नेछ। तपाईंका उदाहरणको पूर्वाग्रह आउटपुटको पूर्वाग्रह बन्छ।

समाधान उदाहरणलाई सन्तुलित गर्ने हो: श्रेणीहरूमा लगभग बराबर प्रतिनिधित्व, एज केसको स्वीकार। यो एआईको परिचय पाठ्यक्रममा हामीले तालिम डाटाबारे देखेको उही सिद्धान्त हो — मोडेलले देखाएको कुरा मात्र जान्दछ, र तपाईंका few-shot उदाहरण सानो, छिटो तालिम सेट हुन्।

आफ्नो बुझाइ जाँच्नुहोस्

छोटो जाँच

Few-shot प्रम्प्टिङ (प्रम्प्टमा १-५ काम गरिएका उदाहरण देखाउने) विशेष गरी प्रभावकारी हुन्छ जब:

अब के?

हामीसँग प्रम्प्टिङका आधार र few-shot तकनिक छ। अर्को खण्ड आउटपुट चाहिएको नभए के गर्ने बारे हो — आफ्ना प्रम्प्ट डिबग गर्ने, पुनरावृत्ति, र अड्किएको मोडेललाई फुकाउने तकनिकको सानो सङ्ग्रह।