लार्ज लैंग्वेज मॉडल | 29 Feb 2024

स्रोत: इंडियन एक्सप्रेस 

उन्नत कृत्रिम बुद्धिमत्ता के युग में, लार्ज लैंग्वेज मॉडल के उद्भव ने कंप्यूटर के मनुष्यों के साथ इंटरैक्शन, उनकी भाषा समझने और भाषा को संसाधित करने की पद्धति में क्रांति ला दी है। आभासी संवाद को उन्नत करने से लेकर रचनात्मक कार्यों को सशक्त बनाने तक, LLM ने AI प्रौद्योगिकी के क्षेत्र में एक नई सीमा का मार्ग प्रशस्त किया है।

लार्ज लैंग्वेज मॉडल (LLM) क्या हैं?

  • परिभाषा: 
    • LLMs सामान्य प्रयोजन भाषा मॉडल हैं जो टेक्स्ट क्लासिफिकेशन, प्रश्नोत्तर और टेक्स्ट जनरेशन जैसी सामान्य भाषा समस्याओं को हल करने में सक्षम हैं।
    • इन मॉडलों को मानव भाषा के भीतर पैटर्न, संरचनाओं और संबंधों को समझने के लिये बड़े पैमाने पर डेटासेट पर ट्रेन अर्थात् प्रशिक्षित किया जाता है।
  • लार्ज लैंग्वेज मॉडल (LLM) के प्रकार 
    • आर्किटेक्चर पर आधारित:
      • ऑटोरेग्रेसिव मॉडल: पूर्व शब्दों के आधार पर अनुक्रम में आगामी शब्द का प्रेडिक्शन/पूर्वानुमान करना। उदाहरण: GPT-3
      • ट्रांसफॉर्मर-आधारित मॉडल: भाषा प्रसंस्करण के लिये एक विशिष्ट कृत्रिम न्यूरल नेटवर्क आर्किटेक्चर का प्रयोग करना। उदाहरण: LaMDA, जेमिनी (जिसे पहले Bard के रूप में जाना जाता था)। एनकोडर-डिकोडर मॉडल: इनपुट टेक्स्ट को एक रिप्रजेंटेशन में एनकोड कर पुनः इसे किसी अन्य भाषा या प्रारूप में डीकोड करना।
    • ट्रेनिंग डेटा पर आधारित:
      • पूर्व-प्रशिक्षित और फाइन-ट्यून किये गए मॉडल: विशेष डेटासेट पर फाइन-ट्यूनिंग के माध्यम से विशिष्ट कार्यों के अनुरूप रूपांतरण करना।
      • मल्टी-लैंग्वेज मॉडल: कई भाषाओं में टेक्स्ट को समझने और उत्पन्न करने में सक्षम।
      • डोमेन-विशिष्ट मॉडल: कानूनी, वित्त या स्वास्थ्य देखभाल जैसे विशिष्ट डोमेन से संबंधित डेटा के आधार पर प्रशिक्षित।
    • आकार और उपलब्धता के आधार पर:
      • आकार: बड़े मॉडलों को अधिक कंप्यूटेशनल संसाधनों की आवश्यकता होती है लेकिन वे बेहतर प्रदर्शन प्रदान करते हैं।
      • उपलब्धता: ओपन-सोर्स मॉडल सार्वजनिक उपलब्ध हैं, जबकि क्लोज-सोर्स मॉडल स्वामित्व के अधीन हैं।
  • LLM के परिचालन तंत्र:
    • अपने मूल में LLM पूर्ववर्ती पाठ में दिये गए शब्दों या अनुक्रमों की संभावना का पूर्वानुमान करने के लिये गहन शिक्षण तकनीकों का उपयोग करते हैं।
      • LLM इनपुट संकेतों के आधार पर अगले शब्द या अनुक्रम का पूर्वानुमान करने के लिये डेटा में पैटर्न और संबंधों का विश्लेषण करते हैं, जैसे मनुष्य भाषा को कैसे समझते हैं।
      • LLM आम तौर पर प्रासंगिक समझ के लिये ध्यान तंत्र के साथ जेनरेटर प्री-ट्रेंड ट्रांसफार्मर (GPT) जैसे ट्रांसफॉर्मर मॉडल पर विश्वास करते हैं।
  • LLM  के अनुप्रयोग:
    • LLM कहानियों से लेकर कविता और गीतों तक मानव-जैसी विषय वस्तु उत्पन्न करते हैं तथा आभासी सहायक के रूप में कार्य करते हैं, जो विपणन रणनीतियों के लिये महत्त्वपूर्ण भावना विश्लेषण, अनुवाद एवं पाठ सारांश में उत्कृष्ट हैं।
  • LLM  के लाभ:
    • LLM पैटर्न को सामान्य बनाने के लिये अपने व्यापक प्रशिक्षण डेटा का लाभ उठाते हुए, विभिन्न कार्यों और डोमेन को अनुकूलित कर सकते हैं।
    • सामान्य भाषा प्रशिक्षण डेटासेट से सीखने की उनकी क्षमता के कारण, वे सीमित डोमेन-विशिष्ट डेटा के साथ भी अच्छा प्रदर्शन कर सकते हैं।
    • जैसे-जैसे अधिक डेटा और पैरामीटर जोड़े जाते हैं, LLM लगातार अपने प्रदर्शन को बढ़ाते हैं, जिससे वे विकसित AI परिदृश्य में मूल्यवान परिसंपत्‍ति बन जाते हैं।

लार्ज एक्शन मॉडल (LAM) क्या हैं?

  • LAM विशिष्ट AI मॉडल होते हैं जो टेक्स्ट को समझने और परिणाम उत्पन्न करने के अतिरिक्त विशिष्ट कार्यों अथवा क्रियाओं के अनुक्रम को निष्पादित करने के लिये बनाए जाते हैं।
    • LAM मानव विचारों को समझ सकते हैं और इस समझ को कार्रवाई योग्य चरणों में परिवर्तित कर सकते हैं। LAM को दोहराए जाने वाले कार्यों में मदद करने के लिये डिज़ाइन किया गया है।
  • इन्हें टेक्स्ट, छवि अथवा डेटा के अन्य रूप जैसे इनपुट के आधार पर कार्यों को निष्पादित करने के लिये डिज़ाइन किया गया है।
  • LAM का उपयोग विभिन्न अनुप्रयोगों, जैसे- वर्चुअल असिस्टेंट, रोबोटिक सिस्टम, स्वचालित ग्राहक सेवा इत्यादि में किया जा सकता है।
  • LAM का उदाहरण: रैबिटr1
  • इन मॉडलों को डेटासेट पर प्रशिक्षित किया जाता है जिसमें दिये गए संदर्भों के आधार पर कार्य करने का तरीका सीखने के लिये भाषाई जानकारी और क्रिया-उन्मुख डेटा दोनों शामिल होते हैं।

  UPSC सिविल सेवा परीक्षा, वित्त वर्ष के प्रश्न  

प्रिलिम्स:

प्रश्न. विकास की वर्तमान स्थिति में, कृत्रिम बुद्धिमत्ता (Artificial Intelligence), निम्नलिखित में से किस कार्य को प्रभावी रूप से कर सकती है? (2020)

  1. औद्योगिक इकाइयों में विद्युत की खपत कम करना 
  2. सार्थक लघु कहानियों और गीतों की रचना  
  3. रोगों का निदान 
  4. टेक्स्ट से स्पीच (Text-to-Speech) में परिवर्तन 
  5. विद्युत ऊर्जा का बेतार संचरण

नीचे दिये गए कूट का प्रयोग कर सही उत्तर चुनिये:

(a) केवल 1, 2, 3 और 5
(b) केवल 1, 3 और 4
(c) केवल 2, 4 और 5
(d) 1, 2, 3, 4 और 5

उत्तर: (b)


प्रश्न. "चौथी औद्योगिक क्रांति (डिजिटल क्रांति) के प्रादुर्भाव ने ई-गवर्नेंस को सरकार का अविभाज्य अंग बनाने में पहल की है"। विवेचन कीजिये। (2020)