नोएडा शाखा पर IAS GS फाउंडेशन का नया बैच 9 दिसंबर से शुरू:   अभी कॉल करें
ध्यान दें:

डेली अपडेट्स


प्रारंभिक परीक्षा

लार्ज लैंग्वेज मॉडल

  • 29 Feb 2024
  • 8 min read

स्रोत: इंडियन एक्सप्रेस 

उन्नत कृत्रिम बुद्धिमत्ता के युग में, लार्ज लैंग्वेज मॉडल के उद्भव ने कंप्यूटर के मनुष्यों के साथ इंटरैक्शन, उनकी भाषा समझने और भाषा को संसाधित करने की पद्धति में क्रांति ला दी है। आभासी संवाद को उन्नत करने से लेकर रचनात्मक कार्यों को सशक्त बनाने तक, LLM ने AI प्रौद्योगिकी के क्षेत्र में एक नई सीमा का मार्ग प्रशस्त किया है।

लार्ज लैंग्वेज मॉडल (LLM) क्या हैं?

  • परिभाषा: 
    • LLMs सामान्य प्रयोजन भाषा मॉडल हैं जो टेक्स्ट क्लासिफिकेशन, प्रश्नोत्तर और टेक्स्ट जनरेशन जैसी सामान्य भाषा समस्याओं को हल करने में सक्षम हैं।
    • इन मॉडलों को मानव भाषा के भीतर पैटर्न, संरचनाओं और संबंधों को समझने के लिये बड़े पैमाने पर डेटासेट पर ट्रेन अर्थात् प्रशिक्षित किया जाता है।
  • लार्ज लैंग्वेज मॉडल (LLM) के प्रकार 
    • आर्किटेक्चर पर आधारित:
      • ऑटोरेग्रेसिव मॉडल: पूर्व शब्दों के आधार पर अनुक्रम में आगामी शब्द का प्रेडिक्शन/पूर्वानुमान करना। उदाहरण: GPT-3
      • ट्रांसफॉर्मर-आधारित मॉडल: भाषा प्रसंस्करण के लिये एक विशिष्ट कृत्रिम न्यूरल नेटवर्क आर्किटेक्चर का प्रयोग करना। उदाहरण: LaMDA, जेमिनी (जिसे पहले Bard के रूप में जाना जाता था)। एनकोडर-डिकोडर मॉडल: इनपुट टेक्स्ट को एक रिप्रजेंटेशन में एनकोड कर पुनः इसे किसी अन्य भाषा या प्रारूप में डीकोड करना।
    • ट्रेनिंग डेटा पर आधारित:
      • पूर्व-प्रशिक्षित और फाइन-ट्यून किये गए मॉडल: विशेष डेटासेट पर फाइन-ट्यूनिंग के माध्यम से विशिष्ट कार्यों के अनुरूप रूपांतरण करना।
      • मल्टी-लैंग्वेज मॉडल: कई भाषाओं में टेक्स्ट को समझने और उत्पन्न करने में सक्षम।
      • डोमेन-विशिष्ट मॉडल: कानूनी, वित्त या स्वास्थ्य देखभाल जैसे विशिष्ट डोमेन से संबंधित डेटा के आधार पर प्रशिक्षित।
    • आकार और उपलब्धता के आधार पर:
      • आकार: बड़े मॉडलों को अधिक कंप्यूटेशनल संसाधनों की आवश्यकता होती है लेकिन वे बेहतर प्रदर्शन प्रदान करते हैं।
      • उपलब्धता: ओपन-सोर्स मॉडल सार्वजनिक उपलब्ध हैं, जबकि क्लोज-सोर्स मॉडल स्वामित्व के अधीन हैं।
  • LLM के परिचालन तंत्र:
    • अपने मूल में LLM पूर्ववर्ती पाठ में दिये गए शब्दों या अनुक्रमों की संभावना का पूर्वानुमान करने के लिये गहन शिक्षण तकनीकों का उपयोग करते हैं।
      • LLM इनपुट संकेतों के आधार पर अगले शब्द या अनुक्रम का पूर्वानुमान करने के लिये डेटा में पैटर्न और संबंधों का विश्लेषण करते हैं, जैसे मनुष्य भाषा को कैसे समझते हैं।
      • LLM आम तौर पर प्रासंगिक समझ के लिये ध्यान तंत्र के साथ जेनरेटर प्री-ट्रेंड ट्रांसफार्मर (GPT) जैसे ट्रांसफॉर्मर मॉडल पर विश्वास करते हैं।
  • LLM  के अनुप्रयोग:
    • LLM कहानियों से लेकर कविता और गीतों तक मानव-जैसी विषय वस्तु उत्पन्न करते हैं तथा आभासी सहायक के रूप में कार्य करते हैं, जो विपणन रणनीतियों के लिये महत्त्वपूर्ण भावना विश्लेषण, अनुवाद एवं पाठ सारांश में उत्कृष्ट हैं।
  • LLM  के लाभ:
    • LLM पैटर्न को सामान्य बनाने के लिये अपने व्यापक प्रशिक्षण डेटा का लाभ उठाते हुए, विभिन्न कार्यों और डोमेन को अनुकूलित कर सकते हैं।
    • सामान्य भाषा प्रशिक्षण डेटासेट से सीखने की उनकी क्षमता के कारण, वे सीमित डोमेन-विशिष्ट डेटा के साथ भी अच्छा प्रदर्शन कर सकते हैं।
    • जैसे-जैसे अधिक डेटा और पैरामीटर जोड़े जाते हैं, LLM लगातार अपने प्रदर्शन को बढ़ाते हैं, जिससे वे विकसित AI परिदृश्य में मूल्यवान परिसंपत्‍ति बन जाते हैं।

लार्ज एक्शन मॉडल (LAM) क्या हैं?

  • LAM विशिष्ट AI मॉडल होते हैं जो टेक्स्ट को समझने और परिणाम उत्पन्न करने के अतिरिक्त विशिष्ट कार्यों अथवा क्रियाओं के अनुक्रम को निष्पादित करने के लिये बनाए जाते हैं।
    • LAM मानव विचारों को समझ सकते हैं और इस समझ को कार्रवाई योग्य चरणों में परिवर्तित कर सकते हैं। LAM को दोहराए जाने वाले कार्यों में मदद करने के लिये डिज़ाइन किया गया है।
  • इन्हें टेक्स्ट, छवि अथवा डेटा के अन्य रूप जैसे इनपुट के आधार पर कार्यों को निष्पादित करने के लिये डिज़ाइन किया गया है।
  • LAM का उपयोग विभिन्न अनुप्रयोगों, जैसे- वर्चुअल असिस्टेंट, रोबोटिक सिस्टम, स्वचालित ग्राहक सेवा इत्यादि में किया जा सकता है।
  • LAM का उदाहरण: रैबिटr1
  • इन मॉडलों को डेटासेट पर प्रशिक्षित किया जाता है जिसमें दिये गए संदर्भों के आधार पर कार्य करने का तरीका सीखने के लिये भाषाई जानकारी और क्रिया-उन्मुख डेटा दोनों शामिल होते हैं।

  UPSC सिविल सेवा परीक्षा, वित्त वर्ष के प्रश्न  

प्रिलिम्स:

प्रश्न. विकास की वर्तमान स्थिति में, कृत्रिम बुद्धिमत्ता (Artificial Intelligence), निम्नलिखित में से किस कार्य को प्रभावी रूप से कर सकती है? (2020)

  1. औद्योगिक इकाइयों में विद्युत की खपत कम करना 
  2. सार्थक लघु कहानियों और गीतों की रचना  
  3. रोगों का निदान 
  4. टेक्स्ट से स्पीच (Text-to-Speech) में परिवर्तन 
  5. विद्युत ऊर्जा का बेतार संचरण

नीचे दिये गए कूट का प्रयोग कर सही उत्तर चुनिये:

(a) केवल 1, 2, 3 और 5
(b) केवल 1, 3 और 4
(c) केवल 2, 4 और 5
(d) 1, 2, 3, 4 और 5

उत्तर: (b)


प्रश्न. "चौथी औद्योगिक क्रांति (डिजिटल क्रांति) के प्रादुर्भाव ने ई-गवर्नेंस को सरकार का अविभाज्य अंग बनाने में पहल की है"। विवेचन कीजिये। (2020)

close
एसएमएस अलर्ट
Share Page
images-2
images-2
× Snow