लार्ज लैंग्वेज मॉडल | 29 Feb 2024
स्रोत: इंडियन एक्सप्रेस
उन्नत कृत्रिम बुद्धिमत्ता के युग में, लार्ज लैंग्वेज मॉडल के उद्भव ने कंप्यूटर के मनुष्यों के साथ इंटरैक्शन, उनकी भाषा समझने और भाषा को संसाधित करने की पद्धति में क्रांति ला दी है। आभासी संवाद को उन्नत करने से लेकर रचनात्मक कार्यों को सशक्त बनाने तक, LLM ने AI प्रौद्योगिकी के क्षेत्र में एक नई सीमा का मार्ग प्रशस्त किया है।
लार्ज लैंग्वेज मॉडल (LLM) क्या हैं?
- परिभाषा:
- LLMs सामान्य प्रयोजन भाषा मॉडल हैं जो टेक्स्ट क्लासिफिकेशन, प्रश्नोत्तर और टेक्स्ट जनरेशन जैसी सामान्य भाषा समस्याओं को हल करने में सक्षम हैं।
- इन मॉडलों को मानव भाषा के भीतर पैटर्न, संरचनाओं और संबंधों को समझने के लिये बड़े पैमाने पर डेटासेट पर ट्रेन अर्थात् प्रशिक्षित किया जाता है।
- लार्ज लैंग्वेज मॉडल (LLM) के प्रकार
- आर्किटेक्चर पर आधारित:
- ऑटोरेग्रेसिव मॉडल: पूर्व शब्दों के आधार पर अनुक्रम में आगामी शब्द का प्रेडिक्शन/पूर्वानुमान करना। उदाहरण: GPT-3
- ट्रांसफॉर्मर-आधारित मॉडल: भाषा प्रसंस्करण के लिये एक विशिष्ट कृत्रिम न्यूरल नेटवर्क आर्किटेक्चर का प्रयोग करना। उदाहरण: LaMDA, जेमिनी (जिसे पहले Bard के रूप में जाना जाता था)। एनकोडर-डिकोडर मॉडल: इनपुट टेक्स्ट को एक रिप्रजेंटेशन में एनकोड कर पुनः इसे किसी अन्य भाषा या प्रारूप में डीकोड करना।
- ट्रेनिंग डेटा पर आधारित:
- पूर्व-प्रशिक्षित और फाइन-ट्यून किये गए मॉडल: विशेष डेटासेट पर फाइन-ट्यूनिंग के माध्यम से विशिष्ट कार्यों के अनुरूप रूपांतरण करना।
- मल्टी-लैंग्वेज मॉडल: कई भाषाओं में टेक्स्ट को समझने और उत्पन्न करने में सक्षम।
- डोमेन-विशिष्ट मॉडल: कानूनी, वित्त या स्वास्थ्य देखभाल जैसे विशिष्ट डोमेन से संबंधित डेटा के आधार पर प्रशिक्षित।
- आकार और उपलब्धता के आधार पर:
- आकार: बड़े मॉडलों को अधिक कंप्यूटेशनल संसाधनों की आवश्यकता होती है लेकिन वे बेहतर प्रदर्शन प्रदान करते हैं।
- उपलब्धता: ओपन-सोर्स मॉडल सार्वजनिक उपलब्ध हैं, जबकि क्लोज-सोर्स मॉडल स्वामित्व के अधीन हैं।
- ओपन-सोर्स LLM के उदाहरण: LLaMA2, BlOOM, Google BERT, Falcon 180B, OPT-175 B
- क्लोज-सोर्स LLM के उदाहरण: OpenAI द्वारा GPT 3.5, गूगल द्वारा जेमिनी।
- आर्किटेक्चर पर आधारित:
- LLM के परिचालन तंत्र:
- अपने मूल में LLM पूर्ववर्ती पाठ में दिये गए शब्दों या अनुक्रमों की संभावना का पूर्वानुमान करने के लिये गहन शिक्षण तकनीकों का उपयोग करते हैं।
- LLM इनपुट संकेतों के आधार पर अगले शब्द या अनुक्रम का पूर्वानुमान करने के लिये डेटा में पैटर्न और संबंधों का विश्लेषण करते हैं, जैसे मनुष्य भाषा को कैसे समझते हैं।
- LLM आम तौर पर प्रासंगिक समझ के लिये ध्यान तंत्र के साथ जेनरेटर प्री-ट्रेंड ट्रांसफार्मर (GPT) जैसे ट्रांसफॉर्मर मॉडल पर विश्वास करते हैं।
- अपने मूल में LLM पूर्ववर्ती पाठ में दिये गए शब्दों या अनुक्रमों की संभावना का पूर्वानुमान करने के लिये गहन शिक्षण तकनीकों का उपयोग करते हैं।
- LLM के अनुप्रयोग:
- LLM कहानियों से लेकर कविता और गीतों तक मानव-जैसी विषय वस्तु उत्पन्न करते हैं तथा आभासी सहायक के रूप में कार्य करते हैं, जो विपणन रणनीतियों के लिये महत्त्वपूर्ण भावना विश्लेषण, अनुवाद एवं पाठ सारांश में उत्कृष्ट हैं।
- LLM के लाभ:
- LLM पैटर्न को सामान्य बनाने के लिये अपने व्यापक प्रशिक्षण डेटा का लाभ उठाते हुए, विभिन्न कार्यों और डोमेन को अनुकूलित कर सकते हैं।
- सामान्य भाषा प्रशिक्षण डेटासेट से सीखने की उनकी क्षमता के कारण, वे सीमित डोमेन-विशिष्ट डेटा के साथ भी अच्छा प्रदर्शन कर सकते हैं।
- जैसे-जैसे अधिक डेटा और पैरामीटर जोड़े जाते हैं, LLM लगातार अपने प्रदर्शन को बढ़ाते हैं, जिससे वे विकसित AI परिदृश्य में मूल्यवान परिसंपत्ति बन जाते हैं।
लार्ज एक्शन मॉडल (LAM) क्या हैं?
|
UPSC सिविल सेवा परीक्षा, वित्त वर्ष के प्रश्नप्रिलिम्स:प्रश्न. विकास की वर्तमान स्थिति में, कृत्रिम बुद्धिमत्ता (Artificial Intelligence), निम्नलिखित में से किस कार्य को प्रभावी रूप से कर सकती है? (2020)
नीचे दिये गए कूट का प्रयोग कर सही उत्तर चुनिये: (a) केवल 1, 2, 3 और 5 उत्तर: (b) प्रश्न. "चौथी औद्योगिक क्रांति (डिजिटल क्रांति) के प्रादुर्भाव ने ई-गवर्नेंस को सरकार का अविभाज्य अंग बनाने में पहल की है"। विवेचन कीजिये। (2020) |