जीपीटी-4o | 16 May 2024

स्रोत: इंडियन एक्सप्रेस

चर्चा में क्यों? 

हाल ही में OpenAI ने जीपीटी-4o नाम से अपना नवीनतम लार्ज लैंग्वेज मॉडल (LLM) लॉन्च किया, इसे अब तक का सबसे तेज़ और सबसे शक्तिशाली AI मॉडल बताया गया है।

जीपीटी-4o के बारे में मुख्य बातें क्या हैं?

  • परिचय: जीपीटी-4o ("o" का अर्थ यहाँ "ओमनी" है) मानव-कंप्यूटर इंटरैक्शन को बढ़ाने के लिये OpenAI द्वारा विकसित एक परिवर्तनकारी AI मॉडल है।
    • यह उपयोगकर्त्ताओं को टेक्स्ट, ऑडियो और छवि के किसी भी संयोजन को इनपुट करने तथा समान प्रारूपों में प्रतिक्रियाएँ प्राप्त करने की अनुमति देता है, जिससे यह एक मल्टीमॉडल AI प्रारूप बन जाता है।
  • प्रयुक्त प्रौद्योगिकी: LLM जीपीटी-4o के मुख्य घटक हैं। इन मॉडलों को स्वयं सीखने में सक्षम बनाने के लिये, उनमें अत्यधिक मात्रा में डेटा को प्रविष्ट कराया जाता है।
    • जीपीटी-4o टेक्स्ट, विज़न और ऑडियो कार्यों को संभालने के लिये एकल मॉडल का उपयोग करके अपने पूर्ववर्तियों से भिन्नता रखता है, जिससे कई मॉडलों की आवश्यकता समाप्त हो जाती है।
      • उदाहरण के लिये, पूर्ववर्ती मॉडल में वॉयस मोड में ट्रांसक्रिप्शन, इंटेलिजेंस और टेक्स्ट-टू-स्पीच के लिये पृथक प्रारूपों की आवश्यकता होती थी, लेकिन जीपीटी-4o इन सभी क्षमताओं को एक ही मॉडल में एकीकृत करता है।
    • यह ऑडियो इनपुट में स्वर, बैकग्राउंड नॉइस तथा भावनात्मक संदर्भ सहित इनपुट को अधिक समग्र रूप से संसाधित कर और समझ सकता है।
    • जीपीटी-4o गति और दक्षता जैसे क्षेत्रों में उत्कृष्टता प्राप्त करता है तथा लगभग 232 से 320 मिली सेकंड की वार्तालाप में मनुष्य की तरह तेज़ी से प्रश्नों का उत्तर देता है।
  • प्रमुख विशेषताएँ और क्षमताएँ:
    • उन्नत ऑडियो और दृष्टि समझ जीपीटी-4o को टोन, बैकग्राउंड नॉइस एवं भावनात्मक संदर्भ को संसाधित करने तथा वस्तुओं की पहचान करने की अनुमति देती है।
    • जीपीटी-4o गैर-अंग्रेज़ी के मूलपाठ में उल्लेखनीय सुधार प्रदर्शित करके वैश्विक दर्शकों की ज़रूरतों को पूरा करता है।
  • सुरक्षा चिंताएँ:
    • अपनी उच्च प्रगति के बावज़ूद, GPT-4o अभी भी एकीकृत मल्टीमॉडल इंटरैक्शन की खोज के प्रारंभिक चरण में है, जिसके लिये निरंतर विकास की आवश्यकता है।
    • ओपन AI अंतर्निहित सुरक्षा उपायों और निरंतर प्रयासों से साइबर सुरक्षा, फेक न्यूज़ तथा पूर्वाग्रह जैसे जोखिमों को दूर करने के लिये ज़ोर देता है।

लार्ज लैंग्वेज मॉडल (LLM):

  • LLM एक AI प्रोग्राम है जो भाषा को पहचानने और तैयार करने में सक्षम है। LLM को मशीन लर्निंग और डीप लर्निंग का उपयोग करके विशाल डेटासेट पर प्रशिक्षित किया जाता है, विशेष रूप से ट्रांसफॉर्मर मॉडल पर, जो मानव मस्तिष्क की तंत्रिका संरचना की नकल करते हैं।
  • LLM आमतौर पर ट्रांसफार्मर मॉडल पर निर्भर करते हैं, जिसमें एक एनकोडर और एक डिकोडर होता है। LLM को वास्तुकला, प्रशिक्षण डेटा, आकार और उपलब्धता के आधार पर वर्गीकृत किया जा सकता है। 
  • LLM का उपयोग जेनेरिक AI कार्यों जैसे टेक्स्ट तैयार करना, कोडिंग में प्रोग्रामर की सहायता करना और भावना विश्लेषण तथा चैटबॉट जैसे विभिन्न अनुप्रयोगों के लिये किया जाता है। 
  • वे प्राकृतिक भाषा को समझने तथा जटिल डेटा को संसाधित करने में उत्कृष्ट हैं, परंतु गलत इनपुट डेटा दिये जाने पर अविश्वसनीय जानकारी या "मतिभ्रम" प्रतिक्रियाएँ भी दे सकते हैं तथा दुरुपयोग होने पर सुरक्षा जोखिम उत्पन्न कर सकते हैं।

  UPSC सिविल सेवा परीक्षा, विगत वर्ष के प्रश्न  

प्रिलिम्स; 

प्रश्न. विकास की वर्तमान स्थिति में कृत्रिम बुद्धिमत्ता (Artificial Intelligence), निम्नलिखित में से किस कार्य को प्रभावी रूप से कर सकती है? (2020)

  1. औद्योगिक इकाइयों में विद्युत की खपत कम करना 
  2.  सार्थक लघु कहानियों और गीतों की रचना 
  3.  रोगों का निदान 
  4.  टेक्स्ट-से-स्पीच (Text-to-Speech) में परिवर्तन 
  5.  विद्युत ऊर्जा का बेतार संचरण

नीचे दिये गए कूट का प्रयोग कर सही उत्तर चुनिये:

(a) केवल 1, 2, 3 और 5
(b) केवल 1, 3 और 4
(c) केवल 2, 4 और 5
(d) 1, 2, 3, 4 और 5

उत्तर: (b)