प्रारंभिक परीक्षा – बड़े भाषा मॉडल (large language models) मुख्य परीक्षा- सामान्य अध्ययन, पेपर-3 |
चर्चा में क्यों
केंद्र सरकार के प्रधान वैज्ञानिक सलाहकार अजय सूद ने 18 अक्टूबर 2023 को कहा कि भारत बड़े भाषा मॉडल (LLM) के विकास का पता लगाने के लिए एक उच्चाधिकार प्राप्त समिति का गठन करेगा।
प्रमुख बिंदु
- बड़े भाषा मॉडल(LLM) मानव को समझने और संसाधित करने वाले एप्लिकेशन बनाने के लिए कृत्रिम बुद्धिमत्ता का उपयोग करने वाले उपकरण हैं।
- एलएलएम (LLM) एक आधारशिला तकनीक है जो कई 'बुद्धिमान' सॉफ़्टवेयर में अंतर्निहित है और चैटजीपीटी जैसे संभावित अनुप्रयोगों को बनाती है।
- ऐसे एलएलएम (LLM) का पता लगाने के लिए और विशेष रूप से इसे भारतीय भाषाओं में कैसे लागू किया जा सकता है। इसके लिए एक उच्चाधिकार प्राप्त समिति की स्थापना की जा रही है।
- भारत और संयुक्त राज्य अमेरिका दोनों देशों के बड़े भाषा मॉडल(LLM) तकनीकी पर सहयोग कर रहे है।
बड़े भाषा मॉडल (large language models)
- एक बड़ा भाषा मॉडल (एलएलएम) एक गहन शिक्षण एल्गोरिदम है जो विभिन्न प्रकार के प्राकृतिक भाषा प्रसंस्करण (natural language processing) (NLP) का कार्य कर सकता है।
- बड़े भाषा मॉडल ट्रांसफार्मर मॉडल का उपयोग करते हैं और बड़े पैमाने पर डेटासेट का उपयोग कर प्रशिक्षित होते हैं।
- कई बड़े भाषा मॉडल विकसित किए गए हैं। जैसे OpenAI से GPT-3 और GPT-4, मेटा से LLaMA और Google से PaLM2 शामिल हैं।
- ये ऐसे मॉडल भाषा समझ सकते हैं और टेक्स्ट जेनरेट कर सकते हैं तथा सामग्री को पहचानने, अनुवाद करने, भविष्यवाणी करने एवं उत्पन्न करने में सक्षम बनाता है।
- बड़े भाषा मॉडल को तंत्रिका नेटवर्क (neural networks) (NNs), (एनएन) के रूप में भी जाना जाता है, जो मानव मस्तिष्क से प्रेरित कंप्यूटिंग सिस्टम हैं।
- ये तंत्रिका नेटवर्क न्यूरॉन्स की तरह स्तरित नोड्स के नेटवर्क का उपयोग करके काम करते हैं।
- शैक्षिक प्रौद्योगिकियों को विकसित करने के लिए बड़े भाषा मॉडल का तेजी से उपयोग किया जा रहा है जिसका उद्देश्य पाठ्य सामग्री के निर्माण और विश्लेषण को स्वचालित करना है जैसे स्वचालित प्रश्न निर्माण आदि ।
- प्रौद्योगिकी, वित्त, स्वास्थ्य सेवा, ई-कॉमर्स और मीडिया सहित विभिन्न उद्योग बड़े भाषा मॉडल (एलएलएम) का लाभ उठाते हैं। Google, Microsoft, Amazon, Facebook, IBM और OpenAI जैसी कंपनियां एनएलपी, चैटबॉट्स, कंटेंट जेनरेशन, सेंटीमेंट एनालिसिस आदि जैसे अनुप्रयोगों के लिए एलएलएम का उपयोग करने वाले कुछ शीर्ष संगठन हैं।
प्रश्न: निम्नलिखित कथनों पर विचार कीजिए
- बड़े भाषा मॉडल एक गहन शिक्षण एल्गोरिदम है जो विभिन्न प्रकार के प्राकृतिक भाषा प्रसंस्करण का कार्य कर सकता है।
- बड़े भाषा मॉडल भाषा समझ सकते हैं और टेक्स्ट जेनरेट कर सकते हैं, सामग्री को पहचानने, अनुवाद करने, भविष्यवाणी करने एवं उत्पन्न करने में सक्षम बनाता है।
- कई बड़े भाषा मॉडल विकसित किए गए हैं। जैसे OpenAI से GPT-3 और GPT-4, मेटा से LLaMA और Google से PaLM2 शामिल हैं।
उपर्युक्त में से कितने कथन सही हैं ?
(a) केवल एक
(b) केवल दो
(c) सभी तीन
(d) कोई भी नहीं
उत्तर: (c)
मुख्य परीक्षा प्रश्न :लार्ज लैंग्वेज मॉडल क्या है ? इसके प्रमुख विशेषताओं का उल्लेख कीजिए कीजिए।
|
स्रोत: the hindu