large language models

प्रारंभिक परीक्षा – बड़े भाषा मॉडल (large language models)
मुख्य परीक्षा- सामान्य अध्ययन, पेपर-3

चर्चा में क्यों

केंद्र सरकार के प्रधान वैज्ञानिक सलाहकार अजय सूद ने 18 अक्टूबर 2023 को कहा कि भारत बड़े भाषा मॉडल (LLM) के विकास का पता लगाने के लिए एक उच्चाधिकार प्राप्त समिति का गठन करेगा।

प्रमुख बिंदु

बड़े भाषा मॉडल(LLM) मानव को समझने और संसाधित करने वाले एप्लिकेशन बनाने के लिए कृत्रिम बुद्धिमत्ता का उपयोग करने वाले उपकरण हैं।
एलएलएम (LLM) एक आधारशिला तकनीक है जो कई 'बुद्धिमान' सॉफ़्टवेयर में अंतर्निहित है और चैटजीपीटी जैसे संभावित अनुप्रयोगों को बनाती है।
ऐसे एलएलएम (LLM) का पता लगाने के लिए और विशेष रूप से इसे भारतीय भाषाओं में कैसे लागू किया जा सकता है। इसके लिए एक उच्चाधिकार प्राप्त समिति की स्थापना की जा रही है।
भारत और संयुक्त राज्य अमेरिका दोनों देशों के बड़े भाषा मॉडल(LLM) तकनीकी पर सहयोग कर रहे है।

बड़े भाषा मॉडल (large language models)

एक बड़ा भाषा मॉडल (एलएलएम) एक गहन शिक्षण एल्गोरिदम है जो विभिन्न प्रकार के प्राकृतिक भाषा प्रसंस्करण (natural language processing) (NLP) का कार्य कर सकता है।
बड़े भाषा मॉडल ट्रांसफार्मर मॉडल का उपयोग करते हैं और बड़े पैमाने पर डेटासेट का उपयोग कर प्रशिक्षित होते हैं।
कई बड़े भाषा मॉडल विकसित किए गए हैं। जैसे OpenAI से GPT-3 और GPT-4, मेटा से LLaMA और Google से PaLM2 शामिल हैं।
ये ऐसे मॉडल भाषा समझ सकते हैं और टेक्स्ट जेनरेट कर सकते हैं तथा सामग्री को पहचानने, अनुवाद करने, भविष्यवाणी करने एवं उत्पन्न करने में सक्षम बनाता है।
बड़े भाषा मॉडल को तंत्रिका नेटवर्क (neural networks) (NNs), (एनएन) के रूप में भी जाना जाता है, जो मानव मस्तिष्क से प्रेरित कंप्यूटिंग सिस्टम हैं।
ये तंत्रिका नेटवर्क न्यूरॉन्स की तरह स्तरित नोड्स के नेटवर्क का उपयोग करके काम करते हैं।
शैक्षिक प्रौद्योगिकियों को विकसित करने के लिए बड़े भाषा मॉडल का तेजी से उपयोग किया जा रहा है जिसका उद्देश्य पाठ्य सामग्री के निर्माण और विश्लेषण को स्वचालित करना है जैसे स्वचालित प्रश्न निर्माण आदि ।
प्रौद्योगिकी, वित्त, स्वास्थ्य सेवा, ई-कॉमर्स और मीडिया सहित विभिन्न उद्योग बड़े भाषा मॉडल (एलएलएम) का लाभ उठाते हैं। Google, Microsoft, Amazon, Facebook, IBM और OpenAI जैसी कंपनियां एनएलपी, चैटबॉट्स, कंटेंट जेनरेशन, सेंटीमेंट एनालिसिस आदि जैसे अनुप्रयोगों के लिए एलएलएम का उपयोग करने वाले कुछ शीर्ष संगठन हैं।

प्रश्न: निम्नलिखित कथनों पर विचार कीजिए

बड़े भाषा मॉडल एक गहन शिक्षण एल्गोरिदम है जो विभिन्न प्रकार के प्राकृतिक भाषा प्रसंस्करण का कार्य कर सकता है।
बड़े भाषा मॉडल भाषा समझ सकते हैं और टेक्स्ट जेनरेट कर सकते हैं, सामग्री को पहचानने, अनुवाद करने, भविष्यवाणी करने एवं उत्पन्न करने में सक्षम बनाता है।
कई बड़े भाषा मॉडल विकसित किए गए हैं। जैसे OpenAI से GPT-3 और GPT-4, मेटा से LLaMA और Google से PaLM2 शामिल हैं।

उपर्युक्त में से कितने कथन सही हैं ?

(a) केवल एक

(b) केवल दो

(d) कोई भी नहीं

उत्तर: (c)

मुख्य परीक्षा प्रश्न :लार्ज लैंग्वेज मॉडल क्या है ? इसके प्रमुख विशेषताओं का उल्लेख कीजिए कीजिए।

स्रोत: the hindu

बड़े भाषा मॉडल (large language models)

Related Articles

Have any Query?

+91-9555 124 124
info@sanskritiias.com

Classroom Courses

Online/Live Courses

VOD Batch

Test Series

Pendrive Courses

Other Courses

Other Links

बड़े भाषा मॉडल (large language models)

Related Articles

Have any Query?

+91-9555 124 124 info@sanskritiias.com

+91-9555 124 124
info@sanskritiias.com