वर्णनात्मक सांख्यिकी का उपयोग किसी अध्ययन में डेटा की बुनियादी विशेषताओं को संक्षेप में प्रस्तुत करने या वर्णन करने के लिए किया जाता है। वे नमूने और मापों के बारे में सरल सारांश प्रदान करते हैं। वर्णनात्मक सांख्यिकी के माध्यम से, हम मात्रात्मक विवरण को प्रबंधनीय रूप में प्रस्तुत कर सकते हैं। एक शोध अध्ययन में, हमारे पास बहुत सारे माप हो सकते हैं। वर्णनात्मक सांख्यिकी हमें बड़ी मात्रा में डेटा को समझदारी से सरल बनाने में मदद करती है।
वर्णनात्मक सांख्यिकी के दो मुख्य प्रकार हैं:
माध्य: माध्य सभी संख्याओं का औसत होता है और इसे कभी-कभी अंकगणितीय माध्य भी कहा जाता है। आप सभी मानों को जोड़कर और संख्याओं की संख्या से भाग देकर माध्य की गणना करते हैं। माध्य का सूत्र है:
\( \textrm{अर्थ} = \frac{\sum_{i=1}^{n} x_i}{n} \)जहाँ \(x_i\) डेटासेट में प्रत्येक मान को दर्शाता है और \(n\) मानों की संख्या है।
माध्यिका: माध्यिका संख्याओं की सूची में मध्य मान है। माध्यिका ज्ञात करने के लिए, आपको अपनी संख्याओं को आरोही क्रम में व्यवस्थित करना होगा और मध्य संख्या ज्ञात करनी होगी। यदि प्रेक्षणों की संख्या सम है, तो माध्यिका दो मध्य संख्याओं का औसत है।
मोड: मोड वह मान है जो डेटा सेट में सबसे ज़्यादा बार दिखाई देता है। डेटासेट में एक मोड, एक से ज़्यादा मोड या कोई मोड नहीं हो सकता है।
रेंज: रेंज किसी डेटासेट में उच्चतम और निम्नतम मानों के बीच का अंतर है। यह परिवर्तनशीलता का सबसे सरल माप है।
विचरण: विचरण मापता है कि डेटासेट में संख्याएँ माध्य से कितनी भिन्न हैं। विचरण की गणना माध्य से वर्ग अंतर का औसत लेकर की जाती है। विचरण ( \(\sigma^2\) ) का सूत्र है:
\( \sigma^2 = \frac{\sum_{i=1}^{n} (x_i - \textrm{अर्थ})^2}{n} \)मानक विचलन: मानक विचलन मानों के एक सेट की भिन्नता या फैलाव की मात्रा का एक माप है। यह विचरण का वर्गमूल है, इस प्रकार एक माप देता है जो डेटा के समान इकाइयों में होता है। मानक विचलन ( \(\sigma\) ) का सूत्र है:
\( \sigma = \sqrt{\frac{\sum_{i=1}^{n} (x_i - \textrm{अर्थ})^2}{n}} \)वर्णनात्मक सांख्यिकी में डेटासेट के वितरण, केंद्रीय प्रवृत्ति और परिवर्तनशीलता को दृश्य रूप से सारांशित करने के लिए ग्राफ़ और प्लॉट का उपयोग भी शामिल हो सकता है। सामान्य ग्राफ़िकल अभ्यावेदन में शामिल हैं:
एक कक्षा के 20 विद्यार्थियों के परीक्षा स्कोर वाले डेटासेट पर विचार करें:
85, 82, 88, 95, 70, 90, 78, 84, 80, 96, 72, 88, 92, 94, 94, 90, 76, 97, 84, 82
इस डेटा को संक्षेप में प्रस्तुत करने के लिए, हम केंद्रीय प्रवृत्ति और परिवर्तनशीलता के माप की गणना कर सकते हैं:
इन बुनियादी वर्णनात्मक सांख्यिकी को समझने से हमें अंकों का त्वरित सारांश प्राप्त करने, उनमें व्यापक भिन्नता की पहचान करने तथा कक्षा के प्रदर्शन की सामान्य प्रवृत्ति का पता लगाने में सहायता मिलती है।
डेटा को सारांशित करने और समझने के लिए वर्णनात्मक सांख्यिकी महत्वपूर्ण है। वे डेटा विश्लेषण में पहला कदम हैं, जो अधिक जटिल सांख्यिकीय विश्लेषण के लिए आधार प्रदान करते हैं। केंद्रीय उपायों और परिवर्तनशीलता की पहचान करके, हम डेटा की प्रकृति के बारे में सार्थक जानकारी प्राप्त कर सकते हैं और उन जानकारियों के आधार पर सूचित निर्णय ले सकते हैं।