प्रतिशतक वे मापक हैं जो डेटासेट को 100 बराबर भागों में विभाजित करते हैं, जो एक निश्चित स्तर से नीचे के मानों के प्रतिशत के संदर्भ में डेटा के वितरण को समझने का एक तरीका प्रदान करते हैं। इनका उपयोग आमतौर पर सांख्यिकी में स्कोर की तुलना करने और डेटासेट के भीतर किसी विशेष मान की स्थिति को समझने के लिए किया जाता है। उदाहरण के लिए, यदि आप किसी टेस्ट में 90वें प्रतिशतक में स्कोर करते हैं, तो इसका मतलब है कि आपने टेस्ट देने वाले 90% लोगों से बेहतर स्कोर किया है।
प्रतिशत की गणना
डेटासेट में किसी मान का प्रतिशतक इस सूत्र का उपयोग करके गणना किया जा सकता है: \( P = \left(\frac{N - 1}{100}\right) \times k + 1 \) जहाँ \(P\) प्रतिशतक की स्थिति है, \(N\) डेटासेट में अवलोकनों की संख्या है, और \(k\) प्रतिशतक है जिसकी गणना 0 से 100 के बीच की संख्या के रूप में की जा रही है। यह सूत्र सॉर्ट किए गए डेटासेट में \(k^{th}\) प्रतिशतक की स्थिति देता है। इस स्थिति पर मान, या इस स्थिति और अगली स्थिति के बीच का औसत यदि \(P\) पूर्णांक नहीं है, \(k^{th}\) प्रतिशतक को दर्शाता है।
प्रतिशत की गणना का उदाहरण
टेस्ट स्कोर के डेटासेट पर विचार करें: 45, 50, 55, 60, 65, 70, 75, 80. आइए 50वें पर्सेंटाइल की गणना करें, जिसे अक्सर मीडियन के रूप में संदर्भित किया जाता है। सबसे पहले, डेटासेट को सॉर्ट करें (इस मामले में, यह पहले से ही सॉर्ट किया गया है), और फिर \(N = 8\) (8 स्कोर हैं) और \(k = 50\) (हम 50वां पर्सेंटाइल ढूंढ रहे हैं) के साथ सूत्र लागू करें: \( P = \left(\frac{8 - 1}{100}\right) \times 50 + 1 = 4.5 \) स्थिति \(P = 4.5\) का अर्थ है कि 50वां पर्सेंटाइल डेटासेट (60 और 65) में 4वें और 5वें मानों के बीच में है। इसलिए, 50वाँ प्रतिशतक (माध्यिका) है: \( \frac{60 + 65}{2} = 62.5 \) अतः, 62.5 वह मान है जिसके नीचे 50% अंक आते हैं।
प्रतिशतकों के अनुप्रयोग
शिक्षा, स्वास्थ्य और वित्त सहित विभिन्न क्षेत्रों में प्रतिशतकों का व्यापक रूप से उपयोग किया जाता है। उदाहरण के लिए, मानकीकृत परीक्षा परिणाम अक्सर प्रतिशतकों में रिपोर्ट किए जाते हैं ताकि किसी व्यक्ति के प्रदर्शन की व्यापक आबादी के साथ तुलना करने में मदद मिल सके। स्वास्थ्य में, विकास चार्ट बच्चों के साथियों की तुलना में उनके विकास का आकलन करने के लिए प्रतिशतकों का उपयोग करते हैं। वित्त में, प्रतिशतक निवेश पर रिटर्न के वितरण का विश्लेषण करने में मदद कर सकते हैं।
प्रतिशतक बनाम अन्य माप
जबकि प्रतिशतक डेटा के वितरण में अंतर्दृष्टि प्रदान करते हैं, वे माध्य, माध्यिका और बहुलक जैसे अन्य सांख्यिकीय उपायों से भिन्न होते हैं। माध्य (औसत) सभी मानों का योग है जिसे मानों की संख्या से विभाजित किया जाता है। माध्यिका (50वाँ प्रतिशतक) डेटासेट का मध्य मान है। बहुलक सबसे अधिक बार आने वाला मान है। इनमें से प्रत्येक उपाय डेटासेट की विशेषताओं के बारे में अलग-अलग जानकारी प्रदान करता है।
चतुर्थक और प्रतिशतक
चतुर्थक एक विशिष्ट प्रकार का प्रतिशतक है जो डेटा को तिमाहियों में विभाजित करता है। पहला चतुर्थक (Q1) 25वाँ प्रतिशतक है, दूसरा चतुर्थक (Q2) 50वाँ प्रतिशतक (या माध्यिका) है, और तीसरा चतुर्थक (Q3) 75वाँ प्रतिशतक है। चतुर्थक विशेष रूप से डेटासेट के प्रसार और केंद्र को समझने के साथ-साथ आउटलेयर की पहचान करने के लिए उपयोगी होते हैं।
प्रतिशत रैंक को समझना
प्रतिशत रैंक उसके आवृत्ति वितरण में अंकों का प्रतिशत है जो उसके बराबर या उससे कम है। उदाहरण के लिए, यदि किसी छात्र का स्कोर 80वें प्रतिशत में है, तो इसका मतलब है कि 80% छात्रों ने इस छात्र के बराबर या उससे कम अंक प्राप्त किए हैं। प्रतिशत रैंक किसी समूह की तुलना में किसी व्यक्ति के प्रदर्शन का आकलन करने के लिए उपयोगी होते हैं।
प्रतिशतकों की सीमाएं
जबकि प्रतिशतक मूल्यवान जानकारी प्रदान करते हैं, उनकी सीमाएँ हैं। प्रतिशतक डेटासेट में मानों के बीच अंतर की मात्रा को नहीं दर्शाते हैं। दो व्यक्तियों के स्कोर एक दूसरे के करीब हो सकते हैं लेकिन अलग-अलग प्रतिशतक में हो सकते हैं, या बहुत दूर हो सकते हैं लेकिन एक ही प्रतिशतक में हो सकते हैं। इसके अलावा, बहुत बड़े या बहुत छोटे डेटासेट में, प्रतिशतक गणना में अशुद्धियाँ हो सकती हैं।
निष्कर्ष
प्रतिशतक सांख्यिकी में एक मौलिक अवधारणा है जो यह समझने का एक तरीका प्रदान करती है कि डेटासेट के भीतर व्यक्तिगत मान कैसे तुलना करते हैं। डेटा को 100 बराबर भागों में विभाजित करके, प्रतिशतक डेटा बिंदुओं की उनकी सापेक्ष स्थिति के संदर्भ में तुलना करने की अनुमति देते हैं। चाहे शैक्षिक मूल्यांकन, स्वास्थ्य मूल्यांकन या वित्तीय विश्लेषण में उपयोग किया जाए, प्रतिशतक डेटा व्याख्या के लिए एक मजबूत उपकरण प्रदान करते हैं। हालाँकि, उनकी सीमाओं पर विचार करना और यह सुनिश्चित करना आवश्यक है कि उनका उपयोग व्यापक विश्लेषण के लिए अन्य सांख्यिकीय उपायों के साथ किया जाए।