समूहीकृत डेटा भनेको तथ्याङ्कमा समूह वा कोटीहरूमा व्यवस्थित गरिएको डेटा वर्णन गर्न प्रयोग गरिने शब्द हो। यो प्रायः डाटालाई सरल बनाउन, विश्लेषण गर्न सजिलो बनाउन र डाटा सेट भित्रका ढाँचा वा प्रवृत्तिहरू पहिचान गर्न गरिन्छ।
डेटा समूहीकरण विभिन्न सांख्यिकीय विश्लेषणहरूमा सहयोगी हुन सक्छ किनभने यसले डेटाको जटिलता कम गर्छ, यसलाई कल्पना गर्न र व्याख्या गर्न सजिलो बनाउँछ। यो विशेष गरी उपयोगी हुन्छ जब डेटा बिन्दुहरूको ठूलो सेटसँग व्यवहार गर्दा मानहरूको विस्तृत दायरा फैलिन्छ। डेटा समूहबद्ध गरेर, तपाईंले यसको वितरण र केन्द्रीय प्रवृत्तिहरूको राम्रो बुझाइ प्राप्त गर्न सक्नुहुन्छ।
त्यहाँ दुई मुख्य प्रकारका समूहीकृत डाटा छन्:
कच्चा डाटाबाट समूहीकृत डाटा सिर्जना गर्न, यी चरणहरू पालना गर्नुहोस्:
फ्रिक्वेन्सी तालिकाहरू, हिस्टोग्रामहरू, र बार चार्टहरू सहित समूहबद्ध डेटा प्रतिनिधित्व गर्ने थुप्रै तरिकाहरू छन्। प्रत्येक विधिले डेटाको दृश्य प्रतिनिधित्व प्रदान गर्दछ, यसलाई विश्लेषण गर्न सजिलो बनाउँछ।
फ्रिक्वेन्सी तालिका समूहबद्ध डाटा प्रदर्शन गर्न एक सरल तरिका हो। यसले अन्तरालहरू र डेटा बिन्दुहरूको संख्या (फ्रिक्वेन्सी) देखाउँछ जुन प्रत्येक अन्तरालमा आउँछ। उदाहरणका लागि, विद्यार्थी उचाइहरूमा समूहबद्ध डेटाको लागि फ्रिक्वेन्सी तालिका यस्तो देखिन सक्छ:
उचाइ अन्तराल (सेमी) | आवृत्ति |
---|---|
150-159 | ५ |
१६०-१६९ | ८ |
१७०-१७९ | ७ |
१८०-१८९ | २ |
समूहबद्ध डेटाको साथ, तपाईं अझै पनि मध्य, मध्य र मोड जस्ता केन्द्रीय प्रवृत्तिका उपायहरू गणना गर्न सक्नुहुन्छ, तर विधिहरू थोरै फरक छन्।
समूहित डाटाको मीन: औसत (वा औसत) प्रत्येक अन्तरालको मध्यबिन्दुलाई त्यो अन्तरालको फ्रिक्वेन्सीद्वारा गुणा गरेर, यी उत्पादनहरूलाई संक्षेप गरेर, र त्यसपछि डेटा बिन्दुहरूको कुल संख्याले भाग गरेर अनुमान गर्न सकिन्छ। सूत्र द्वारा दिइएको छ:
\( \textrm{अर्थ} = \frac{\sum(\textrm{मध्यबिन्दु} \times \textrm{आवृत्ति})}{\textrm{कुल आवृत्ति}} \)समूहीकृत डाटाको माध्य: मध्यक भनेको डेटालाई दुई बराबर भागमा विभाजन गर्ने मान हो। समूहबद्ध डाटामा मध्यक पत्ता लगाउन, तपाईंले मध्य मान(हरू) समावेश गर्ने अन्तराल फेला पार्न आवश्यक छ। यसले प्रायः संचयी आवृत्ति प्रयोग गर्न समावेश गर्दछ।
समूहित डेटाको मोड: मोड डेटा सेटमा सबैभन्दा धेरै बारम्बार मान हो। समूहबद्ध डेटाको लागि, मोड उच्चतम आवृत्तिको साथ अन्तराल हो।
विद्यार्थीको उचाइको लागि पहिले उल्लेख गरिएको फ्रिक्वेन्सी तालिकालाई विचार गर्नुहोस्। औसत उचाइ गणना गर्न, पहिले प्रत्येक अन्तरालको लागि मध्य बिन्दुहरू पहिचान गर्नुहोस्:
अर्को, प्रत्येक मध्यबिन्दुलाई सम्बन्धित फ्रिक्वेन्सीद्वारा गुणा गर्नुहोस् र यी उत्पादनहरू जोड्नुहोस्:
\( \textrm{उत्पादनहरूको योगफल} = (154.5 \times 5) + (164.5 \times 8) + (174.5 \times 7) + (184.5 \times 2) \)त्यसपछि, औसत फेला पार्न कुल फ्रिक्वेन्सीद्वारा उत्पादनहरूको योगफल विभाजन गर्नुहोस्:
\( \textrm{औसत उचाइ} = \frac{\textrm{उत्पादनहरूको योगफल}}{\textrm{कुल आवृत्ति}} \)यो गणनाले विद्यार्थीहरू बीचको औसत उचाइको अनुमान दिन्छ।
समूहीकृत डाटाले अनुसन्धानकर्ता र विश्लेषकहरूलाई सक्षम बनाएर सांख्यिकीय विश्लेषणमा महत्त्वपूर्ण भूमिका खेल्छ:
जबकि समूहबद्ध डाटा विश्लेषण को लागी लाभदायक छ, यसको केहि सीमाहरु छन्:
समूहीकृत डाटा तथ्याङ्कमा एक शक्तिशाली उपकरण हो, ठूला डाटा सेटहरू व्यवस्थापन र विश्लेषण गर्ने तरिका प्रदान गर्दछ। डेटालाई कसरी समूहबद्ध गर्ने, फ्रिक्वेन्सी तालिकाहरू सिर्जना गर्ने, र समूहबद्ध डेटाका लागि केन्द्रीय प्रवृत्तिका उपायहरू गणना गर्ने भनेर बुझेर, विश्लेषकहरूले तिनीहरूको डेटा भित्रका ढाँचाहरू र प्रवृत्तिहरूमा मूल्यवान अन्तरदृष्टि प्राप्त गर्न सक्छन्। यसका सीमितताहरूको बावजुद, समूहबद्ध डाटा तथ्याङ्कको क्षेत्रमा एक आवश्यक अवधारणा बनेको छ, अझ प्रभावकारी र अर्थपूर्ण विश्लेषणलाई सक्षम पार्दै।