सांख्यिकी गणित की एक शाखा है जो डेटा संग्रह, विश्लेषण, व्याख्या और प्रस्तुति से संबंधित है। यह हमारे आस-पास की दुनिया को समझने के लिए एक शक्तिशाली उपकरण है, जो धारणाओं के बजाय डेटा के आधार पर निर्णय लेने में मदद करता है।
सांख्यिकी की दो मुख्य शाखाएँ हैं: वर्णनात्मक सांख्यिकी और अनुमानात्मक सांख्यिकी ।
केंद्रीय प्रवृत्ति के मापों का उपयोग डेटा के एक सेट को सारांशित करने के लिए किया जाता है, जिसमें डेटा के उस सेट के भीतर केंद्रीय स्थिति की पहचान की जाती है। सबसे आम माप माध्य, माध्यिका और बहुलक हैं।
भिन्नता के माप यह बताते हैं कि डेटा किस तरह फैला हुआ है। सबसे आम माप हैं रेंज, विचरण और मानक विचलन।
अनुमानात्मक सांख्यिकी उन आंकड़ों से निष्कर्ष निकालती है जो यादृच्छिक भिन्नता के अधीन होते हैं। इसमें अवलोकन संबंधी त्रुटियाँ, नमूना भिन्नता आदि शामिल हैं। यह नमूने के आधार पर जनसंख्या के बारे में अनुमान लगाने के बारे में है।
परिकल्पना परीक्षण सांख्यिकीय अनुमान की एक विधि है। इसका उपयोग यह तय करने के लिए किया जाता है कि डेटा किसी विशिष्ट परिकल्पना का समर्थन करता है या नहीं। इसमें p-मान , या प्रेक्षित महत्व की तुलना पूर्व निर्धारित महत्व स्तर, अक्सर 0.05 से की जाती है।
विश्वास अंतराल , नमूना डेटा से प्राप्त मूल्यों की एक सीमा है, जिसके बारे में माना जाता है कि इसमें एक निश्चित विश्वास स्तर पर अज्ञात जनसंख्या पैरामीटर का मान शामिल होता है। उदाहरण के लिए, माध्य के लिए 95% विश्वास अंतराल का अर्थ यह होगा कि यदि एक ही जनसंख्या का कई बार नमूना लिया गया और अंतराल की गणना की गई, तो लगभग 95% अंतराल में वास्तविक जनसंख्या माध्य शामिल होगा।
प्रतिगमन विश्लेषण एक सांख्यिकीय विधि है जो दो या अधिक चरों के बीच संबंधों की जांच करती है। उदाहरण के लिए, रैखिक प्रतिगमन का उपयोग किसी अन्य चर के मूल्य के आधार पर एक चर के मूल्य की भविष्यवाणी करने के लिए किया जा सकता है। एक सरल रैखिक प्रतिगमन रेखा के लिए समीकरण \(y = \beta_0 + \beta_1x\) है, जहाँ \(y\) आश्रित चर है, \(x\) स्वतंत्र चर है, और \(\beta_0\) और \(\beta_1\) गुणांक हैं जो क्रमशः y-अवरोधन और रेखा के ढलान का प्रतिनिधित्व करते हैं।
सांख्यिकीय विश्लेषण प्रक्रिया में डेटा संग्रह एक महत्वपूर्ण कदम है। यह सुनिश्चित करने के लिए कि परिणाम वैध और विश्वसनीय हैं, डेटा को उचित रूप से एकत्र किया जाना चाहिए। आम तरीकों में सर्वेक्षण, प्रयोग और अवलोकन संबंधी अध्ययन शामिल हैं।
सांख्यिकी में प्रायिकता एक आधारभूत भूमिका निभाती है, क्योंकि यह अनिश्चितता के परिमाणीकरण की अनुमति देती है। प्रायिकता को किसी घटना के घटित होने की संभावना के रूप में समझा जा सकता है, और यह 0 (असंभव) से 1 (निश्चित) तक होती है।
संभावना का मूल सूत्र है: P(A) = अनुकूल परिणामों की संख्या ∕ संभावित परिणामों की कुल संख्या
कहाँ:
एक महत्वपूर्ण नियम योग नियम है, जो बताता है कि दो या अधिक परस्पर अनन्य घटनाओं में से किसी एक के घटित होने की संभावना उनकी व्यक्तिगत संभावनाओं के योग के बराबर होती है। सूत्र है \(P(A \textrm{ या } B) = P(A) + P(B)\) , यह मानते हुए कि \(A\) और \(B\) परस्पर अनन्य हैं।
एक अन्य आवश्यक अवधारणा गुणन नियम है, जिसका उपयोग दो या अधिक स्वतंत्र घटनाओं के एक साथ होने की संभावना की गणना करते समय किया जाता है। सूत्र है \(P(A \textrm{ और } B) = P(A) \times P(B)\) .
सांख्यिकी की इन अवधारणाओं और उपकरणों को समझना व्यक्तियों को धारणाओं के बजाय डेटा के आधार पर सूचित निर्णय लेने में सक्षम बना सकता है। यह जटिल डेटा सेटों के विश्लेषण के लिए आधार तैयार करता है, जो अर्थशास्त्र, विज्ञान और सार्वजनिक स्वास्थ्य जैसे विभिन्न क्षेत्रों में प्रगति में महत्वपूर्ण योगदान देता है।