तथ्याङ्क तथ्याङ्क सङ्कलन, विश्लेषण, व्याख्या र प्रस्तुतीकरणसँग सम्बन्धित गणितको एउटा शाखा हो। यो हाम्रो वरपरको संसार बुझ्नको लागि एक शक्तिशाली उपकरण हो, अनुमानहरू भन्दा डाटामा आधारित निर्णयहरू गर्न मद्दत गर्दछ।
तथ्याङ्कका दुई मुख्य शाखाहरू छन्: वर्णनात्मक तथ्याङ्क र अनुमानित तथ्याङ्क ।
केन्द्रीय प्रवृत्तिका उपायहरू डेटाको सेट भित्रको केन्द्रीय स्थिति पहिचान गरेर डेटाको सेटलाई संक्षेप गर्न प्रयोग गरिन्छ। सबैभन्दा सामान्य उपायहरू मध्य, मध्य र मोड हुन्।
भिन्नताका उपायहरूले डेटा कसरी फैलिन्छ वा फैलिन्छ भनेर वर्णन गर्दछ। सबैभन्दा सामान्य उपायहरू दायरा, भिन्नता, र मानक विचलन हुन्।
अनुमानित तथ्याङ्कले डेटाबाट निष्कर्ष निकाल्छ जुन अनियमित भिन्नताको विषय हो। यसमा पर्यवेक्षणात्मक त्रुटिहरू, नमूना भिन्नता, आदि समावेश छन्। यो नमूनाको आधारमा जनसंख्याको बारेमा अनुमान लगाउने बारेमा हो।
परिकल्पना परीक्षण सांख्यिकीय अनुमान को एक विधि हो। डाटाले कुनै खास परिकल्पनालाई समर्थन गर्छ वा गर्दैन भन्ने निर्णय गर्न यो प्रयोग गरिन्छ। यसमा p-value , वा अवलोकन गरिएको महत्वलाई पूर्वनिर्धारित महत्व स्तर, प्रायः ०.०५ मा तुलना गर्ने समावेश हुन्छ।
विश्वास अन्तरालहरू मानहरूको दायरा हुन्, नमूना डेटाबाट व्युत्पन्न, जसमा निश्चित विश्वास स्तरमा अज्ञात जनसंख्या प्यारामिटरको मान समावेश छ भन्ने विश्वास गरिन्छ। उदाहरणका लागि, औसतको लागि 95% आत्मविश्वास अन्तरालको मतलब यदि समान जनसंख्या धेरै पटक नमूना गरिएको थियो र अन्तरालहरू गणना गरिएको थियो भने, ती अन्तरालहरूको लगभग 95% मा वास्तविक जनसंख्या मतलब समावेश हुनेछ।
प्रतिगमन विश्लेषण एक सांख्यिकीय विधि हो जसले दुई वा बढी चरहरू बीचको सम्बन्धको जाँच गर्दछ। उदाहरण को लागी, रैखिक प्रतिगमन अर्को को मान मा आधारित एक चर को मान भविष्यवाणी गर्न प्रयोग गर्न सकिन्छ। साधारण रैखिक प्रतिगमन रेखाको समीकरण \(y = \beta_0 + \beta_1x\) हो, जहाँ \(y\) निर्भर चल हो, \(x\) स्वतन्त्र चर हो, र \(\beta_0\) र \(\beta_1\) क्रमशः y-अवरोध र रेखाको ढलान प्रतिनिधित्व गर्ने गुणांकहरू हुन्।
तथ्याङ्कीय विश्लेषण प्रक्रियामा तथ्याङ्क सङ्कलन एउटा महत्त्वपूर्ण चरण हो। नतिजाहरू मान्य र भरपर्दो छन् भनी सुनिश्चित गर्नका लागि तथ्याङ्कहरू उचित रूपमा सङ्कलन गर्नुपर्छ। सामान्य विधिहरूमा सर्वेक्षणहरू, प्रयोगहरू, र अवलोकन अध्ययनहरू समावेश छन्।
सम्भाव्यताले तथ्याङ्कमा आधारभूत भूमिका खेल्छ, किनकि यसले अनिश्चितताको परिमाण निर्धारण गर्न अनुमति दिन्छ। सम्भाव्यतालाई घटना हुने सम्भावनाको रूपमा सोच्न सकिन्छ, र यो ० (असम्भव) देखि १ (निश्चित) सम्म हुन्छ।
सम्भाव्यताको आधारभूत सूत्र हो: P(A) = अनुकूल परिणामहरूको सङ्ख्या ∕ सम्भावित परिणामहरूको कुल सङ्ख्या
कहाँ:
एउटा महत्त्वपूर्ण नियम थपिएको नियम हो, जसले बताउँछ कि दुई वा बढी पारस्परिक अनन्य घटनाहरू मध्ये कुनै एकको सम्भाव्यता तिनीहरूको व्यक्तिगत सम्भाव्यताहरूको योगफल बराबर हुन्छ। सूत्र हो \(P(A \textrm{ वा } B) = P(A) + P(B)\) , मान्दै \(A\) र \(B\) परस्पर अनन्य छन्।
अर्को आवश्यक अवधारणा गुणन नियम हो, जुन दुई वा बढी स्वतन्त्र घटनाहरू सँगै हुने सम्भावनाको गणना गर्दा प्रयोग गरिन्छ। सूत्र हो \(P(A \textrm{ र } B) = P(A) \times P(B)\) ।
तथ्याङ्कका यी अवधारणाहरू र उपकरणहरू बुझ्दा व्यक्तिहरूलाई अनुमानको सट्टा डाटामा आधारित सूचित निर्णयहरू गर्न सशक्त बनाउन सक्छ। यसले अर्थशास्त्र, विज्ञान, र जनस्वास्थ्य जस्ता विभिन्न क्षेत्रहरूमा भएका प्रगतिहरूमा महत्त्वपूर्ण योगदान पुर्याउँदै जटिल डेटा सेटहरूको विश्लेषणको आधार बनाउँछ।