Statistika është një degë e matematikës që merret me mbledhjen, analizën, interpretimin dhe prezantimin e të dhënave. Është një mjet i fuqishëm për të kuptuar botën përreth nesh, duke ndihmuar në marrjen e vendimeve bazuar në të dhëna dhe jo në supozime.
Ekzistojnë dy degë kryesore të statistikave: Statistikat përshkruese dhe Statistikat Konkluzionale .
Masat e tendencës qendrore përdoren për të përmbledhur një grup të dhënash duke identifikuar pozicionin qendror brenda atij grupi të dhënash. Masat më të zakonshme janë mesatarja, mesatarja dhe mënyra.
Masat e variacionit përshkruajnë se si të dhënat shpërndahen ose përhapen. Masat më të zakonshme janë diapazoni, varianca dhe devijimi standard.
Statistikat konkluzionale nxjerrin përfundime nga të dhënat që i nënshtrohen ndryshimeve të rastësishme. Kjo përfshin gabimet e vëzhgimit, variacionet e kampionimit, etj. Ka të bëjë me nxjerrjen e konkluzioneve rreth popullatës bazuar në një kampion.
Testimi i hipotezave është një metodë e përfundimit statistikor. Përdoret për të vendosur nëse të dhënat mbështesin një hipotezë specifike apo jo. Kjo përfshin krahasimin e vlerës p , ose rëndësinë e vëzhguar, me një nivel të paracaktuar të rëndësisë, shpesh 0.05.
Intervalet e besimit janë një varg vlerash, të nxjerra nga të dhënat e mostrës, që besohet se përmbajnë vlerën e një parametri të panjohur të popullsisë në një nivel të caktuar besimi. Për shembull, një interval besimi 95% për mesataren do të nënkuptojë se nëse e njëjta popullatë do të mostrohej disa herë dhe do të llogariteshin intervalet, afërsisht 95% e atyre intervaleve do të përmbanin mesataren e vërtetë të popullsisë.
Analiza e regresionit është një metodë statistikore që shqyrton marrëdhëniet midis dy ose më shumë variablave. Për shembull, regresioni linear mund të përdoret për të parashikuar vlerën e një ndryshoreje bazuar në vlerën e një tjetri. Ekuacioni për një linjë të thjeshtë regresioni linear është \(y = \beta_0 + \beta_1x\) , ku \(y\) është ndryshorja e varur, \(x\) është ndryshorja e pavarur dhe \(\beta_0\) dhe \(\beta_1\) janë koeficientët që përfaqësojnë përkatësisht ndërprerjen y dhe pjerrësinë e drejtëzës.
Mbledhja e të dhënave është një hap vendimtar në procesin e analizës statistikore. Të dhënat duhet të mblidhen siç duhet për të siguruar që rezultatet janë të vlefshme dhe të besueshme. Metodat e zakonshme përfshijnë sondazhe, eksperimente dhe studime vëzhguese.
Probabiliteti luan një rol themelor në statistika, pasi lejon përcaktimin sasior të pasigurisë. Probabiliteti mund të konsiderohet si gjasa që të ndodhë një ngjarje dhe varion nga 0 (e pamundur) në 1 (e sigurt).
Formula bazë për probabilitetin është: P(A) = Numri i rezultateve të favorshme ∕ Numri total i rezultateve të mundshme
Ku:
Një rregull i rëndësishëm është Rregulli i Shtimit , i cili thotë se probabiliteti i një prej dy ose më shumë ngjarjeve reciprokisht ekskluzive është i barabartë me shumën e probabiliteteve të tyre individuale. Formula është \(P(A \textrm{ ose } B) = P(A) + P(B)\) , duke supozuar se \(A\) dhe \(B\) janë reciprokisht ekskluzive.
Një koncept tjetër thelbësor është rregulli i shumëzimit , i përdorur kur llogaritet probabiliteti që dy ose më shumë ngjarje të pavarura të ndodhin së bashku. Formula është \(P(A \textrm{ dhe } B) = P(A) \times P(B)\) .
Kuptimi i këtyre koncepteve dhe mjeteve të statistikave mund t'i fuqizojë individët të marrin vendime të informuara bazuar në të dhëna dhe jo në supozime. Ai vendos bazat për analizimin e grupeve komplekse të të dhënave, duke kontribuar ndjeshëm në përparimet në fusha të ndryshme si ekonomia, shkenca dhe shëndeti publik.