Statistika je grana matematike koja se bavi prikupljanjem, analizom, interpretacijom i prezentacijom podataka. To je moćan alat za razumijevanje svijeta oko nas, pomaže u donošenju odluka na temelju podataka, a ne pretpostavki.
Postoje dvije glavne grane statistike: deskriptivna statistika i inferencijalna statistika .
Mjere središnje tendencije koriste se za sažimanje skupa podataka identificiranjem središnjeg položaja unutar tog skupa podataka. Najčešće mjere su srednja vrijednost, medijan i mod.
Mjere varijacije opisuju kako se podaci raspršuju ili šire. Najčešće mjere su raspon, varijanca i standardna devijacija.
Inferencijalna statistika izvodi zaključke iz podataka koji su podložni nasumičnim varijacijama. To uključuje pogreške opažanja, varijacije uzorkovanja itd. Radi se o donošenju zaključaka o populaciji na temelju uzorka.
Testiranje hipoteza je metoda statističkog zaključivanja. Koristi se za odlučivanje podržavaju li podaci određenu hipotezu ili ne. To uključuje usporedbu p-vrijednosti ili promatrane značajnosti s unaprijed određenom razinom značajnosti, često 0,05.
Intervali pouzdanosti su raspon vrijednosti, izvedenih iz podataka uzorka, za koje se vjeruje da sadrže vrijednost nepoznatog parametra populacije na određenoj razini pouzdanosti. Na primjer, interval pouzdanosti od 95% za srednju vrijednost značio bi da ako bi se ista populacija uzorkovala više puta i izračunali intervali, približno 95% tih intervala bi sadržavalo pravu srednju vrijednost populacije.
Regresijska analiza je statistička metoda koja ispituje odnos između dvije ili više varijabli. Na primjer, linearna regresija može se koristiti za predviđanje vrijednosti jedne varijable na temelju vrijednosti druge. Jednadžba za jednostavnu liniju linearne regresije je \(y = \beta_0 + \beta_1x\) , gdje je \(y\) zavisna varijabla, \(x\) nezavisna varijabla, a \(\beta_0\) i \(\beta_1\) su koeficijenti koji predstavljaju y-odsječak odnosno nagib pravca.
Prikupljanje podataka ključni je korak u procesu statističke analize. Podaci moraju biti prikupljeni na odgovarajući način kako bi se osigurala valjanost i pouzdanost rezultata. Uobičajene metode uključuju ankete, pokuse i promatračke studije.
Vjerojatnost igra temeljnu ulogu u statistici jer omogućuje kvantifikaciju nesigurnosti. Vjerojatnost se može smatrati vjerojatnošću da će se događaj dogoditi, a kreće se od 0 (nemoguće) do 1 (sigurno).
Osnovna formula za vjerojatnost je: P(A) =Broj povoljnih ishoda ∕ Ukupan broj mogućih ishoda
Gdje:
Jedno važno pravilo je Pravilo zbrajanja , koje kaže da je vjerojatnost pojavljivanja bilo kojeg od dva ili više međusobno isključivih događaja jednaka zbroju njihovih pojedinačnih vjerojatnosti. Formula je \(P(A \textrm{ ili } B) = P(A) + P(B)\) pod pretpostavkom da se \(A\) i \(B\) međusobno isključuju.
Još jedan bitan koncept je pravilo množenja , koje se koristi pri izračunavanju vjerojatnosti da se dva ili više neovisnih događaja dogode zajedno. Formula je \(P(A \textrm{ i } B) = P(A) \times P(B)\) .
Razumijevanje ovih koncepata i alata statistike može osnažiti pojedince da donose informirane odluke temeljene na podacima, a ne na pretpostavkama. Postavlja temelje za analizu složenih skupova podataka, značajno pridonoseći napretku u raznim područjima kao što su ekonomija, znanost i javno zdravstvo.