Deskriptivna statistika koristi se za sažimanje ili opisivanje osnovnih značajki podataka u studiji. Daju jednostavne sažetke o uzorku i mjerama. Kroz deskriptivnu statistiku, možemo predstaviti kvantitativne opise u upravljivom obliku. U istraživačkoj studiji možemo imati mnogo mjera. Deskriptivna statistika pomaže nam pojednostaviti velike količine podataka na razuman način.
Postoje dvije glavne vrste deskriptivne statistike:
Srednja vrijednost: Srednja vrijednost je prosjek svih brojeva i ponekad se naziva aritmetička sredina. Srednju vrijednost izračunavate zbrajanjem svih vrijednosti i dijeljenjem s brojem brojeva. Formula za srednju vrijednost je:
\( \textrm{Zlobno} = \frac{\sum_{i=1}^{n} x_i}{n} \)gdje \(x_i\) predstavlja svaku vrijednost u skupu podataka, a \(n\) je broj vrijednosti.
Medijan: Medijan je srednja vrijednost na popisu brojeva. Da biste pronašli medijan, trebate posložiti svoje brojeve uzlaznim redoslijedom i pronaći srednji broj. Ako postoji paran broj opažanja, medijan je prosjek dva srednja broja.
Način: način je vrijednost koja se najčešće pojavljuje u skupu podataka. Skup podataka može imati jedan način, više od jednog načina ili uopće ne može imati način.
Raspon: Raspon je razlika između najviše i najniže vrijednosti u skupu podataka. To je najjednostavnija mjera varijabilnosti.
Varijanca: Varijanca mjeri koliko se brojevi u skupu podataka razlikuju od srednje vrijednosti. Varijanca se izračunava uzimanjem prosjeka kvadrata razlika od srednje vrijednosti. Formula za varijancu ( \(\sigma^2\) ) je:
\( \sigma^2 = \frac{\sum_{i=1}^{n} (x_i - \textrm{Zlobno})^2}{n} \)Standardna devijacija: Standardna devijacija je mjera količine varijacije ili disperzije skupa vrijednosti. To je kvadratni korijen varijance, čime se daje mjera koja je u istim jedinicama kao i podaci. Formula za standardnu devijaciju ( \(\sigma\) ) je:
\( \sigma = \sqrt{\frac{\sum_{i=1}^{n} (x_i - \textrm{Zlobno})^2}{n}} \)Deskriptivna statistika također može uključivati korištenje grafikona i dijagrama za vizualni sažetak distribucije, središnje tendencije i varijabilnosti skupa podataka. Uobičajeni grafički prikazi uključuju:
Razmotrite skup podataka koji se sastoji od rezultata testova 20 učenika u razredu:
85, 82, 88, 95, 70, 90, 78, 84, 80, 96, 72, 88, 92, 94, 94, 90, 76, 97, 84, 82
Da sažmemo ove podatke, možemo izračunati mjere središnje tendencije i varijabilnosti:
Razumijevanje ove osnovne deskriptivne statistike omogućuje nam da dobijemo brzi sažetak rezultata, utvrdimo koliko variraju i pronađemo opću tendenciju uspješnosti razreda.
Deskriptivna statistika ključna je za sažimanje i razumijevanje podataka. Oni su prvi korak u analizi podataka, pružajući temelj za složeniju statističku analizu. Identificiranjem središnjih mjera i varijabilnosti možemo dobiti smislene uvide u prirodu podataka i donijeti informirane odluke na temelju tih uvida.