Ang mga deskriptibong istatistika ay ginagamit upang ibuod o ilarawan ang mga pangunahing katangian ng datos sa isang pag-aaral. Nagbibigay sila ng mga simpleng buod tungkol sa sample at mga panukala. Sa pamamagitan ng mga deskriptibong istatistika, maaari kaming magpakita ng mga quantitative na paglalarawan sa isang mapapamahalaang anyo. Sa isang pananaliksik na pag-aaral, maaari tayong magkaroon ng maraming mga hakbang. Tinutulungan kami ng mga mapaglarawang istatistika na gawing simple ang malaking halaga ng data sa isang makatwirang paraan.
Mayroong dalawang pangunahing uri ng mga deskriptibong istatistika:
Mean: Ang mean ay ang average ng lahat ng mga numero at kung minsan ay tinatawag na arithmetic mean. Kinakalkula mo ang ibig sabihin sa pamamagitan ng pagdaragdag ng lahat ng mga halaga at paghahati sa bilang ng mga numero. Ang formula para sa mean ay:
\( \textrm{ibig sabihin} = \frac{\sum_{i=1}^{n} x_i}{n} \)kung saan ang \(x_i\) ay kumakatawan sa bawat value sa dataset at \(n\) ay ang bilang ng mga value.
Median: Ang median ay ang gitnang halaga sa isang listahan ng mga numero. Upang mahanap ang median, kailangan mong ayusin ang iyong mga numero sa pataas na pagkakasunud-sunod at hanapin ang gitnang numero. Kung mayroong kahit na bilang ng mga obserbasyon, ang median ay ang average ng dalawang gitnang numero.
Mode: Ang mode ay ang value na pinakamadalas na lumalabas sa isang set ng data. Ang isang dataset ay maaaring may isang mode, higit sa isang mode, o walang mode.
Saklaw: Ang hanay ay ang pagkakaiba sa pagitan ng pinakamataas at pinakamababang halaga sa isang dataset. Ito ang pinakasimpleng sukatan ng pagkakaiba-iba.
Variance: Sinusukat ng variance kung gaano kalaki ang pagkakaiba ng mga numero sa isang dataset sa mean. Ang pagkakaiba ay kinakalkula sa pamamagitan ng pagkuha ng average ng mga squared na pagkakaiba mula sa Mean. Ang formula para sa variance ( \(\sigma^2\) ) ay:
\( \sigma^2 = \frac{\sum_{i=1}^{n} (x_i - \textrm{ibig sabihin})^2}{n} \)Standard Deviation: Ang standard deviation ay isang sukatan ng dami ng variation o dispersion ng isang set ng mga value. Ito ang square root ng variance, kaya nagbibigay ng sukat na nasa parehong mga yunit ng data. Ang formula para sa standard deviation ( \(\sigma\) ) ay:
\( \sigma = \sqrt{\frac{\sum_{i=1}^{n} (x_i - \textrm{ibig sabihin})^2}{n}} \)Ang mga deskriptibong istatistika ay maaari ding kasangkot sa paggamit ng mga graph at plot upang biswal na ibuod ang pamamahagi, sentral na tendency, at pagkakaiba-iba ng isang dataset. Kasama sa mga karaniwang graphical na representasyon ang:
Isaalang-alang ang isang dataset na binubuo ng mga marka ng pagsusulit ng 20 mag-aaral sa isang klase:
85, 82, 88, 95, 70, 90, 78, 84, 80, 96, 72, 88, 92, 94, 94, 90, 76, 97, 84, 82
Upang ibuod ang data na ito, maaari nating kalkulahin ang mga sukat ng sentral na tendensya at pagkakaiba-iba:
Ang pag-unawa sa mga pangunahing deskriptibong istatistika na ito ay nagbibigay-daan sa amin na makakuha ng mabilis na buod ng mga marka, tukuyin kung gaano kalawak ang pagkakaiba-iba ng mga ito, at hanapin ang pangkalahatang ugali ng pagganap ng klase.
Ang mga deskriptibong istatistika ay mahalaga para sa pagbubuod at pag-unawa sa data. Sila ang unang hakbang sa pagsusuri ng data, na nagbibigay ng pundasyon para sa mas kumplikadong pagsusuri sa istatistika. Sa pamamagitan ng pagtukoy sa mga pangunahing hakbang at pagkakaiba-iba, makakakuha tayo ng mga makabuluhang insight sa likas na katangian ng data at makagawa ng matalinong mga desisyon batay sa mga insight na iyon.