Beskrivande statistik används för att sammanfatta eller beskriva de grundläggande egenskaperna hos data i en studie. De ger enkla sammanfattningar om urvalet och åtgärderna. Genom beskrivande statistik kan vi presentera kvantitativa beskrivningar i en hanterbar form. I en forskningsstudie kan vi ha massor av mått. Beskrivande statistik hjälper oss att förenkla stora datamängder på ett vettigt sätt.
Det finns två huvudtyper av beskrivande statistik:
Medel: Medelvärdet är medelvärdet av alla tal och kallas ibland för det aritmetiska medelvärdet. Du beräknar medelvärdet genom att lägga ihop alla värden och dividera med antalet siffror. Formeln för medelvärdet är:
\( \textrm{Betyda} = \frac{\sum_{i=1}^{n} x_i}{n} \)där \(x_i\) representerar varje värde i datamängden och \(n\) är antalet värden.
Median: Medianen är mittvärdet i en lista med tal. För att hitta medianen måste du ordna dina nummer i stigande ordning och hitta mittentalet. Om det finns ett jämnt antal observationer är medianen medelvärdet av de två mittentalen.
Läge: Läget är det värde som förekommer oftast i en datamängd. En datauppsättning kan ha ett läge, mer än ett läge eller inget läge alls.
Intervall: Intervallet är skillnaden mellan de högsta och lägsta värdena i en datauppsättning. Det är det enklaste måttet på variabilitet.
Varians: Varians mäter hur mycket talen i en datauppsättning skiljer sig från medelvärdet. Variansen beräknas genom att ta medelvärdet av de kvadratiska skillnaderna från medelvärdet. Formeln för varians ( \(\sigma^2\) ) är:
\( \sigma^2 = \frac{\sum_{i=1}^{n} (x_i - \textrm{Betyda})^2}{n} \)Standardavvikelse: Standardavvikelsen är ett mått på mängden variation eller spridning av en uppsättning värden. Det är kvadratroten av variansen, vilket ger ett mått som är i samma enheter som data. Formeln för standardavvikelse ( \(\sigma\) ) är:
\( \sigma = \sqrt{\frac{\sum_{i=1}^{n} (x_i - \textrm{Betyda})^2}{n}} \)Beskrivande statistik kan också involvera användningen av grafer och plots för att visuellt sammanfatta fördelningen, centrala tendensen och variabiliteten hos en datamängd. Vanliga grafiska representationer inkluderar:
Tänk på en datauppsättning som består av testresultaten för 20 elever i en klass:
85, 82, 88, 95, 70, 90, 78, 84, 80, 96, 72, 88, 92, 94, 94, 90, 76, 97, 84, 82
För att sammanfatta dessa data kan vi beräkna måtten på central tendens och variabilitet:
Genom att förstå denna grundläggande beskrivande statistik kan vi få en snabb sammanfattning av poängen, identifiera hur mycket de varierar och hitta den allmänna tendensen hos klassens prestationer.
Beskrivande statistik är avgörande för att sammanfatta och förstå data. De är det första steget i dataanalys och ger en grund för mer komplex statistisk analys. Genom att identifiera de centrala måtten och variabiliteten kan vi få meningsfulla insikter i datas natur och fatta välgrundade beslut baserat på dessa insikter.