Google Play badge

beschrijvende statistieken


Inleiding tot beschrijvende statistiek

Beschrijvende statistiek wordt gebruikt om de basiskenmerken van gegevens in een onderzoek samen te vatten of te beschrijven. Ze geven eenvoudige samenvattingen over de steekproef en de maatregelen. Via beschrijvende statistiek kunnen we kwantitatieve beschrijvingen in een hanteerbare vorm presenteren. In een onderzoek kunnen we veel maatregelen nemen. Beschrijvende statistiek helpt ons grote hoeveelheden gegevens op een verstandige manier te vereenvoudigen.

Soorten beschrijvende statistieken

Er zijn twee hoofdtypen beschrijvende statistieken:

Maatregelen van centrale tendens

Gemiddelde: Het gemiddelde is het gemiddelde van alle getallen en wordt ook wel het rekenkundig gemiddelde genoemd. Je berekent het gemiddelde door alle waarden bij elkaar op te tellen en te delen door het aantal getallen. De formule voor het gemiddelde is:

\( \textrm{Gemeen} = \frac{\sum_{i=1}^{n} x_i}{n} \)

waarbij \(x_i\) elke waarde in de gegevensset vertegenwoordigt en \(n\) het aantal waarden is.

Mediaan: De mediaan is de middelste waarde in een lijst met getallen. Om de mediaan te vinden, moet u uw getallen in oplopende volgorde rangschikken en het middelste getal vinden. Als er een even aantal waarnemingen is, is de mediaan het gemiddelde van de twee middelste getallen.

Modus: De modus is de waarde die het vaakst voorkomt in een dataset. Een dataset kan één modus, meer dan één modus of helemaal geen modus hebben.

Maatregelen van variabiliteit

Bereik: Het bereik is het verschil tussen de hoogste en laagste waarden in een gegevensset. Het is de eenvoudigste maatstaf voor variabiliteit.

Variantie: Variantie meet hoeveel de getallen in een dataset verschillen van het gemiddelde. De variantie wordt berekend door het gemiddelde van de gekwadrateerde verschillen van het gemiddelde te nemen. De formule voor variantie ( \(\sigma^2\) ) is:

\( \sigma^2 = \frac{\sum_{i=1}^{n} (x_i - \textrm{Gemeen})^2}{n} \)

Standaardafwijking: De standaardafwijking is een maatstaf voor de hoeveelheid variatie of spreiding van een reeks waarden. Het is de vierkantswortel van de variantie en geeft dus een maatstaf die in dezelfde eenheden ligt als de gegevens. De formule voor standaardafwijking ( \(\sigma\) ) is:

\( \sigma = \sqrt{\frac{\sum_{i=1}^{n} (x_i - \textrm{Gemeen})^2}{n}} \)
Visuele weergave van gegevens

Beschrijvende statistiek kan ook het gebruik van grafieken en plots omvatten om de distributie, centrale tendens en variabiliteit van een dataset visueel samen te vatten. Veel voorkomende grafische weergaven zijn onder meer:

Voorbeeld: gegevens begrijpen via beschrijvende statistieken

Beschouw een dataset bestaande uit de testscores van 20 leerlingen in een klas:

85, 82, 88, 95, 70, 90, 78, 84, 80, 96, 72, 88, 92, 94, 94, 90, 76, 97, 84, 82

Om deze gegevens samen te vatten, kunnen we de metingen van centrale tendens en variabiliteit berekenen:

Door deze fundamentele beschrijvende statistieken te begrijpen, kunnen we snel een samenvatting van de scores krijgen, vaststellen hoe sterk ze variëren, en de algemene tendens van de klasprestaties ontdekken.

Conclusie

Beschrijvende statistieken zijn cruciaal voor het samenvatten en begrijpen van gegevens. Ze vormen de eerste stap in de data-analyse en vormen een basis voor complexere statistische analyses. Door de centrale metingen en variabiliteit te identificeren, kunnen we betekenisvolle inzichten krijgen in de aard van de gegevens en weloverwogen beslissingen nemen op basis van die inzichten.

Download Primer to continue