Tanımlayıcı istatistikler, bir çalışmadaki verilerin temel özelliklerini özetlemek veya açıklamak için kullanılır. Örneklem ve önlemler hakkında basit özetler sağlarlar. Tanımlayıcı istatistikler aracılığıyla niceliksel açıklamaları yönetilebilir bir biçimde sunabiliriz. Bir araştırma çalışmasında birçok önlemimiz olabilir. Tanımlayıcı istatistikler büyük miktarda veriyi anlamlı bir şekilde basitleştirmemize yardımcı olur.
Tanımlayıcı istatistiklerin iki ana türü vardır:
Ortalama: Ortalama, tüm sayıların ortalamasıdır ve bazen aritmetik ortalama olarak da adlandırılır. Ortalamayı, tüm değerleri toplayıp sayı sayısına bölerek hesaplarsınız. Ortalamanın formülü şöyledir:
\( \textrm{Anlam} = \frac{\sum_{i=1}^{n} x_i}{n} \)burada \(x_i\) veri kümesindeki her değeri temsil eder ve \(n\) değerlerin sayısıdır.
Medyan: Medyan, sayı listesindeki ortadaki değerdir. Medyanı bulmak için sayılarınızı artan sırada düzenlemeniz ve ortadaki sayıyı bulmanız gerekir. Çift sayıda gözlem varsa medyan ortadaki iki sayının ortalamasıdır.
Mod: Mod, bir veri setinde en sık görülen değerdir. Bir veri kümesinde bir mod, birden fazla mod bulunabilir veya hiç mod olmayabilir.
Aralık: Aralık, bir veri kümesindeki en yüksek ve en düşük değerler arasındaki farktır. Değişkenliğin en basit ölçüsüdür.
Varyans: Varyans, bir veri kümesindeki sayıların ortalamadan ne kadar farklı olduğunu ölçer. Varyans, Ortalamadan kare farkların ortalaması alınarak hesaplanır. Varyans formülü ( \(\sigma^2\) ) şöyledir:
\( \sigma^2 = \frac{\sum_{i=1}^{n} (x_i - \textrm{Anlam})^2}{n} \)Standart Sapma: Standart sapma, bir değerler kümesindeki değişim veya dağılım miktarının ölçüsüdür. Varyansın kareköküdür, dolayısıyla verilerle aynı birimlerde olan bir ölçüm verir. Standart sapmanın formülü ( \(\sigma\) ) şöyledir:
\( \sigma = \sqrt{\frac{\sum_{i=1}^{n} (x_i - \textrm{Anlam})^2}{n}} \)Tanımlayıcı istatistikler ayrıca bir veri kümesinin dağılımını, merkezi eğilimini ve değişkenliğini görsel olarak özetlemek için grafiklerin ve grafiklerin kullanımını da içerebilir. Yaygın grafik gösterimler şunları içerir:
Bir sınıftaki 20 öğrencinin test puanlarından oluşan bir veri kümesini düşünün:
85, 82, 88, 95, 70, 90, 78, 84, 80, 96, 72, 88, 92, 94, 94, 90, 76, 97, 84, 82
Bu verileri özetlemek gerekirse, merkezi eğilim ve değişkenlik ölçülerini hesaplayabiliriz:
Bu temel tanımlayıcı istatistikleri anlamak, puanların hızlı bir özetini almamıza, bunların ne kadar geniş çapta değiştiğini belirlememize ve sınıf performansının genel eğilimini bulmamıza olanak sağlar.
Tanımlayıcı istatistikler, verileri özetlemek ve anlamak için çok önemlidir. Veri analizinin ilk adımıdırlar ve daha karmaşık istatistiksel analizler için bir temel sağlarlar. Merkezi ölçümleri ve değişkenliği tanımlayarak, verilerin doğasına ilişkin anlamlı içgörüler elde edebilir ve bu içgörülere dayanarak bilinçli kararlar alabiliriz.