Thống kê mô tả được sử dụng để tóm tắt hoặc mô tả các đặc điểm cơ bản của dữ liệu trong một nghiên cứu. Họ cung cấp những tóm tắt đơn giản về mẫu và các thước đo. Thông qua thống kê mô tả, chúng ta có thể trình bày các mô tả định lượng ở dạng có thể quản lý được. Trong một nghiên cứu, chúng ta có thể có rất nhiều thước đo. Thống kê mô tả giúp chúng ta đơn giản hóa lượng lớn dữ liệu một cách hợp lý.
Có hai loại thống kê mô tả chính:
Giá trị trung bình: Giá trị trung bình là giá trị trung bình của tất cả các số và đôi khi được gọi là giá trị trung bình số học. Bạn tính giá trị trung bình bằng cách cộng tất cả các giá trị và chia cho số lượng. Công thức tính giá trị trung bình là:
\( \textrm{Nghĩa là} = \frac{\sum_{i=1}^{n} x_i}{n} \)trong đó \(x_i\) đại diện cho từng giá trị trong tập dữ liệu và \(n\) là số lượng giá trị.
Trung vị: Trung vị là giá trị ở giữa trong danh sách các số. Để tìm số trung vị, bạn cần sắp xếp các số theo thứ tự tăng dần và tìm số ở giữa. Nếu có số quan sát chẵn thì số trung vị là trung bình cộng của hai số ở giữa.
Chế độ: Chế độ là giá trị xuất hiện thường xuyên nhất trong tập dữ liệu. Một tập dữ liệu có thể có một chế độ, nhiều chế độ hoặc không có chế độ nào cả.
Phạm vi: Phạm vi là sự khác biệt giữa giá trị cao nhất và thấp nhất trong tập dữ liệu. Đây là thước đo đơn giản nhất của sự biến thiên.
Phương sai: Phương sai đo lường mức độ khác nhau của các số trong tập dữ liệu so với giá trị trung bình. Phương sai được tính bằng cách lấy trung bình của các sai phân bình phương từ Giá trị trung bình. Công thức cho phương sai ( \(\sigma^2\) ) là:
\( \sigma^2 = \frac{\sum_{i=1}^{n} (x_i - \textrm{Nghĩa là})^2}{n} \)Độ lệch chuẩn: Độ lệch chuẩn là thước đo mức độ biến thiên hoặc độ phân tán của một tập hợp các giá trị. Nó là căn bậc hai của phương sai, do đó đưa ra thước đo có cùng đơn vị với dữ liệu. Công thức cho độ lệch chuẩn ( \(\sigma\) ) là:
\( \sigma = \sqrt{\frac{\sum_{i=1}^{n} (x_i - \textrm{Nghĩa là})^2}{n}} \)Thống kê mô tả cũng có thể liên quan đến việc sử dụng đồ thị và sơ đồ để tóm tắt một cách trực quan sự phân bố, xu hướng trung tâm và tính biến thiên của tập dữ liệu. Các biểu diễn đồ họa phổ biến bao gồm:
Hãy xem xét một tập dữ liệu bao gồm điểm kiểm tra của 20 học sinh trong một lớp:
85, 82, 88, 95, 70, 90, 78, 84, 80, 96, 72, 88, 92, 94, 94, 90, 76, 97, 84, 82
Để tóm tắt dữ liệu này, chúng ta có thể tính toán các thước đo về xu hướng trung tâm và độ biến thiên:
Hiểu được những thống kê mô tả cơ bản này cho phép chúng ta có được bản tóm tắt nhanh về điểm số, xác định mức độ khác nhau của chúng và tìm ra xu hướng chung về thành tích của lớp.
Thống kê mô tả rất quan trọng để tóm tắt và hiểu dữ liệu. Chúng là bước đầu tiên trong phân tích dữ liệu, cung cấp nền tảng cho phân tích thống kê phức tạp hơn. Bằng cách xác định các thước đo trung tâm và tính biến thiên, chúng ta có thể có được những hiểu biết sâu sắc có ý nghĩa về bản chất của dữ liệu và đưa ra quyết định sáng suốt dựa trên những hiểu biết đó.