البيانات المجمعة هو مصطلح يستخدم في الإحصائيات لوصف البيانات التي تم تنظيمها في مجموعات أو فئات. ويتم ذلك غالبًا لتبسيط البيانات، وتسهيل تحليلها، وتحديد الأنماط أو الاتجاهات داخل مجموعة البيانات.
يمكن أن يكون تجميع البيانات مفيدًا في التحليلات الإحصائية المختلفة لأنه يقلل من تعقيد البيانات، مما يسهل تصورها وتفسيرها. إنه مفيد بشكل خاص عند التعامل مع مجموعة كبيرة من نقاط البيانات التي تغطي نطاقًا واسعًا من القيم. ومن خلال تجميع البيانات، يمكنك الحصول على فهم أفضل لتوزيعها واتجاهاتها المركزية.
هناك نوعان رئيسيان من البيانات المجمعة:
لإنشاء بيانات مجمعة من البيانات الأولية، اتبع الخطوات التالية:
هناك عدة طرق لتمثيل البيانات المجمعة، بما في ذلك الجداول التكرارية والرسوم البيانية والمخططات الشريطية. توفر كل طريقة تمثيلاً مرئيًا للبيانات، مما يسهل تحليلها.
يعد الجدول التكراري طريقة بسيطة لعرض البيانات المجمعة. يُظهر الفواصل الزمنية وعدد نقاط البيانات (التردد) التي تقع في كل فاصل زمني. على سبيل المثال، قد يبدو الجدول التكراري للبيانات المجمعة حول ارتفاعات الطلاب كما يلي:
فاصل الارتفاع (سم) | تكرار |
---|---|
150-159 | 5 |
160-169 | 8 |
170-179 | 7 |
180-189 | 2 |
باستخدام البيانات المجمعة، لا يزال بإمكانك حساب مقاييس الاتجاه المركزي، مثل المتوسط والوسيط والمنوال، ولكن الطرق مختلفة قليلاً.
متوسط البيانات المجمعة: يمكن تقدير المتوسط (أو المتوسط) عن طريق ضرب نقطة المنتصف لكل فاصل زمني بتكرار ذلك الفاصل الزمني، وجمع هذه المنتجات، ثم القسمة على إجمالي عدد نقاط البيانات. يتم إعطاء الصيغة بواسطة:
\( \textrm{يقصد} = \frac{\sum(\textrm{نقطة المنتصف} \times \textrm{تكرار})}{\textrm{التردد الإجمالي}} \)متوسط البيانات المجمعة: الوسيط هو القيمة التي تقسم البيانات إلى جزأين متساويين. للعثور على الوسيط في البيانات المجمعة، تحتاج إلى العثور على الفاصل الزمني الذي يحتوي على القيمة (القيم) الوسطى. يتضمن هذا غالبًا استخدام التردد التراكمي.
وضع البيانات المجمعة: الوضع هو القيمة الأكثر شيوعًا في مجموعة البيانات. بالنسبة للبيانات المجمعة، يكون الوضع هو الفاصل الزمني ذو التردد الأعلى.
خذ بعين الاعتبار الجدول التكراري المذكور سابقًا لارتفاعات الطلاب. لحساب الارتفاع المتوسط، حدد أولاً نقاط المنتصف لكل فاصل زمني:
بعد ذلك، اضرب كل نقطة وسط في التكرار المقابل واجمع هذه النواتج:
\( \textrm{مجموع المنتجات} = (154.5 \times 5) + (164.5 \times 8) + (174.5 \times 7) + (184.5 \times 2) \)ثم قم بتقسيم مجموع المنتجات على التكرار الإجمالي للعثور على المتوسط:
\( \textrm{متوسط الارتفاع} = \frac{\textrm{مجموع المنتجات}}{\textrm{التردد الإجمالي}} \)يعطي هذا الحساب تقديرًا لمتوسط الطول بين الطلاب.
تلعب البيانات المجمعة دورًا حاسمًا في التحليل الإحصائي من خلال تمكين الباحثين والمحللين من:
في حين أن البيانات المجمعة مفيدة للتحليل، إلا أن لها بعض القيود:
تعد البيانات المجمعة أداة قوية في الإحصائيات، حيث توفر طريقة لإدارة مجموعات البيانات الكبيرة وتحليلها. من خلال فهم كيفية تجميع البيانات وإنشاء الجداول التكرارية وحساب مقاييس الاتجاه المركزي للبيانات المجمعة، يمكن للمحللين الحصول على رؤى قيمة حول الأنماط والاتجاهات داخل بياناتهم. على الرغم من القيود المفروضة عليها، تظل البيانات المجمعة مفهومًا أساسيًا في مجال الإحصاء، مما يتيح إجراء تحليل أكثر كفاءة وهادفًا.