جداول التوزيعات التكرارية الاحصاء البيانات
  Frequency  Distributions
تأخذ الظواهر الإحصائية المدروسة قيماً عددية كثيرة ومتكررة وفي بعض الأحيان تكون النتائج الملاحظة غير عددية ، فيمكن في هذه الحالات تحويلها إلى قيم عددية ، مثلاً يمكن تحويل
" نعم " أو " لا " أو " صح " أو " خطأ " إلى " مع " أو " ضد " وبالتالي إلى
"
1 " أو " صفر " . مما يسمح لنا بتشكيل جداول تكرارية ، كما هو عليه الحال أثناء توزيع درجات الطلاب في مقرر الإحصاء مثلاً أو تصنيف أعمار  عناصر مجتمع معين أو كمية السيارات المستوردة من بلد معين  .
إن تصنيف وتبويب مجمل البيانات المدروسة يعني بالضرورة ترتيب هذه البيانات تصاعديا أو تنازلياً مما يسمح لنا استخلاص صورة واضحة عن المدى "Range" الذي تتراوح فيه البيانات على عدد من الفئات "Classes" معتبرين هذه الفئات وجوها للظاهرة المدروسة حيث يتم تفريغ المعلومات على أساس هذه الفئات، ومن ثم نحدد العدد المقابل لكل فئة من هذه الفئات لنستنتج تكرارات القيم العددية ضمن فئاتها . ونسمي الجدول الذي يضم الفئات والتكرارات المقابلة لها جدول التوزيع التكراري Frequency  Distribution Table .
لنفرض أننا قمنا بتقسيم قراءات ظاهرة معينة والبالغ عددها n قراءة إلى k فئة ، فإننا نسمي في هذه الحالة نسبة تكرار كل فئة على المجموع الكلي للتكرارات بالتكرار النسبي .
إذا رمزنا لتكرار الفئةi  بالرمز fi فإننا نجد أن :
وهذا أمر منطقي لأن . لاحظ ذلك في العمود الأخير في الجدول 1-1  في الفقرة السابقة .

إن الرمز  هو حرف يوناني ويقرأ سيكما)   (segma ويرمز هنا كما يرمز دوماً للمجموع .
هذا ويمكن إدراج مراحل إنشاء الجداول التكرارية لمجموعة من البيانات بالشكل التالي :
1- اختيار عدد الفئات وطول كل فئة وهذا بالطبع يعتمد على شكل البيانات المعطاة وهدف التوزيع التكراري ويجب أن نأخذ بعين الاعتبار ما يأتي :
نختار عدد الفئات بين 6 و 15 فئة والسبب في اختيار عدد قليل من الفئات قد يفقد البيانات توزيعها الأصلي ويجمعها في منطقة صغيرة بينما اختيار عدد كبير من الفئات يشتت انتباه القارئ ويفقد التوزيع الأصلي أهميته بالإضافة إلى حصولنا على عدد من الفئات الصفرية التي لا تحوي على أي بيانات أو قيم لمشاهدات .
2- نتأكد دوماً من أن كل قراءة ( رقم ) من البيانات أو مشاهدة تقع في فئة واحدة (وواحدة فقط) ونحرص على عدم التقاطع .
والمقصود بذلك أن نكون يقظين عند القراءات الحدية والواقعة بين فئتين متتاليتين أن تنتمي إلى أحد الفئتين وليس لكليهما، وبالتالي لا تحوي الفئات المتتالية بيانات أو أرقام مشتركة ولهذا الغرض نقوم بإضافة نصف واحدة دقه إلى الحد الأعلى للفئة ونطرح نصف واحدة دقه من الحد الأدنى للفئة وهذا ما نسميه حدود الفئة الفعلية Class boundaries” "  ، في حالة الأعداد الصحيحة أو البيانات المتقطعة, بينما نضيف ونطرح 0.05  أو 005.0 حسب عدد خانات العدد .
3- نجعل الفئات ذات أطول متساوية وبالتالي تغطي مجالات متساوية . مع العلم أنه يمكن أن تكون الفئات ذات أطوال مختلفة ولكن لن نتعرض لدراسة هذا النوع من الجداول التكرارية في هذا الكتاب.
ومن الأسهل أن تختار أطوال الفئات من الشكل 1000 , 100 , 10  ,  5 وذلك لتسهيل الدراسة .

هذا ويمكن لنا اختيار مجالات الفئات ( أطوالها  ) بحيث تكون مغلقة أو نصف مغلقة أو نصف مفتوحة وذلك باختيار أقل من أو أقل أو يساوي “ less than or equal “  أو less وذلك لتقليل عدد الفئات المطلوبة عندما يكون عدد كبير من الفئات أصغر بكثير أو أكبر بكثير من باقي الفئات، ومع ذلك  يجب الامتناع عن ذلك إن أمكن وذلك لصعوبة الحسابات الناتجة عن ذلك .

         تجدر الإشارة هنا أنه يمكن وبصورة دائمة أن تكون القراءات معطاة لأقرب وحدة فيمكن أن تقول أن الدخل الشهري لأقرب مائة دينار أو طول شخص  لأقرب سنتيمتر أو البعد لأقرب كيلومتر وهكذا وذلك لتفادي الإسهاب في الدقة ومن ثم صرف النظر عن النقطة الأهم وهي الدراسة المطلوبة
ولأجل توضيح الفقرات الواردة أعلاه لابد من المرور بالخطوات السابقة عملياً من خلال المثال التالي حيث سنقوم بتفريغ مجموعة البيانات في جدول التوزيع التكراري آخذين بعين الاعتبار ما ورد أعلاه.
مثال :
تمثل  القراءات التالية الفترات الزمنية التي يقضيها 80 طالباً من طلاب كليات الجامعة في المكتبة أسبوعياً.
شكل جدول توزيع تكراري لهذه البيانات .
16
23
16
20
12
17
28
22
15
24
29
16
30
17
21
11
18
23
15
22
24
29
18
28
20
14
18
19
39
19
18
20
23
17
25
29
12
34
22
20
16
17
19
15
21
18
27
32
14
24
22
25
15
23
13
24
26
23
19
21
16
18
15
22
10
20
23
18
16
25
31
27
21
20
19
21
20
17
26
15
الحل :
بما أن أصغر قراءة هي 10 وأكبر قراءة 39 فيمكن حساب المدى وهو الفرق بين أكبر قراءة وأصغر قراءة وهو R = 39-10=29 .
باختيار عدد الفئات 6 يمكن أن نحسب طول الفئة وهي هنا 6 = 4.833 ~ 5 ÷ 29
وفي مثل هذه الحالات يقرب الناتج للأعلى دوماً ، أي لأقرب عدد صحيح تالي. وبالتالي فإن حدود الفئات هي   
10-14 , 15-19 , 20-24 , 25-29 , 30-34  and 35-39
لاحظ أنه يمكن اختيار عدد آخر للفئات فإذا اخترنا العدد 8 مثلاً فإن أطوال الفئات سيكون
   8 = 3.625 ~ 4÷ 29 وسوف تكون الفئات الثمان كالتالي:
10-13 , 14-17 , 18-21 , 22-25 , 26-29 , 30-33  , 34-37 , 38-41
وهنا يمكن أن نذكر القارئ بأن الرقم 41 غير موجود في البيانات أصلاً ووجوده هنا لا يؤثر على البيانات الأصلية وإنما وضعناه لكي تكون أطوال الفئات متساوية كما ويمكن أن نبدأ بعدد أصغر من الرقم 10 الذي هو أصغر قراءة موجودة ولنفس السبب . لقد ذكرنا هنا إمكانيتين للتوضيح فقط وسنتابع شرح المثال على ست فئات والسبب في ذلك التفاصيل التي ذكرت سابقاً وهي أن أطوال الفئات يمكن أن تكون …. 100 , 10 , 5   ، ثم نصنف هذه البيانات وفق الفئات الست
لاحظ في الجدول أن الحدود الفعلية للفئة الأولى 9.5-14.5 وللفئة الثانية 14.5-19.5 ..... وهكذا.

ونحصل على هذه الحدود بطرح و جمع نصف واحدة دقة للحد الادنى والحد الاعلى على الترتيب .
والمقصود بنصف واحدة الدقة هو (0.5) اذا كانت البيانات صحيحة و(0.05) اذا كانت البيانات تحتوي على عدد عشري واحد بعد الفاصلة و(0.005) اذا كانت البيانات تحتوي على عددين عشريين بعد الفاصلة .
وفي الجدول أعلاه يمثل العمود في أقصى اليمين  التكرار(Frequency ) عدد مرات وقوع القراءات  في الفئات الملائمة وهو ما ندعوه تردد الفئة أو التكرار Class Frequency .
إن أصغر رقم وأكبر رقم في عمود  أقصى اليسار " الساعات hours " يعبر عنه بحدود الفئات
 
Class limits فالأرقام
35
30
25
20
15
10
هي الحدود الدنيا للفئات بينما                       
39
34
29
24
19
14
فتسمى الحدود العليا للفئات Lower class limits and Upper class limits على الترتيب .
في هذا المثال قربت فترات الدراسة لأقرب ساعة وهذا يعني أن الفئة الأولى تغطي الفترة من 9.5 إلى 14.5 والفترة الثانية من 14.5 إلى 19.5 ساعة وهكذا ... تدعى هذه الأرقام حدود الفئات الفعلية
Class boundaries” "أو " Real class limits "، إن حدود الفئات هي الأكثر استعمالاً أو شيوعاً .
تعتبر مراكز الفئات Class marks إحدى عناصر التوزيعات التكرارية الهامة وهي بالتعريف منتصف طول الفئة ونحصل عليه بإضافة الحد الأدنى للفئة لحدها الأعلى وقسمة الناتج على 2 أي
 
( a+b )/ 2 حيث a الحد الأدنى b  الحد الأعلى . أما طول الفئة Class interval   فهو الفرق بين الحد الأعلى الفعلي و الحد الأدنى الفعلي وغالباً ما يسمى مدى الفئة . نحصل على مراكز الفئات بحساب مركز الفئة الأولى ومن ثم نضيف له طول الفئة فنحصل على مركز الفئة الثانية ، نضيف طول الفئة للناتج فنحصل على مركز الفئة التالي وهكذا . وبالعكس فإن الفرق بين مركزي فئتين متتاليتين يعطي طول الفئة .
مثال :
أوجد مراكز الفئات وأطوال الفئات في المثال السابق .
إن مراكز الفئات  Class markهي على الترتيب (10+14)/2 =12  ثم (15+19 )/2 =17  ... وهكذا وأخيراً (35+39 ) /2 =37 . ولحساب طول الفئة لاحظ هنا أن    17-12=5 .

قد نكون بحاجة إلى معيار آخر ويدعى بتكرار التوزيع النسبي  المئوي Percentage-distribution  ويحسب بقسمة تكرار كل فئة  على المجموع العام وضرب الناتج بـ 100. أو معيارا آخر و يدعى التكرار النسبي والذي يحسب بقسمة التكرار لكل فئة على المجموع العام  Relative frequency) ).
مثال :
احسب تكرار التوزيع النسبي percentage  distribution للفترات الزمنية التي قضاها   80 طالباً في المكتبة خلال أسبوع ما والمفرغة في الجدول 2-3 .
الحل :
لقد شاهدنا في الجدول 3-2 التردد لكل فئة وبالتالي يمكن قسمة تردد كل فئة على المجموع الكلي وضرب الناتج بـــ 100 أي أن الفئة الأولى تحوي  من البيانات وبالنسبة للفئة الثانية فتحوي  من البيانات و...... هكذا، وأخيراً الفئة الأخيرة تحوي  من البيانات . وهكذا يمكن تلخيص ذلك بجدول على غرار الجدول السابق يحتوي نتائج المثال الحالي والسابق بالشكل الآتي :
هذا ويمكن تعديل جدول التوزيع وتحويله إلى جدول من الشكل " أقل من أو يساوي " أو
" أقل من " أو "أكثر من " وهذا ما يدعى بــ " التوزيعات التكرارية المتجمعة "
 
Cumulative frequency distribution  .ونحصل على ذلك بجمع تكرار الفئات بداية من الفئة الأولى إلى الثانية ، الناتج إلى الثالثة الناتج الى الرابعة ...وهكذا . 
مثال:
شكل جدول توزيع متجمع " أقل من "Less than) ) للبيانات الواردة في المثال الأول أعلاه والمفرغة في الجدول 3-2
الحل :
لا توجد قيم أقل من 8 , 10 قيم أقل من 8+28=36 , 15 قيمة أقل من   20..... وهكذا .فيمكن  بالتالي ترتيب النتائج في جدول تجميعي " صاعد "
هناك جداول تكرارية معاكسة للجدول التكراري الصاعد  5-2وهي جداول تكرارية تناقصية و مشابهة للجدول 5-2 أعلاه ولكنها تتناقص من المجموع .إن مجموع القيم السابقة هو 80 فتكون الفئة الثانية 80-8=72 والفئة الثالثة 72-28 = 44 وهكذا . ويكون التكرار المتناقص للفئة الأخيرة 0 . لاحظ في العمود الاخير هناك 80 قراءة أكبر من   10 لكن 0  قراءة اقل من 10 ، 8 قراءات  أقل من 15 ولكن 72 قراءة أكبر من 15 . وهكذا ..  وهذا ينطبق على بقية الفئات.
وقد وضحنا ذلك في الجدول 5-2 أعلاه في العمود الأول إلى اليمين .إن التمثيل البياني للتوزيع الصاعد والهابط على محور واحد سيلعب دوراً هاماً في دراسة الإحصاء والذي سنتعرض له لاحقاً .
  التمثيل البياني: Graphical  representation
بعد الانتهاء من تشكيل جدول التوزيع التكراري بضغط العدد الكبير للمعلومات وعرضها بشكل يسهل التعامل معه في بيان القيم الأكثر تكراراً ، الأقل تكراراً ، الأكثر تطرفاً .... الخ  يمكن عرض النتائج بيانياً . إن أهم أشكال التمثيل البياني لجداول التوزيعات التكرارية هي :
1- طريقة المستطيلات أو المدرج التكراري: Histogram
تتمثل هذه الطريقة برسم مجموعة من المستطيلات المتلاصقة ذات عرض واحد ولكنها بأطوال مختلفة حيث يتناسب طول كل مستطيل مع تكرار الفئة التي يمثلها وتكون المستطيلات المتلاصقة المتساوية العرض ( عرض المستطيل ) منطبقة على المحور الأفقي ومراكز هذه القواعد منطبقة على مراكز الفئات بينما يشار إلى أطوال هذه المستطيلات ( ارتفاعات هذه المستطيلات ) بتكرار كل فئة على المحور الرأسي .
يجب الانتباه هنا إلى أن المدرج التكراري لا يمكن استخدامه عندما تكون الفئات مفتوحة ، وكذلك  يجب الحذر عندما تكون الفئات غير متساوية ففي هذه الحالة يفضل استخدام مساحة المستطيلات للدلالة على التكرار عوضاً عن ارتفاعات المستطيلات في الفئات المتساوية والتي (لحسن الحظ) لن نتعرض لها هنا .
2- الأعمدة البيانية:  Bar chart
وبشكل مشابه للمدرج التكراري هناك تمثيلاً يدعى الأعمدة البيانية Bar chart حيث تمثل ارتفاعات هذه الأعمدة ( المستطيلات غير المتلاصقة ) التكرارات الموافقة لفئاتها . وذلك على غرار المدرج التكراري ولكن لا يوجد ما يشير إلى أن البيانات ذات طابع مستمر في الحالة العامة.
مثال :
مثل بيانياً وبطريقة الأعمدة المستطيلة  Bar chart البيانات الممثلة بجدول التوزيع التكراري  الجدول 3-2 على افتراض أنها ليست مستمرة (منفصلة) .
3- المضلع التكراري: Frequency  Polygon
هناك تمثيل بياني آخر أقل استعمالاً من التمثيلين السابقين ويسمى المضلع التكراري، ويمكن أن يقال عن المضلع التكراري بأنه مضلع مغلق عندما يبدأ وينتهي من المحور الأفقي وينكسر عند النقاط التي تمثل تكراراً . وتتلخص طريقة رسم هذا المضلع برسم تكرار الفئات رأسياً فوق مراكز الفئات Class mark   ثم يصار إلى وصل هذه النقاط بخطوط مستقيمة لتشكل المضلع المطلوب كما هو موضح في المثال أدناه .
مثال :
مثل بيانياً وبطريقة المضلع التكراري البيانات الواردة في الجدول 3-2 .
الحل :
لإتمام حل المثال نحتاج إلى مركز الفئات والى تكرار الفئات ولحسن الحظ فقد تم إيجاد ذلك مسبقاً كما هو موضح في الجدول4-2  وبالتالي يكون المضلع المطلوب كما هو في الشكل 3-2 .

يمكن أن نرسم مضلعاً تكرارياً  آخر لنفس البيانات السابقة ولكنها تمثل التكرار التجميعي الصاعد لتشكل ما يدعى بالمضلع المنطقي ((ogive ويختلف عن المخطط السابق بأن الخطوط المستقيمة تتقابل عند نهاية الفئة بينما في المخطط السابق كانت الخطوط المستقيمة ( رؤوس المضلع التكراري ) تتلاقى عند مراكز الفئات .
كما يمكن رسم مضلع آخر ممثلاً للتكرار الهابط حيث تكون رؤوس المضلع في هذه الحالة تلاقيه عند الحدود الدنيا للفئات .
من المعلوم أنه كلما زاد عدد الفئات كلما كانت أضلاع هذا المضلع قصيرة إلى درجة أنه يمكن تمثيل المنحني المطلوب بخط منحن عوضاً عن خط منكسر . ويلعب هذا المنحني دوراً هاماً في تحديد بعض العناصر الإحصائية الهامة  التي سنتعرض لها لاحقاً .
مثال :
لننشئ المضلع المنطقي ممثلاً التكرار التجميعي الصاعد الوارد في الجدول 5-2 ثم ننشئ المنحني  المنطقي.

الحل :
لإنشاء المضلع المطلوب يلزمنا التكرار لكل فئة والتكرار التجميعي وهذه العناصر موضحة في الجدول 2-5 في العمود الأخير . وبطريقة مشابهة تماماً للمضلع التكراري الموضح في الفقرة السابقة يكون المطلوب كما هو في الشكل 4-2 أدناه .


 

 
أما المنحني المنطقي فهو موضح في الشكل 5-2 أدناه :

4-التمثيل الدائري: Pie chart
وفي هذه الحالة يمكن أن نرسم دائرة ونقسمها إلى قطاعات دائرية تتناسب مساحة (زاوية) كل قطاع مع تكرار الفئة التي يمثلها . فالفئة الأكثر تكراراً تقابل القطاع الأكبر مساحة (زاوية) والفئة الأقل تكراراً تقابل القطاع الأصغر مساحة . وتحسب مساحات القطاعات الدائرية كما يأتي :
يحسب التكرار النسبي لكل فئة ثم يضرب في 360° وهي درجات الدائرة حول مركزها ، فالزاوية الناتجة تمثل مساحة القطاع المقابل للفئة .
مثال :
مثل بيانياً وبطريقة الدائرة البيانات الواردة في الجدول 3-2 .
الحل :
نحتاج لإتمام الحل إيجاد التردد النسبي لكل فئة ولقد تم احتسابه كما هو موضح في الجدول   4-2  . إن تكرار الفئة الأولى هو 8 يقسم على 80 مجموع البيانات ثم يضرب الناتج بـ 100 فنحصل على التردد النسبي نضرب الناتج بـ 360° فنحصل على زاوية القطاع الأول المقابل للفئة الأولى أي   وبصورة مشابهة نحصل على زوايا القطاعات ( تكرار الفئات ) الأخرى وهي على الترتيب  للفئة الثانية ، للفئة الثالثة   ،  للفئة  الرابعة،    للفئة الخامسة وأخيراً  للفئة السادسة . ترسم القطاعات ثم تلون بأشكال مختلفة للتمييز بينها . لاحظ أيضاً أن مجموع زوايا  القطاعات الزاوية يساوي 360° . انظر الشكل 6-2 .

يعتبر التمثيل الدائري Pie chart من أكثر المخططات البيانية شيوعاً ففي الوقت الحاضر تغطي هذه الدوائر البيانية صفحات كثيرة من المجلات والصحف بهدف الدعاية والترويج وقد سهل ذلك الانتشار الواسع لأجهزة الكمبيوتر المجهزة ببرامج لهذا الغرض .
الجدير بالذكر أن هناك تمثيلات بيانية أخرى أقل أهمية من تلك التي ذكرناها أعلاه مثل المخطط الصوري أو الرمزي حيث يرمز للبيانات برسوم سيارات أو حيوانات للدلالة على حجم الواردات والصادرات ويدعى مثل هذا التمثيل Pictogram . وهناك تمثيلات بيانية أخرى لا مجال لذكرها جميعاً.
أمثلة :
1- البيانات التالية تمثل أعمار  40 شخصاً من موظفي إحدى شركات النقل البحري
49
22
35
21
35
52
31
21
41
51
35
20
35
60
40
39
35
31
30
45
44
48
30
32
26
27
28
27
30
19
42
30
31
41
42
41
50
60
59
45
وزع هذه البيانات في سبع فئات واستنتج التكرار التجميعي الصاعد
الحل :
لنحسب أولاً المدى Range . والمدى هو الفرق بين أكبر وأصغر قيمة  وهو بالتالي
R = 60-19 = 41 أما طول الفئة الواحدة فهو 7 = 5.857~6÷41 حيث قربنا الناتج للعدد الصحيح التالي .
بعد تفريغ البيانات نحصل على جدول التوزيع التكراري ا

1- التكرار الصاعد ثم مثله بيانياً
2- مثل الناتج بيانياً بطريقة الأعمدة البيانية Histogram .
3- مثل الناتج بيانياً بطريقة الدائرة  Pie chart .
4- أوجد المضلع التكراري للبيانات السابقة Frequency polygon

الحل :
لابد أولاً من تفريغ البيانات أعلاه ولهذه الغاية نحسب مدى هذه البيانات وهو
R = 39-21 = 18 
أما طول الفئة الواحدة فهو  7 = 2.57 ~3÷18 حيث قسمنا على العدد 7 لأننا نريد تقسيم البيانات إلى سبع فئات ونقربه إلى العدد الصحيح التالي فيكون طول الفئة الواحدة  3  ويصبح الجدول المطلوب بعد تفريغ البيانات كما هو مبين أدناه , الجدول 7-2 .


جدول 7-2
 
 


وكنتيجة مباشرة من الجدول 7-2  يمكن ملاحظة منحني التكرار الصاعد والأعمدة البيانية وهي موضحة أدناه في الشكل 7-2 و8-2  على الترتيب .


أما التمثيل الناتج بطريقة الدائرة Pie chart فنحتاج لحساب زوايا القطاعات الدائرية ولنحسب مع سبيل المثال زاوية القطاع الأول والثاني .

تكرار الفئة الأولى 3 يقسم على 100 ثم يضرب الناتج بـ 360° أي 3/100 ´ 360 = 10.8° أما الفئة الثانية فهي 7/11 ´360° = 25.2° وهكذا تصبح الزاوية المطلوبة على الترتيب
 
3.61 , 86.4 , 133.2 , 82.8 , 25.2 , 10.8، لاحظ أيضاً أن مجموع زوايا القطاعات هو 360° والشكل المطلوب موضح في الشكل 9-2 أدناه .
أخيراً  ولأن المضلع التكراري هو خط منكسر يصل بين النقاط التي فواصلها مراكز الفئات وتراتيبها تكرار لهذه الفئات ومغلقة من الطرفين بحيث يتصل مع محور الفواصل ذلك لأن التكرار معدوماً مثل النقطة الأولى وما بعد النقطة الأخيرة فإن الشكل 10-2  يوضح المضلع التكراري Frequency Polygon 

Post a Comment

أحدث أقدم