جدول التوزيع التكرارى المجمع فى فئات:-
حين
تشتمل البيانات على عدد كبير من قيم متغير عددى، يفضل تجميع هذه القيم فى فئات
فتوضع كل مجموعة من القيم المتقاربة فى فئة خاصة، ويراعى هنا ألا يكون عدد هذه
الفئات كبيراً فتنتفى الحكمة أو الفائدة من عملية التجميع، وألا يكون عددها صغيراً
فتضيع معالم التوزيع ويفقد الكثير من تفاصيله.
مثال(2-2):-
قيست
أطوال محيطات الرؤوس بالمليمترات لعينة حجمها 40 من الحمام المنزلى فوجدت كما
يلى:-
12.2
12.9 11.8 11.9
11.1 12.3 12.2
11.8 11.8 11.6
10.7
11.5 11.3 11.2
11.6 11.9 13.3
11.2 10.5 11.1
12.1
11.9 10.4 10.7
10.8 11.0 11.9
10.2 10.9 11.6
10.8
11.6 10.4 10.7
12.0 12.4 11.7
11.8 11.3 11.1
جمع هذه البيانات فى توزيع تكرارى ذى فئات وأوجد توزيع
التكرارات المتجمعة النسبية المئوية.
الحــــــــــــــــــــــل
المدى =
أكبر قيمة للمتغير – أصغر قيمة للمتغير
= 13.3 – 10.2 = 3.1
إذا رأينا أن نأخذ حوالى 10 فئات يكون طول كل فئة 3.1 ÷
10= 0.30 تقريباً.
وعلى
أساس أن الأطوال قيست لأقرب جزء من عشرة من المليمتر سنعتبر أنه إذا كان س هو
العدد الذى سجلناه لطول محيط رأس حمامة فإن الطول الحقيقى لهذا الرأس يقع بين
العددين س ± 0.05 فمثلاً أصغر عدد مسجل هو 10.2 وإذن الطول الحقيقى لمحيط رأس أصغر
حمامة فى العينة يقع بين العددين 10.2 ± 0.05 أى بين العددين 10.15، 10.25.
نأخذ العدد10.15 كحد أدنى للفئة الأولى. وحيث أننا
اخترنا أن يكون طول الفئة 0.30 فإن الحد الأعلى لهذه الفئة يكون10.15 + 0.30 =
10.45 ويكون هذا العدد نفسه هو الحد الأدنى للفئة الثانية التى ينبغى أن يكون حدها
الأعلى 10.45 + 0.30 = 10.75.
ونستمر فى إنشاء الفئات التالية بنفس الطريقة حتى نصل
الى فئة تغطى أكبر عدد فى البيانات المعطاة وهو 13.3 – انظر العمود الأول من
الجدول (2-3) الآتي. ويلاحظ أن هذا الأسلوب فى تكوين الفئات للقياسات المقربة يسمح
بأن يكون لكل عدد فى البيانات المعطاة مكان وحيد فى إحدى الفئات. وبالنسبة لملأ
العمود الثالث نمر على الأعداد المعطاة واحداً واحدً ونضع شرطة أمام الفئة التى
يدخل فيها.
الجدول ( 2 – 3 )
التكرارات والتكرارات النسبية
لمحيطات الرؤوس بالمليمترات لعينة الحمام المنزلى
الفئات
|
س ر
|
الشرط
|
ك ر
|
ح ر
|
10.15-
10.45-
10.75-
11.05-
11.35-
11.65-
11.95-
12.25-
11.55-
12.85-
13.15-
|
10.3
10.6
10.9
11.2
11.5
11.8
12.1
12.4
12.7
13.0
13.3
|
/ / /
/ / / /
/ / / /
//// //
/ / / /
//// ////
/ / / /
/ /
-
/ -
/ -
|
3
4
4
7
5
9
4
2
0
1
1
|
0.075
0.110
0.100
0.175
0.125
0.225
0.100
0.050
0.000
0.025
0.025
|
المجموع
|
|
|
40
|
1.00
|
الجدول ( 2 -4 )
التكرارات المتجمعة والمتجمعة
المئوية
الحدود العليا
|
التكرار المتجمع
|
التكرار المتجمع %
|
≤10.45
≤10.75
≤11.05
≤11.35
≤11.65
≤11.95
≤12.25
≤12.55
≤12.85
≤13.15
≤13.45
|
3
7
11
18
23
32
36
38
38
39
40
|
7.5
17.5
28.5
45.5
57.5
80.0
90.0
95.0
95.0
97.5
100.0
|
ملاحظات:-
1- س ر ترمز إلى مركز الفئة class
mark وهو الوسط الحسابى لحدى
الفئة، فمثلا مركز الفئة الأولى هو ½ ( 10.15 + 10.45 ) = 10.3
ويؤخذ
مركز الفئة فمثلا لها بمعنى أننا نعتبر أن جميع القيم التى دخلت الفئة مساوية لهذا
المركز، فمثلا تضم الفئة الأولى (10.15 - 10.45) ثلاثة من الأعداد المعطاة هى
10.4، 10.2، 10.4 غير أننا فى عملية التجميع نلغى هذه الأعداد ونعتبر أن بهذه الفئة
ثلاثة أعداد كل منها يساوى مركز الفئة وهو 10.3.
كذلك
تضم الفئة الثانية أربعة أعداد هى 10.7، 10.5، 10.7، 10.7 غير أننا نعتبر أن بهذه
الفئة أربعة أعداد كل منها يساوى مركز الفئة وهو 10.6 وفى اعتبارنا هذا شىء من
التجاوز يسمى بخطأ التجميع، إلا أن هذه الأخطاء عادة ما يلغى بعضها البعض لأن
بعضها بالزيادة والبعض الآخر بالنقصان، ولاسيما إذا كان حجم التوزيع كبيراً.
2- فى تكوين الفئات فى هذا المثال راعينا أن
المتغير هو متغير عددى من النوع المتصل وأن القياس كل إلى أقرب جزء من عشرة من
الملليمتر. أما إذا اتبرنا أن القياس مضبوط فيمكن أن نضع الفئات كالآتى:-
10.2
– لتعنى الفئة التى تشمل الأعداد بدءاً من
10.2 إلى أقل من 10.5
10.5
– لتعنى الفئة التى تشمل الأعداد بدءاً من
10.5 إلى أقل من 10.8
10.8
– لتعنى الفئة التى تشمل الأعداد بدءاً من
10.8 إلى أقل من 11.1
وهكذا 00 00 00
وتستخدم هذه الطريقة أيضا عندما يكون
المتغير من النوع الوثاب. ولبيان أن هذه الطريقة لا تصلح فى الحالة التى تكون فيها
البيانات مسجلة بمقياس تقريبي، اعتبر الحمامة التى سجل طولها على أنه 10.5
ملليمترا ( تقريبا). نعلم أن الطول الحقيقي لهذه الحمامة يقع بين العددين 10.45،
10.55 وعلى ذلك فإن الطول الحقيقي قد يكون أصغر من الطول المسجل 10.5، مثلا 10.48،
وفى هذه الحالة ينبغي وضعه فى الفئة 10.2- أو قد يكون أكبر من 10.5، مثلا 10.54،
وفى هذه الحالة ينبغي وضعه فى الفئة 10.5-
وما دمنا لا نعرف الطول الحقيقي لهذه الحمامة فإننا نكون فى حيرة من
استخدام أى من هاتين الفئتين. ونقع فى هذه الحيرة أيضا فى تناول كثير من الأطوال
الأخرى مثل 10.8، 11.1، 11.4، 000 ومن هذا
نرى أن هذه الطريقة لا تضمن أن يكون لكل قيمة من ( القيم لمقربة ) مكان فى واحدة
فقط من الفئات.
( 2- 1- 3 ) الجدول التكراري المزدوج ( أو جدول الاقتران
):-
كل
من المثالين السابقين يتناول توزيعاً تكرارياً لمتغير واحد، وفيما يلى مثالان
يتناول كل منهما التوزيع التكراري المشترك لمتغيرين joint
distribution
مثال ( 2-3 ):
الجدول (
2-5 ) الآتي يعطى التكرارات المشاهدة لطول محيط الرأس وطول الطفل ساعة الولادة فى
عينة من 99 مولوداً.
الجدول ( 2- 5 )
محيط الرأس
|
طول الجسم
47 -
50 - 53 -
|
المجموع
|
32-
36-
|
40
36 2
صفر
14 7
|
78
21
|
المجموع
|
40 50 9
|
99
|
لدينا متغيران هما (1) طول محيط الرأس وقد قسمت الأطوال
الى فئتين (2) طول الجسم وقد قسمت الأطوال الى ثلاث فئات، ولهذا يسمى مثل هذا
الجدول بجدول اقتران 2×3 contingency table 2*3
لأن المتغيران يقترنان فيه فى توزيع مشترك.
من هذا الجدول نستطيع استخراج الجدولين (2 – 6 )، (2 – 7
) الآتيين:-
الجدول (2-6) الجدول (2-7)
التوزيع الهامشى لطول محيط الرأس التوزيع الهامشي لطول الطفل
محيط الرأس
|
كر
|
|
طول الجسم
|
كر
|
32-
36-
|
78
21
|
|
47-
50-
53-
|
40
50
9
|
المجموع
|
99
|
|
المجموع
|
99
|
يعطى الجدول (2-6) ما يسمى بالتوزيع الهامشي للمتغير
الأول (طول محيط الرأس) وهو يعنى التوزيع التكرارى لهذا المتغير بصرف النظر عن
المتغير الثانى. وبالمثل يعطى الجدول (2-7) التوزيع الهامشي للمتغير الثانى (طول
الجسم).
مثال(2-4):
فى إحدى التجارب قسم 1469 من الرجال فى الأعمار ما بين 60، 64 عاماً من حيث
عادة التدخين إلى قسمين: يدخن ولا يدخن. وبعد 6 سنوات من بدء التجربة حسب عدد
الوفيات للقسمين فنتج التوزيع التكراري المزدوج المبين بالجدول (2-8) وهو يعطى التوزيع التكرارى المشترك لمتغيرين من
النوع الوصفى هما الوفاة وعادة التدخين.
مثل هذا الجدول يسمى بجدول اقتران 2×2 لأن كلا من
المتغيرين مقسم الى قسمين. استخرج التوزيع الهامشي لكل من المتغيرين.
Post a Comment