كيف يتم جمع وتنسيق المعلومات ؟
في الواقع هناك عدة طرق للحصول على
المعلومات منها ما هو جاهز ومنها ما يحتاج إلى جمع وتنسيق، فالمعلومات
الجاهزة يمكن الحصول عليها من عدة مصادر , منها :
I - المصادر الداخلية :
وهي مجموعة من البيانات والنشرات الدولية التي تصدرها المؤسسات ذات الصلة , وتتميز
هذه المعلومات بالدقة والوفرة وقلة التكاليف . فتصدر مثلاً الجامعات نشرات دورية
خاصة متضمنة عدد الطلاب المقبولين في الجامعة وعدد الخريجين واختصاصاتهم ومتضمنة
عدد الذكور وعدد الإناث كما تعطي بعض النسب المئوية والمعدلات الخاصة بذلك مقارنة
مع الجامعات المجاورة . وتتميز هذه البيانات بالدقة والوضوح وقلة التكاليف .
II - المصادر الرسمية :
وهي مجموعة السجلات الرسمية مثل جدوال الأحوال المدنية عن عدد المواليد وعدد
الوفيات ونسبة الذكور والإناث ووثائق وزارة الصحة وسجلات المشافي العامة والمشافي
الخاصة المتضمنة نسبة المصابين بمرض معين , وأنواع الأمراض المنتشرة ومعدل الإصابة بها .وكذلك نشرات
المكتب المركزي للإحصاء ، ونشرات وزارة الزراعة والري عن معدل استهلاك المياه
ومصادرها و كميات المحاصيل الزراعية المنتجة........ الخ .
أما المعلومات غير الجاهزة فيمكن الحصول
عليها بالبحث والسؤال المباشر ميدانياً وهو ما يسمى بـ:
III - المصادر الميدانية
: وهي عملية اللجوء إلى جمع المعلومات من مصادرها المباشرة حيث يقوم فريق من
الإحصائيين بجمع المعلومات الخاصة بالدراسة المقامة , ويمكن هنا أن نميز بين
طريقتين في استقصاء المعلومات :
أولاً - طريقة المسح الشامل :
حيث تعتمد هذه الطريقة على المسح و دراسة جميع أفراد المجتمع المراد دراسته , ومما
لاشك فيه أن هذه الطريقة تتميز بالدقة ولكنها شاقة ومتعبة وباهظة التكاليف .
ثانياً - طريقة العينة الإحصائية :
(
Statistical sample) : وتعتمد هذه الطريقة على جمع المعلومات عن طريق دراسة جزء من
المجتمع الإحصائي يمثل هذا المجتمع تمثيلا صادقا . وللعينة الإحصائية عدة أنواع
منها :
- العينة الطبقية : حيث يقسم المجتمع
إلى طبقات معينة وتحسب عينات كل طبقة من الطبقات .
- العينة المنتظمة : تسحب بشكل منتظم من
المجتمع حيث يؤخذ مضاعفات الرقم 10مثلاً
أو 20.
- العينة العشوائية : تسحب بشكل عشوائي
وتخلط عناصر المجتمع في كل مرة يتم فيها السحب .
و من الشروط الهامة التي يجب أن تتميز
بها العينة هى الموضوعية والشمولية والاستقلالية وعدم
التميز .
و يجب أن نذكر هنا بأنه عند جمع
المعلومات ميدانياً أو عند اختيار عينات ضمن الشروط الواردة أعلاه , يجب أعداد
استمارات خاصة بالبحث وتتضمن أسئلة متعلقة بمهمة البحث حيث يطلب من أعضاء المجتمع
الإجابة عن هذه الأسئلة باختصار . ويراعى في وضع أسئلة البحث السهولة والإيجاز
بعيداً عن الشرح والتفصيل , ويفضل إن أمكن أن يجاب عن هذه الأسئلة بنعم أو لا أو الإجابة
برقم مثل الإجابة على عدد أفراد الأسرة أو متوسط الدخل الشهري ، الطول ، الوزن ...
و تسمى هذه النشرات استبيان .
الفصل
الثاني
عرض البيانات الإحصائية وتنسيقها
Data
Display and Organization
1-2 تنسيق البيانات :
إن أول خطوة تجاه
فهم مسألة ما، هو جمع المعلومات الكافية عنها أولاً وبعد جمع هذه المعلومات
والبيانات العددية نبدأ بفرزها وتنسيقها . وعلى سبيل المثال إذا سألنا 100شخص من مالكي
السيارات الخاصة عن أطوال المسافات التي يقطعها كل منهم يومياً سنجد إجابات هؤلاء
الأشخاص معطاة (بالكيلومتر) كالتالي :
43.2
|
56.4
|
20.4
|
19.4
|
35.4
|
46.0
|
37.0
|
28.4
|
35.4
|
44.0
|
39.4
|
39.4
|
14.0
|
27.4
|
12.6
|
86.4
|
31.8
|
49.2
|
38.4
|
36.2
|
30.2
|
39.8
|
11.4
|
23.0
|
74.0
|
38.4
|
44.0
|
38.0
|
28.8
|
15.8
|
39.2
|
32.4
|
47.0
|
24.0
|
123.8
|
12.2
|
30.4
|
49.6
|
40.6
|
29.2
|
28.2
|
49.4
|
37.0
|
39.0
|
100.0
|
90.2
|
45.0
|
31.0
|
56.4
|
35.2
|
37.8
|
37.6
|
23.6
|
28.0
|
40.0
|
41.0
|
52.6
|
47.8
|
27.0
|
12.6
|
29.8
|
43.0
|
90.4
|
89.6
|
24.2
|
22.6
|
41.0
|
18.0
|
45.8
|
30.0
|
39.4
|
33.6
|
40.8
|
39.0
|
16.2
|
125.4
|
53.6
|
12.6
|
24.8
|
56.2
|
60.0
|
22.2
|
64.6
|
20.2
|
52.4
|
103.4
|
50.6
|
18.0
|
37.4
|
45.6
|
40.4
|
41.4
|
37.6
|
39.4
|
42.6
|
44.0
|
108.2
|
16.2
|
42.0
|
42.2
|
والسؤال الآن ماذا يمكن أن نفعل بهذه
المعلومات وما هي الفائدة منها أو بالأحرى كيف يمكن الاستفادة منها ؟ البعض يهتم
بالنظر إلى القيم المتطرفة والبعض الآخر يحسب المتوسط أو القيم المتكررة . وفي هذه
المجموعة من المعلومات يمكن ملاحظة أن أقصر مسافة هي 11.4 km بينما أطول مسافة هي 125.4 km وهنا يمكن أن نفكر بإعادة كتابة هذه البيانات مرتبة ترتيبا
تنازلياً أو تصاعدياً، وهذا ما يحتاج إلى وقت أطول وإضافة عملية حسابية تتناسب
صعوبتها مع جمع البيانات المراد التعامل معها ، وحتى بعد ترتيب هذه البيانات تصاعديا أو تنازلياً لا يمكن الحصول
منها على الكثير من المعلومات .
2-2 مخطط الساق والورقة: Stem-and-leaf-display
هناك طريقة مفيدة بدأت تستخدم مؤخراً
تسمى مخطط الساق والورقة " Stem-and-leaf-display " وهذه
الطريقة تعطي شكلاً مختصراً ومرتباً للمعلومات أو البيانات العددية .
ولتوضيح هذه الطريقة، لنأخذ مجموعة من
البيانات وهي تمثل درجات 20 طالباً في مقرر
الرياضيات، علماً أن الدرجة العظمى هي 100 :
74
|
61
|
98
|
72
|
57
|
64
|
67
|
52
|
84
|
69
|
77
|
63
|
68
|
88
|
61
|
65
|
79
|
82
|
55
|
74
|
وإذا نظرنا إلى الرقم 61 مثلاً على أنه
آحاد وعشرات فإنه يمكن أن يكتب على الشكل1 ½ 6 .فالعدد الذي على اليسار هو عشرات هذا الرقم، بينما العدد الذي
على اليمين هو آحاده .وهذا يعني إنه يمكن كتابة الرقمين61 و 69 بالشكل
أي وضعت العشرات لهذين
الرقمين مشتركة بينما توزعت آحاده لتدل على الرقمين المختلفين. و بالإعتماد على ما
سبق يمكن تمثيل مجموعة البيانات السابقة اعتماداً على طريقة الساق والورقة بالشكل التالي: حيث الساق هنا ممثلاً للعشرات
بينما توزعت الأوراق لتدل على بقية أعداد الآحاد :

|
|
|
|
|
5
|
7
|
2
|
5
|
3
|
8
|
1
|
5
|
1
|
4
|
7
|
9
|
6
|
|
|
|
7
|
9
|
4
|
4
|
2
|
7
|
|
|
|
|
|
8
|
2
|
4
|
8
|
|
|
|
|
|
|
|
8
|
9
|
يمكن إعادة كتابة البيانات أعلاه مرتّبة
بشكل تصاعدي على الشكل التالي :
|
|
|
|
|
7
|
5
|
2
|
5
|
9
|
8
|
7
|
5
|
4
|
3
|
1
|
1
|
6
|
|
|
|
9
|
7
|
4
|
4
|
2
|
7
|
|
|
|
|
|
8
|
4
|
2
|
8
|
|
|
|
|
|
|
|
8
|
9
|
كما يمكن إعادة كتابتها تنازلياً لو
أردنا .
إن استخدام طريقة الساق والأوراق ليس
سهلاً أو ليس محبباً على الأقل في كثير من الأحيان والدليل على ذلك أنه لو
حاولنا كتابة البيانات في المثال الوارد
في بداية الفقرة (مسافات 100 سائق )، نجد أولاً أن هناك أعشاراً يجب التخلص منها إما بطريقة
التقريب أو بطريقة الحذف، وبما أن الغاية
من العرض هي أخذ فكرة عن توزيع المسافات فإنه ينصح بإهمال هذه الأعشار بدلاً من
تقريبها و بعد تطبيق طريقة الساق والأوراق على هذه البيانات نجدها بالشكل التالي :
1 2 2 2 2 4 5 6 6 8 8 9
|
1
|
0 0 2 2 3 3 4 4 7 7 8 8 8 8 9 9
|
2
|
0 0 0 1 1 2 3 5 5 5 6 7 7 7 7 7 7 8 8
8 9 9 9 9 9 9 9 9
|
3
|
0 0 0 0 1 1 1 2 2 2 2 3 3 4 4 4 5 5 5
6 7 7 9 9 9
|
4
|
0 2 2 36 6 6
|
5
|
0 4
|
6
|
4
|
7
|
6 9
|
8
|
0 0
|
9
|
0 3 8
|
10
|
.
|
11
|
3 5
|
12
|

لاحظ هنا أن 4 7 تعني 74 كم

وجدير بالملاحظة أن طريقة عرض الساق
والأوراق يمكن أن تطبق على بيانات تحتوي على أعشار وأجزاء المائة وهذا يحتاج لدقة
أكثر ومجهود أكبر . فعلى سبيل المثال عرض الساق والأوراق لهذه المجموعة من
البيانات
3 5 2 0 8
|
1.2
|
يمثل الأرقام التالية :
1.23 , 1.25 , 1.22 , 1.20 , 1.28
وكذلك :
17
03 55 89
|
0.3
|
يمثل الأرقام :
0.317
, 0.303 , 0.355 , 0.389
في الواقع هناك عدة أشكال ، لطريقة
الساق والأوراق لعرض مجموعة من البيانات تتناسب والدقة المطلوبة وتناسب أيضاً
الحاجة، ولشرح هذه الفكرة إليك المثال التالي :
مثال :
إذا أردنا عرض البيانات الواردة في
المثال السابق (الفقرة (2-2 المتضمن عرض مجموعة من درجات عشرين طالباً بحيث يحتوي العرض على
أكثر من ساق فيمكن في هذه الحالة أن نستخدم ) *( من أجل 0,1,2,3,4 و (l) من
أجل 9,8,7,6,5 بذلك يمكن أن
نضاعف أعداد السيقان مرتين ( أو أكثر إن لزم الأمر ) وفي مثالنا يمكن الحصول على
عرض الساق مضاعفاً والأوراق بالشكل التالي :
2
|
5*
|
7
5
|
5l
|
1
3 4 1
|
6*
|
9
5 7 8
|
6l
|
4
2 4
|
7*
|
9
7
|
7l
|
4
2
|
8*
|
8
|
8l
|
8
|
9l
|
3-2 المخطط النقطي: Dot diagram
يتميز المخطط النقطي بوضع نقطة على محور
الأعداد و الذي يمثل بمجمله مجال كل الأعداد ونقوم بوضع نقطة على هذا المحور
مقابلة لكل نقطة من هذه البيانات وفي النهاية تتجمع النقاط في مجال معين مما يعطينا فكرة عن
الأكثرية أو الأقلية ضمن مجال ما . ولتوضيح ذلك إليك بعض الأمثلة :
أمثلة :
a )- القراءات التالية تمثل درجات الحرارة خلال أسبوع من شهر ديسمبر .
مثل هذه البيانات نقطياً
-2
|
3
|
4
|
7
|
-2
|
4
|
6
|
3
|
الحل :
![]() |
لاحظ من المخطط النقطي تراكم النقاط عند
3 , –2 و 4.
-( bتمثل
البيانات التالية القيمة المطلقة للفرق بين وزن التعبئة الآلية لـ 14 عبوة من السكر ،
أختيرت عشوائيا من إنتاج أحد المصانع, وزن كل منها كيلو غرام واحد ووزنها الحقيقي
بعد وزنها بميزان حساس كما هو مبين أدناه.
مثل هذه البيانات بطريقة المخطط النقطي:
7.5
|
0.19
|
0.58
|
0.854
|
0.179
|
0.21
|
0.283
|
0.196
|
0.107
|
2.0
|
1.18
|
7.3
|
8.0
|
5.5
|

لاحظ تمركز النقط في البداية مما يعني
أن الفروق على الغالب صغيرة .
4-2 تفريغ وتبويب المعلومات: Treatment of
Data
بعد جمع كمية كافية من المعلومات عن
ظاهرة معينة نجد أنفسنا أمام كم من هذه المعلومات بانتظار التحليل والدراسة
وبالتالي الوصول من خلال هذه البيانات إلى قرار سليم حولها . ولكن لا يمكننا تحليل
هذه المعلومات ما لم يتم تفريغها وتبويبها وبيان ميزاتها .
إن تبويب المعلومات يمكننا من التعامل بسهولة مع
الكم الكبير من الأرقام وذلك من خلال نظرة سريعة . ويراعى في هذا التفريغ الإشارة
إلى الأرقام الملفتة للنظر بكبرها أو بصغرها .
وهناك أمور أخرى يمكن ملاحظتها من خلال
التبويب كتجمع الأرقام حول قيمة معينة ، نسبة مجموعة إلى مجموعة أخرى أو مجموعة
بالنسبة للمجموع الكلي أو ما شابه، ذلك وعلى سبيل المثال لو سألنا 190 شخصاً من ركاب طائرة متجه إلى الخليج العربي عن
جنسياتهم لاختلفت الإجابات باختلاف الأشخاص وبالتالي فإن الاستمارات الموزعة عليهم
سوف تحمل عدة إجابات وتكون الخطوة الأولى هي إعداد جدول ( أو جداول ) لتفريغ هذه
المعلومات ( الإجابات - Data ) بحيث يحوي
الجدول عدة حقول بعدد جنسيات الركاب . ونبدأ بفرز الإجابات وذلك بوضع إشارة
( tally ) في العمود المناسب والمكان المناسب كما يلي :
( tally ) في العمود المناسب والمكان المناسب كما يلي :
البلد
|
الإشارة
|
تكرار الرجل
|
الإشارة
|
تكرار النساء
|
الإشارة
|
تكرار الأطفال
|
التكرار الكلي
|
التكرار النسبي
|
||||
![]() ![]() ![]() ![]() ![]()
![]() ![]() |
|
10
|
|
8
|
|
6
|
24
|
0.126
|
||||
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]()
![]()
|
IIII
|
14
|
|
16
|
|
10
|
40
|
0.211
|
||||
![]() ![]() ![]()
![]()
|
|
12
|
IIII III
|
8
|
|
5
|
25
|
0.132
|
||||
![]() ![]() ![]() ![]() ![]() |
|
8
|
IIII I
|
6
|
IIII III
|
8
|
22
|
0.116
|
||||
![]() ![]() ![]()
![]() |
|
10
|
IIII IIII
IIII
|
14
|
|
6
|
30
|
0.158
|
||||
|
|
2
|
|
0
|
|
0
|
2
|
0.011
|
||||
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]()
|
|
18
|
IIII IIII
IIII IIII
|
20
|
|
9
|
47
|
0.247
|
||||
المجموع
|
|
74
|
|
72
|
|
44
|
190
|
1.00
|
جدول
1-2
يمكن أن نضيف إلى هذا الجدول نسبة
الرجال من ركاب الطائرة وهي 74/190 = 0.389 أو نسبة الأطفال من ركاب الطائرة وهي 44/190 = 0.232 أو نسبة الركاب من الجنسية الكويتية أو أي معلومات أخرى مفيدة ،
بالإضافة إلى المعلومات الموضحة في الجدول والتي تبين أن الركاب البحرينيين هم
الأغلبية أما الركاب العمانيون هم الأقلية ، أو أن نسبة الأطفال البحرينيين
بالنسبة لمجموعة الأطفال 10/44 = 0.227 بالإضافة إلى مزاياها الجيدة إلا أن هذه الطريقة في تفريغ
البيانات بدائية وتستغرق زمنا ً طويلاً وتحتاج إلى جهد كبير ولكن لا مانع من
استخدامها عندما تكون العينة صغيرة . وعندما تكون العينة كبيرة فإنه يستعان
بالأجهزة الحديثة من حواسيب متطورة وغيرها لتوفير الجهد والوقت والحصول على مزيد
من الدقة .
إرسال تعليق