بحث عن تعريف علم الإحصاء - بحث علمى عن تعريف علم الإحصاء
أولا - تعريف علم الإحصاء
الإحصاء هو علم الذي يبحث في طريقة جمع البيانات عن الظواهر التي تحيط بنا سواء كانت علمية أو اقتصادية أو اجتماعية، وفي كيفية تسجيل هذه الحقائق والبيانات في صورة دقيقة، ثم وصفها بصورة سهلة تبين علاقات واتجاهات هذه الظواهر، وأخيرا يبحث في دراسة هذه العلاقات والاتجاهات ووضعها في صورة يسهل معها فهم الظواهر المراد دراستها.
كما يعرف علم الإحصاء بأنه علم اتخاذ القرارات في جميع نواحي الحياة، وذلك من خلال جمع ودراسة وتحليل البيانات المتوفرة واستخلاص النتائج عن الظواهر المدروسة مما سبق يمكن تصنيف الإحصاء كعلم إلى قسمين رئيسيين هما:
1 – الإحصاء الوصفي Statistique de,,,,,,ive : وهو ذلك الفرع من الإحصاء الذي يتناول طرق تنظيم وتلخيص وعرض البيانات في صورة مبسطة.
2 – الإحصاء الاستدلالي Statistique inferentiel : وهو ذلك الفرع من الإحصاء الذي يهتم بطرق الوصول إلى نتائج معينة أو توقعات ما عن المجتمع من خلال دراسة عينة من ذلك المجتمع.
فإذا كانت لدينا كمية كبيرة من البيانات العددية، فإن الإحصائي سيحاول أن يرتبها في صورة تجعل من السهل قراءتها وفهمها، وقد يتضمن هذا:
- تبويب البيانات وتقديمها في شكل جداول تكرارية، أو في شكل منحنيات بيانية ليسهل فهم معناها فورا.
- حساب بعض المقاييس أو المؤشرات الإحصائية مثل النسب أو المتوسطات.
وتدخل العمليات السابقة في نطاق الإحصاء الوصفي، أما الإحصاء الاستدلالي فهو يختص بـ:
- إجراء التنبؤات والتقديرات والاستنتاجات عن مجموعة من المتغيرات أكبر من تلك التي تمت ملاحظتها فعلا.
ثانيا – التعريف بالمصطلحات الإحصائية الضرورية
1 – المجتمع Population : هو جميع العناصر المشتركة في الصفة التي تهم الباحث في دراسته، فقد يكون المجتمع مثلا عدد سكان مدينة، أو طلبة جامعة التكوين المتواصل، أو المساحات الزراعية في الجزائر أو إنتاج آلة معينة ... إلخ.
2 – العينة ECHANTILLON: هي جزء من المجتمع تحت الدراسة مثل مجموعة من سكان مدينة، أو مجموعة من طلبة جامعة التكوين المتواصل، أو بعض المساحات الزراعية في الجزائر ...الخ.
3 – الظاهرة Phénomène : هي صفة لعناصر تختلف من عنصر لآخر في شكل أو النوع أو الكمية، ويطلق على الصفة تحت الدراسة متغير variable مثل طول شخص ما، عدد الأخطاء الإملائية في بحث ما، سرعة سيارة بين مدنيين خلال أسبوع ... الخ.
4 – المتغير variable: هو الصفة تحت الدراسة كما أشرنا أعلاه أو هو الشيء الذي يمكن أن يأخذ قيما مختلفة في الظروف المختلفة (زمنية، مكانية، سياسية، اقتصادية ... الخ) فمثلا سعر التمر يختلف من يوم لآخر ويختلف في نفس السوق من سنة لأخرى.
ثالثا- أنواع المتغيرات
تنقسم المتغيرات إلى نوعين:
1 – متغيرات نوعية (كيفية) Variable qualitative : وهي عبارة عن صفات أو أنواع معينة ليست عددية، وتنقسم بدورها إلى:
أ – بيانات نوعية خاضعة للترتيب: مثل المستوى التعليمي، الرتب العسكرية تقديرات النجاح المستوى الاقتصادي ... الخ.
ب – بيانات نوعي غير خاضعة للترتيب: مثل الجنسية، أنواع السيارات، أنواع الأمراض ...إلخ.
2 – متغيرات كمية (عددية) Variable quantitatives: وهي البيانات التي يعبر عنها في صورة عددية وتنقسم إلى:
أ – متغير متقطع Variable discret : وهو المتغير الذي يأخذ أعداد صحيحة، فمثلا إذا كان × متغير يمثل عدد أفراد الأسرة، فإنه لا يمكن أن يأخذ القيم 2، 3، 4، 5 ... ولا يمكن أن نأخذ × القيم 1.5، 3.25، 5.17.
ب – متغير متصل (مستمر) Variable Continue: وهو المتغير الذي لا يمكن أن يأخذ أي قيمة بين قيمتين معنيتين، وكأمثلة عن المتغيرات المتصلة: الطول، الوزن، الزمن، السرعة ...الخ، فإذا كان × هو متغير الطول فمثلا فإن × يمكن أن تأخذ القيم 15متر، 11.3 متر، 14.75 متر، أي أن المتغير × يمكن أن نأخذ أي قيمة في فترة زمنية معينة.
مصادر البيانات:
مما لا شك فيه أن في الدراسات الإحصائية تعد البيانات المادة الأساسية الرئيسية، وعليها تتوقف دقة الوصف والتحليل وسلامة الاستنتاج ومنطقيته، فإذا كانت هذه البيانات والمعلومات دقيقة وشاملة وواقعية، كان الوصف والاستنتاج والقرار الذي نحصل عليه سليما وصحيحا، وعليه فالاهتمام التام والحرص الدقيق في الحصول على بيانات سليمة وواقعية حول الظواهر تحت الدراسة بعد أن العمود الفقري والحجر الأساسي في علم الإحصاء، وهناك عدة مصادر للحصول على البيانات تختلف باختلاف موضوع الدراسة والغرض منها، من أهم هذه المصادر ما يلي:
- النشرات والدوريات وسجلات.
- التجارب.
- الاستبيان.
- التعدادات العامة.
رابعا – تقريب البيانات
يعتمد الإحصاء في كثير من عملياته على التقريب الذي يهدف من ورائه تبسيط العمليات الحسابية حتى يتيسر للباحث معالجتها وتأكيد معالمها الرئيسية، وتساعد القارئ على فهم نتائجها.
أ – التقريب البسيط:
تقوم فكرة التقريب على حذف الرقم الذي يبدأ به العدد من اليمين ثم إضافة واحد صحيح إلى الرقم الذي يتبع إلى سيارة مباشرة إذا كان الرقم المحذوف أكبر من 5 أو يترك كما هو دون إضافة الواحد الصحيح إذا كان الرقم المحذوف أقل من 5.
مثال1:
قرب الأعداد التالية: 1.2، 23.4، 15.6، 18.7 إلى أعداد صحيحة؟
الحـل:
الأعداد الأصلية الأعداد المقربة
1.2
23.4
15.6
18.7 1
23
16
19
أما إذا كان الرقم المحذوف يساوي 5 فإن الرقم الذي يقع إلى يساره يقرب إلى أقرب عدد زوجي.
فإذا كان الرقم زوجيا ظل كما هو.
مثال2:
قرب الأعداد التالية: 16.5، 25.5، 15.5، 28.5 إلى أعداد صحيحة؟
الحـل:
الأعداد الأصلية الأعداد المقربة
16.5
25.5
15.5
28.5 16
26
16
28
ومن أهم استخدامات التقريب تقريب النسب المئوية والكسور العشرية إلى أقرب عدد صحيح وأثر هذا التقريب على مجموعها النهائي الذي يجب أن يساوي 100 في حالة النسب المئوية، وواحد صحيح في حالة الكسور العشرية.
ب – حدود الدقة: تعتمد الحدود على مدى دقة الأرقام الخام التي يقوم عليها البحث، وعلى الباحث أن يقدر مدى الدقة العددية تقديرا يتفق ونوع البيانات العددية التي يحصل عليها. فحدود الدقة للعدد 3.8 تمتد إلى رقم عشري واحد، أي أن البيانات الدقيقة التي يدل عليها هذا العدد أقرب إلى 3.8 منها إلى 3.9 أو 3.7أي أن حدود الدقة تؤثر في الرقم العشري لهذا العدد، وتحدد قيمته بحيث لا تصل هذه القيمة إلى 3.9 في حالة الزيادة أو إلى 3.7 في حالة النقصان.
والعدد 3.8 يقع بين 3.75 و 3.85 أي أن حد الخطأ هو 0.05.
أولا - العرض الجدولي للبيانات
تلخص الجداول التكرارية البيانات الكمية الكثيرة في وضعها على صورة جدول منتظم يوضح كيفية توزيع القيم التي حصلنا عليها من الظاهرة المدروسة حيث يدل العمود (السطر) الأول على قيم الظاهرة، ويدل العمود (السطر) الثاني على التكرار المقابل لهذه القيم.
مثال1:
إذا كانت لدينا درجات 30 طالب في أحد الاختبارات كما يلي:
4، 8، 7، 6، 4، 11، 12، 4، 6، 8، 4، 6، 9، 6، 7، 6، 8، 4، 11، 9، 8، 11 ، 9، 4، 8، 9، 11، 12، 4، 5.
لخص هذه البيانات في صورة جدول يوضح معالمها الأساسية؟.
الدرجة 4 5 6 7 8 9 11 12 المجموع
التكرار 7 1 5 2 5 4 4 2 30
إن وضع البيانات بهذه الصورة أصبح أكثر وضوحا لمعرفة عدة معلومات كانت غير واضحة في الصورة الخام. فمثلا من السهل الآن معرفة أكبر وأصغر درجة عليها هؤلاء الطلبة كما يمكن معرفة أن الناجحين أو عدد المقصيين ببساطة.
وفي حالة ما إذا كنت الدرجات كثيرة ومنتشرة داخل مجال واسع (مثلا التنقيط كان من 100) فإن لو وضعت في الشكل السابق الذي يبين درجات الطلبة مفردة مع تكرار كل درجة سوف نجد أن الجدول بهذه الطريقة أبسط توضح المعالم الرئيسية أي وضع البيانات في صورة مختصرة ومنظمة تعطي فكرة عامة عن هذه البيانات.
وقد وجدت طريقة أكثر اختصارا من السابقة يمكن بواسطتها وضع البيانات في جدول يبين ويوضح الخصائص العامة لهذه البيانات، يسمى هذا الجدول بجدول التوزيع التكراري ولتكوين مثل هذا الجدول نقوم بالتالي:
أولا: نحدد المجال (المدى) الذي تنتشر فيه البيانات، وهو الفرق بين أكبر قيمة للبيانات وأصغر قيمة لها، أي أن:
المدى = أكبر قيمة – أصغر قيمة.
ثانيا: نقسم المدى إلى فئات متساوية الطول بحيث يكون عددها مناسبا (ما بين 5 و 25 فئة) وهناك عدة طرق لحساب عدد الفئات نذكر منها:
1 – معادلة ستيرجس Sturages التي تنص على أن عدد الفئات = 1 + 3.322 لغ عدد البيانات.
2 – معادلة يول yule التي تنص على عدد الفئات = 2.5 عدد البيانات
ثالثا:نحسب طول الفئة وهو يساوي المدى مقسوما على عدد الفئات
طول الفئة =
مما سبق نستخلص الطريقة المرنة في تحديد عدد الفئات وأطوالها والتي لا تعتمد على المعدلات الرياضية بل أن هذه الطريقة مرنة بطبيعتها وهي:
ملاحظـات:
أ – عند تفريغ البيانات فإنه يجب أن تنتمي كل مفردة إلى فئة واحدة فقط.
ب – عند كتابة الفئات فإنه:
• يذكر الحد الأدنى والأعلى لكل فئة إذا كان المتغير متقطع.
• يذكر الحد الأدنى ويحدد الحد الأدنى الأعلى ضمنيا أو العكس إذا كان المتغير متصل.
• يفضل استخدام الفئات المتساوية الطول، إلا أنه في بعض الحالات يمكن أن يستخدم الفئات غير المتساوية، من هذه الحالات ما يلي:
- إذا كان الغرض من الدراسة هو الاهتمام ببعض الفئات والتركيز عليها وإهمال باقي الفئات، فيمكن عندها دمج الفئات التي لا تهم الباحث في فئة واحدة.
- إذا كان التكرار لبعض الفئات صغير جدا مقارنة بباقي الفئات، يمكن دمج هذه الفئات معا.
مثال 2:
البيانات التالية تمثل إنتاج 60 ورشة من الكراسي خلال يوم.
المطلوب:
1) ما هو نوع المتغير؟ ولماذا؟.
2) أي نوع من الفئات تستخدم في مثل هذه الحالة؟
3) تحديد عدد الفئات باستخدام معادلة Sturgers؟
4) تحديد عدد الفئات باستخدام معادلة Yule؟
5) تكوين جدول تكراري من 10 فئات متساوية الطول؟.
87 93 21 46 57 77 62 25 31 72
68 29 89 66 62 73 83 81 72 54
57 81 58 62 73 12 73 83 88 96
67 87 97 52 63 17 29 36 71 63
62 92 73 57 65 71 36 54 21 33
42 58 89 46 49 36 56 62 51 91
الحـل:
1) المتغير الكمي متقطع لأنه يأخذ قيم معزولة (صحيحة).
2) نستخدم الفئات المغلقة.
3) معادلة ستير حيث:
عدد الفئات = 1 + 3.322 لغ عدد البيانات.
= 1+ 3.322 لغ 60.
= 1 + 3.322 ×
= 6.9≈ 7 فئات.
4) معادلة يول:
عدد الفئات = 2.5 عدد البيانات
= 2.5 60
عدد الفئات = 2.5×2.783= 7 فئات.
5) المعادلة المرنة:
عدد الفئات × طول الفئة ≤ المدى
* عدد الفئات = 10 فإن
طول الفئة ≤
≤
≤
≤ 8.5
نضع طول الفئة = 9.
ومن أجل تكوين جدول التوزيع التكراري نحدد حدود الفئة الأول، حيث الحد الأدنى للفئة الأول يساوي أصغر البيانات أو أقل منه. فالحد الأدنى للفئة الأول يمكن أن يساوي 12 أو 11 أو من 10.
أما الحد الأعلى للفئة الأول فيساوي الحد الأدنى + طول الفئة.
فإذا اخترنا الحد الأدنى للفئة الأول = 12 فإن الحد الأعلى لها = 20.
جدول التفريغ جدول التوزيع التكراري
الفئة التفريغ التكرار الفئة التكرار
12 – 20
21 – 29
30 – 38
39 – 47
48 – 56
57 – 65
66 – 74
75 – 83
84 – 92
93 - 101 | |
| | | |
| | | |
| | |
| | | | |
| | | | | | | | | | |
| | | | | | | | |
| | | |
| | | | | |
| | | 2
5
5
3
6
13
11
5
7
3 12 – 20
21 – 29
30 – 38
39 – 47
48 – 56
57 – 65
66 – 74
75 – 83
84 – 92
93 - 101 2
5
5
3
6
13
11
5
7
3
المجموع 60
مثال 3:
إذا كانت بيانات المثال السابق تمثل إنتاج الحليب باللترات في يوما ما بـ 60 مزرعة أعد الإجابة على الأسئلة المطروحة؟.
الحـل:
1) المتغير كمي مستمر لأنه يمكن أن يأخذ أي قيمة بين عددين صحيحين.
2) نستخدم الفئات المفتوحة.
3) + 4) نحصل على نفس النتائج.
5) عدد الفئات = 10 فإن
طول الفئة ≤