لمحة عن الإحصاء وعلم جمع البيانات


"" الإحصاء وعلم جمع البيانات وتحليلها وعرضها وتفسيرها. وفرت الاحتياجات الحكومية لبيانات التعداد وكذلك معلومات حول مجموعة متنوعة من الأنشطة الاقتصادية الكثير من الزخم المبكر لمجال الإحصاء. في الوقت الحالي ، حفزت الحاجة إلى تحويل الكميات الكبيرة من البيانات المتاحة في العديد من المجالات التطبيقية إلى معلومات مفيدة التطورات النظرية والعملية في مجال الإحصاءات.

تعريف البيانات

البيانات هي الحقائق والأرقام التي يتم جمعها وتحليلها وتلخيصها للعرض والتفسير. يمكن تصنيف البيانات إما كمية أو نوعية. تقيس البيانات الكمية إما مقدار أو عدد العناصر ، وتوفر البيانات النوعية تسميات أو أسماء لفئات العناصر المشابهة. على سبيل المثال ، افترض أن دراسة معينة مهتمة بخصائص مثل العمر والجنس والحالة الاجتماعية والدخل السنوي لعينة من 100 فرد. ستسمى هذه الخصائص متغيرات الدراسة ، وسوف ترتبط قيم البيانات لكل من المتغيرات بكل فرد. وبالتالي ، سيتم تسجيل قيم البيانات لـ 28 ، ذكر ، أعزب ، و 30،000 دولارًا لذكر واحد يبلغ من العمر 28 عامًا مع دخل سنوي قدره 30،000 دولار. مع 100 فرد و 4 متغيرات ، سيكون لمجموعة البيانات 100 × 4 = 400 عنصر. في هذا المثال ، العمر والدخل السنوي متغيرات كمية ؛ تشير قيم البيانات المقابلة إلى عدد السنوات وكم من المال لكل فرد. الجنس والحالة الاجتماعية متغيرات نوعية. توفر التسميات للذكور والإناث البيانات النوعية للجنس ، وتشير التسميات الفردية ، المتزوجة ، المطلقة ، والأرملة إلى الحالة الزوجية.


جمع البيانات الإحصائية


يتم استخدام طرق المسح النموذجي لجمع البيانات من الدراسات القائمة على الملاحظة ، ويتم استخدام طرق التصميم التجريبية لجمع البيانات من الدراسات التجريبية. يهتم مجال الإحصاء الوصفي في المقام الأول بطرق عرض وتفسير البيانات باستخدام الرسوم البيانية والجداول والملخصات العددية. عندما يستخدم الإحصائيون بيانات من عينة - أي ، مجموعة فرعية من السكان - للإدلاء ببيانات حول مجتمع ، يقومون بإجراء استدلال إحصائي. تقدير واختبار الفرضية هي الإجراءات المستخدمة لعمل الاستدلالات الإحصائية. تستخدم مجالات مثل الرعاية الصحية والبيولوجيا والكيمياء والفيزياء والتعليم والهندسة والأعمال والاقتصاد على نطاق واسع الاستدلال الإحصائي
تم تطوير طرق الاحتمال في البداية لتحليل ألعاب القمار. تلعب الاحتمالية دورًا رئيسيًا في الاستدلال الإحصائي ؛ يتم استخدامه لتوفير مقاييس جودة ودقة الاستدلالات. تم وصف العديد من طرق الاستدلال الإحصائي في هذه المقالة. يتم استخدام بعض هذه الطرق بشكل أساسي للدراسات ذات المتغير الواحد ، بينما يتم استخدام البعض الآخر ، مثل تحليل الانحدار والارتباط ، لاستخلاص استنتاجات حول العلاقات بين متغيرين أو أكثر.

الإحصاءات الوصفية هي ملخصات جدولة ورسومية وعددية للبيانات. الغرض من الإحصاءات الوصفية هو تسهيل عرض البيانات وتفسيرها. معظم العروض الإحصائية التي تظهر في الصحف والمجلات وصفية بطبيعتها. تستخدم الأساليب أحادية المتغير للإحصاءات الوصفية البيانات لتحسين فهم متغير واحد ؛ تركز الأساليب متعددة المتغيرات على استخدام الإحصائيات لفهم العلاقات بين متغيرين أو أكثر. لتوضيح طرق الإحصاء الوصفي ، سيتم فحص المثال السابق الذي تم فيه جمع البيانات عن العمر والجنس والحالة الاجتماعية والدخل السنوي لـ 100 فرد. طرق مجدولة يعد الملخص التكراري الأكثر شيوعًا في استخدام البيانات لمتغير واحد. يوضح التوزيع التكراري عدد قيم البيانات في كل فئة من فئات عديدة غير متداخلة. يُظهر ملخص جدولي آخر ، يسمى التوزيع النسبي للتردد ، الكسر أو النسبة المئوية لقيم البيانات في كل فئة. الملخص الجدولي الأكثر شيوعًا للبيانات الخاصة بمتغيرين هو الجدولة المتقاطعة ، وهي تماثلية متغيرة لتوزيع التردد.
 

المتغيرات الكمية الاحصائية

يتطلب إنشاء توزيع تكراري لمتغير كمي مزيدًا من العناية في تحديد الفئات ونقاط التقسيم بين الطبقات المتجاورة. على سبيل المثال ، إذا تراوحت بيانات العمر للمثال أعلاه من 22 إلى 78 عامًا ، يمكن استخدام الفئات الستة التالية غير المتداخلة: 20-29 ، 30-39 ، 40-49 ، 50-59 ، 60-69 ، 70-70 79. سيُظهر توزيع التكرار عدد قيم البيانات في كل فئة من هذه الفئات ، وسيُظهر توزيع التكرار النسبي جزء قيم البيانات في كل فئة. الجدولة المتقاطعة هي جدول ثنائي الاتجاه مع صفوف الجدول التي تمثل فئات متغير واحد وأعمدة الجدول تمثل فئات متغير آخر. لإنشاء جدولة متقاطعة باستخدام متغيرات الجنس والعمر ، يمكن عرض الجنس مع صفين ، ذكر وأنثى ، ويمكن إظهار العمر بستة أعمدة تتوافق مع الفئات العمرية 20-29 ، 30-39 ، 40-49 ، 50 –59 ، 60–69 ، و70-79. سيحدد الإدخال في كل خلية في الجدول عدد قيم البيانات مع الجنس المحدد في عنوان الصف والعمر المحدد بواسطة عنوان العمود. يمكن أن يكون هذا الجدولة المتقاطعة مفيدًا في فهم العلاقة بين الجنس والعمر. طرق رسومية يتوفر عدد من الأساليب الرسومية لوصف البيانات. الرسم البياني الشريطي هو جهاز رسومي لتصوير البيانات النوعية التي تم تلخيصها في توزيع التردد. تظهر تسميات فئات المتغير النوعي على المحور الأفقي للرسم البياني. يتم إنشاء شريط أعلى كل تسمية بحيث يتناسب ارتفاع كل شريط مع عدد قيم البيانات في الفئة. يتم عرض رسم بياني شريطي للحالة الزواجية لـ 100 فرد في المثال أعلاه في الشكل 1. هناك 4 أشرطة في الرسم البياني ، واحد لكل فئة. التخطيط الدائري هو جهاز رسومي آخر لتلخيص البيانات النوعية. يتناسب حجم كل شريحة من الفطيرة مع عدد قيم البيانات في الفئة المقابلة."



Post a Comment

thank's

Previous Post Next Post