Using the linear and non-linear discriminant function with cluster analysis to study the level of education for the completed stages (governmental – private) In Nineveh Governorate | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
IRAQI JOURNAL OF STATISTICAL SCIENCES | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Article 7, Volume 18, Issue 1, June 2021, Pages 88-98 PDF (1.93 M) | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Document Type: Research Paper | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DOI: 10.33899/iqjoss.2021.168377 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Authors | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Zainab Adel* ; Safwan Rashed | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Department of Statistics and Informatics, Faculty of Computer Science and Mathematics, University of Mosul, Mosul, Iraq | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Abstract | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Abstract: The basic idea of this research is to study the influential variables that led to the differences between the performance of public and private schools, and through the use of some linear statistical methods, which are the function of discriminatory analysis and nonlinear methods represented by the function of logistic regression and cluster analysis, where the comparison between the two groups of public and community schools and know the appropriateness of each of the methods used with the applied data of the study community, which includes data The finished stage for the school year(2018-2019) of each of the schools (primary- middle- preparatory(Bio)) in the Nineveh Governorate Education Directorate, to determine the group and the best stage in addition to identifying the variables that affect the performance in order to reach improvement and standardization of the educational path. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Highlights | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Through the equation of the linear discriminatory function, it was noticed in the primary stage that a clear effect appeared for the subjects of Islamic education and the Arabic language on the value of the function, and this effect is by one unit from the rest of the subjects, in contrast to their effect in the two stages (intermediate and preparatory), noting the negative (contradictory) effect of the intermediate stages And middle school in physics subject on the value of the function, given that a decrease in the value of the discriminatory function will lead to an increase in the error rate for classification, and this is what has been clarified and confirmed in Table (4). | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Keywords | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
linear discriminatory function; binary logistic regression; cluster or pyramidal analysis | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Full Text | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
المقدمة Introduction عند تحلیل البیانات الثنائیة"Binary Data" والتی یأخذ المتغیر التابع y فیها احدى القیمتین(0,1) مثلا مصاب أو غیر مصاب ، فانه یفضل استخدام اسلوب دالة التحلیل التمییزی Discriminant Analysis أو استخدام اسلوب تحلیل الانحدار اللوجستی Logistic Regression واللذان یعتبران من الاسالیب الاحصائیة المهمة فی تصنیف مفردة أو أکثر الى احدى المجتمعات بالاعتماد على قیم المتغیرات المستقلة لتلک المفردة أو المشاهدة، ومن ثم تم توظیف الاسلوبین مع اسلوب التحلیل العنقودی لمعرفة تأثیر کل متغیر داخل کل مجموعة على حدى، حیث أن هناک اختلاف فی الفکرة الاساسیة للأسالیب المستخدمة لکن فی النهایة فانهم یتوصلون الى نتائج لتصنیف المشاهدات. على وجه الخصوص فان Wilson & Hardgrave(1995) یشیر الى أن تصنیف اداء الطلاب فی المدارس وتوقع النجاح أو التعثر من المشکلات المهمة التی تتطلب استخدام اسالیب احصائیة متقدمة ، وقد اقتصر البحث توظیف الاسالیب المستخدمة فی تحلیل بیانات عینة من طلبة مدارس محافظة نینوى ومقارنة ادائهم فی المدارس والمرحلة العائدین لها من خلال اخذ مجموعة من طلاب وطالبات المراحل المنتهیة للمدارس الحکومیة والأهلیة فی المحافظة للعام الدراسی 2018-2019. مبررات اختیار الموضوع:
1-مفهوم التحلیل التمییزی:Discriminant Analysis أن اول من استخدم التحلیل التمییزی هوKarl Pearson عام(1921) عندما اقترح اسلوب احصائی أطلق علیه معاملات التشابه للأشیاء المتماثلة Coefficient of racial likeness ، أما Fisher فانه وفی عام (1931) أوجد دالة خطیة لتصنیف المفردة الى احدى المجموعتین مع تساوی التباینات وأطلق علیها الدالة التمییزیة الخطیةLinear Discriminant Function ومنها أصبحت عامة للمجتمعات متعددة المتغیرات(الشکرجی، 2008). الفکرة الاساسیة من التمییز هی الفصل بین المجتمعات المتداخلة ولها نفس الخصائص والصفات ، حیث أن مهمة التحلیل التمییزی هو ایجاد دالة یمکن من خلالها تصنیف المفردات الجدیدة الى احدى مجتمعات الدراسة(دخیل، (2014). التمییز والذی یسمى بدالة Fisher هو طریقة صحیحة للتصنیف لو توفرت شروط تطبیقها من حیث التوزیع الطبیعی للمتغیرات وتساوی مصفوفات التباین والتباین المشترک ویستخدم فی عملیة التوقع حیث أن الباحث یتنبأ بعدة مفردات أو مشاهدات ویتوقع تمییزها بین مجموعتین فی المستقبل (سلیمان، 2012). 2-الدالة الممیزة الخطیة بین مجموعتین: Linear Discriminant Function Between 2Groups دالة التمییز هی نموذج یمکن صیاغته اعتماداً على مؤشرات العینة التی تم اختیارها ووضعت فی مجموعتین مختلفتین ، وبواسطة هذه الدالة نستطیع أن نختبر المفردة الجدیدة الى ای المجموعتین عائدة. بالتالی فان الترکیب الخطی بشکل عام یکون حسب الصیغة الاتیة(دخیل، 2009):
وأن ( ) یمثل عدد معلمات الدالة التمییزیة ، کما أن k تمثل عدد المتغیرات داخل کل مجموعة، حیث یتم تقدیر معلمات الدالة باتباع الصیغة والخطوات الاتیة:
وحیث أن : : معکوس مصفوفة التباین والتباین المشترک للمجموعة . d : یمثل الفروق بین متوسطات المشاهدات للمتغیرات. -ایجاد متوسط کل متغیر فی کل مجموعة وکالآتی :1 = …………….(3) P= عدد المجموعات قید الدراسة (1،2) ، K= عدد المتغیرات داخل المجموعات (1,2,3,……) 2-ایجاد الفرق (المسافة) بین متوسطی کل متغیرین فی کل من المجموعتین: = - ………….(4); i=1,2,3, ………,n 3-ایجاد مصفوفة التباین والتباین المشترک ( Variance-Covariance )وهی عبارة عن التباینات المجمعة بین کل متغیر فی مجموعة ونفس المتغیر فی المجموعة الثانیة: V= ; = …………..(5) = - …………..(6) أما بالنسبة للتغایرات المشترکة فیتم حسابها کالآتی: = …………(7) = - ………….(8) 3-نقطة الفصل: Cut Of Point لغرض الفصل بین المجموعتین قید البحث لابد من وجود نقطة للفصل بهدف تصنیف مفردة جدیدة لإحدى المجموعتین ویعبر عنها بالصیغة الاتیة(Copper, 1984):
حیث أن و هی متوسط القیم التمییزیة للمجموعة الاولى والمجموعة الثانیة وتحسب قیم کل منها حسب الصیغ الاتیة:
فاذا کانت قیمة نقطة الفصل أقل أو تساوی قیمة الدالة التمییزیة للمشاهدة أو المفردة فإنها تُصنف ضمن المجموعة الاولى والا فإنها تُصنف ضمن المجموعة الثانیة. 4-اختبار کفاءة الدالة التمییزیة الخطیة:Test The Efficiency Of The Linear Discriminant Function تتعدد اسالیب التحلیل التمییزی وذلک فی ضوء تحقق الافتراضات اللازم توفرها عند استخدام کل منها، حیث تعرف بالدالة التمییزیة اللاخطیة عند عدم تساوی مصفوفتی التباینات المشترکة ومنها ما تم استخدامهُ فی هذا البحث والمتمثلة بدالة الانحدار اللوجستیLogistic Regression ، کما ویتم اعتماد الطریقة المناسبة عندما یکون خطأ التصنیف أقل ما یمکن وتعد الدالة التمییزیة الخطیة LinearDiscriminant من الاسالیب المستخدمة فی هذا الصدد(Fisher,1936) والتی قُدمت من قبلFisher: 1-اختبار معنویة الفروق بین المجتمعات: test of differences between communities لغرض اختبار معنویة الفروق بین متوسطات المجتمعات یتم اختبار الفرضیة القائلة بان هناک تساوی بین المتوسطات ضد الفرض البدیل وکالاتی وبحسب الصیغة الموضحة:
……(12); ) (D²) ) ( F = ( )= وبمقارنة القیمة المحسوبة للمختبر الاحصائی مع القیمة الجدولیة وعند مستوى معنویة معین یتم اتخاذ القرار حول رفض أو قبول فرضیة العدم، فإذا کانت القیمة المحسوبة للمختبر أکبر من القیمة الجدولیة عندها ترفض فرضیة العدم ویقبل الفرض البدیل بمعنى أن هناک فروق معنویة بین متوسطات المجموعات، والا فیتم قبول الفرض العدم. 2- اختبار تجانس مصفوفات التباین والتباین المشترک: Matrix CovarianceTest تعد من أهم الفرضیات لکی یتم اعتماد الدالة التمییزیة الخطیة یجب أن یتحقق تجانس مصفوفتی التباین ، لذلک یتم اختبار الفرضیة الاتیة:
ولتطبیق هذا الاختبار نستخدم اختبار(Bartlett test) والمقترح من قبل العالم (Bartlett) عام(1937) والذی یمتاز بکفاءة عالیة وهو الأکثر شیوعا، وصیغته المختبریة کالآتی : .………(14) M = وقد أثبت (Box) عام (1949) أنه اذا تم ضرب قیمة الصیغة اعلاه والمتمثلة بـ M فی ثابت والذی یُرمز له بـ ویأخذ الصیغة الآتیة : …….(15) وبالنتیجة فإننا نحصل على مقیاس یتوزع بالتقریب توزیع( Chi-Square ) بمستوى معنویة معین وعند درجة حریةk-1)(p-1)) حیث p تمثل عدد المجموعات وk تمثل عدد المتغیرات، ومن ثم نُقارن القیمة المحسوبة للمقدار مع قیمة المختبر Chi ،فاذا کانت القیمة المحسوبة أقل من القیمة الجدولیة فإننا نقبل فرضیة العدم ، ونرفض الفرضیة البدیلة التی تُؤکد تجانس التباین. 5-تقدیر نسبة الخطأ: Estimate Of Error Rate بعد ایجاد نقطة الفصل وقیمة الدالة التمییزیة للمشاهدة، لابد من ایجاد نسبة الخطأ لتصنیف ای مشاهدة، حیث أن هناک نوعین من اخطاء التصنیف(ابراهیم،2010): 1-الخطأ الظاهری: یمثل عدد المفردات التی صُنفت خطأ ظاهریاً ولهُ حالتین: الاولى: تصنیف مفردات للمجموعة الثانیة فی الاصل کانت تنتمی للمجموعة الاولى ویُرمز لعدد المفردات التی صُنفت خطأ بالرمز( ) وأن النسبة لها حیث یمثل نسبة المفردات التی تنتمی للمجموعة الاولى وصُنفت للمجموعة الثانیة. والثانیة: تصنیف مفردات للمجموعة الاولى وفی الاصل هی تنتمی للمجموعة الثانیة ویرمز لعدد المفردات عندئذٍ بالرمز( ) وأن النسبة حیث أنها تمثل نسبة الخطأ للمفردات التی تنتمی للمجموعة الاولى وصُنفت للثانیة. 2-الخطأ الحقیقی: یمثل نسبة التصنیف الحقیقی الخاطئ فی المجتمع، حیث یتم حساب نسبتهِ وحسب المعادلة الاتیة:
بعد حساب قیمة داخل القوس یتم استخراج الاحتمال المقابل لها من جدول التوزیع الطبیعی المعیاری، فکلما کان الاحتمال صغیراً وقریباً من الصفر دل ذلک على أن خطأ التصنیف کان ضئیلاً مما یدل على قدرة الدالة على التمییز، أما عندما تقترب قیمة الاحتمال من الواحد دل على أن احتمال خطأ التصنیف الحقیقی کبیراً مما یدل على ضعف الدالة على التصنیف والتمییز. 6-مفهوم نموذج الانحدار اللوجستی الثنائی:Binary Logistic Regression Model تکمُن أهمیة الانحدار اللوجستی عند مقارنتهِ بالأسالیب الاحصائیة الاخرى مثل(الانحدار الخطی والتحلیل التمییزی)، فی أنه أکثر قوة لأنه یقدم اختبار المعنویة للمعاملات، کما أنه یعطی الباحث فکرة عن مقدار تأثیر المتغیر المستقل فی المتغیر المعتمد النوعی ثنائی القیمة بالإضافة الى أنه یسمح للباحث بالاستنتاج بان متغیراً ما یعتبر اقوى تأثیراً من المتغیر الاخر فی فهم ظهور النتیجة المطلوبة(Lea, 1997). لانحدار اللوجستی الثنائی ما هو نوع من انواع الانحدار یکون فیه المتغیر المعتمد متغیر نوعی قد یأخذ قیمتین(الانحدار اللوجستی الثنائی) وقد یأخذ أکثر من قیمتین(الانحدار اللوجستی المتعدد)، الا أننا فی الانحدار اللوجستی الثنائی یکون هدفنا لیس تفسیر التغییر فی قیم المتغیر المعتمد وإنما تفسیر احتمال حدوث وعدم حدوث ظاهرة معینة، وأن من مزایا الانحدار اللوجستی الثنائی أنه أقل حساسیة تجاه الانحرافات عن التوزیع الطبیعی لمتغیرات الدراسة وذلک مقارنة مع اسالیب احصائیة اخرى، بالإضافة الى أنه یستطیع أن یتجاوز العدید من الافتراضات المقیدة لاستخدام طریقة المربعات الصغرىOLSفی الانحدار الخطی(الفرهود، 2014). یقوم النموذج اللوجستی الثنائی على فرض اساسی وهو أن متغیر معتمد یمثل ب(y) یأخذ القیمة(1) اذا حدث معین باحتمال(p)، ویأخذ القیمة(0) اذا لم یحدث ذلک الحدث وباحتمال(1-p)، ای حدوث الاستجابة من عدمها، وبما أن المتغیر المعتمد فی النموذج المقدر هو متغیر برنولی یأخذ احدى القیمتین(0,1)، فان الدالة اللوجستیة تأخذ الصیغة الاتیة(عدلی ، 2014):
حیث أن: تمثل احتمال حدوث الاستجابة( i ) من المتغیر المعتمد. من خلال المعادلة یتضح أن العلاقة بین المتغیر المعتمد والمتغیرات المستقلة (المواد الدراسیة لکل مرحلة من المراحل الثلاثة) علاقة غیر خطیة، لذلک هناک عدة تحویلات یمکن القیام بها لجعل العلاقة خطیة ومن أشهر هذه التحویلات هو تحویل (Logit)، فتصبح المعادلة السابقة تأخذ الشکل الاتی(عباس، 2012):
من المعروف فی الانحدار أن الطرف الایمن لهذه النماذج یأخذ قیماً من( ) الى( ) ولکن عندما یکون لدینا متغیران احدهما ثنائی(y) فان الانحدار الخطی البسیط لا یکون ملائم لان: وبالتالی یکون الطرف الایمن محصوراً بین(0,1) وبالتالی یکون النموذج غیر قابل للتطبیق من وجهة نظر الانحدار(الجاعونی،2011). 7-تقدیر معلمات النموذج اللوجستی الثنائی:Estimate The Parameters Of The Binary Logistic Model اشار Lea عام(1997) انه فی ظل توافر الشروط للانحدار الخطی فان طریقة المربعات الصغرى الاعتیادیة تعطی مقدرات تتصف بانها مقدرات خطیة غیر متحیزة ولها أقل تباین، حیث تبحث طریقة المربعات الصغرى عن أقل مجموع لمربعات انحرافات البیانات المشاهدة عن خط الانحدار، ولکن یتم استبعاد استخدام طریقة المربعات الصغرى لتقدیر نموذج الانحدار اللوجستی، لذا نستخدم طریقة الامکان الأعظم لحساب المعاملات اللوجستیة وتهدف هذه الطریقة الى تعظیم لوغاریتم الاحتمال الذی یعکس مدى امکانیة احتمال أن تکون تلک القیم المشاهدة للمتغیر المعتمد فی الامکان توقعها أو التنبؤ بها من خلال المتغیرات المستقلة (عابد، 2015)، حیث أن Logit هو اللوغاریتم الطبیعی لمعاملات الاحتمال ویعبر عنه بدلالة الاحتمالات بالصیغة الاتیة:
أما بالنسبة لتفسیر معاملات الانحدار اللوجستی الثنائی بدلالة الاحتمالات حیث أن الزیادة فی المتغیر المستقل بمقدار وحدة واحدة ستزید بان یکون المتغیر المعتمد(y=1) . 8-اختبار معنویة معلمات النموذج اللوجستی الثنائی: Test Of Binary Logistic ModelParameters عند بناء النموذج اللوجستی الثنائی نجد أن من المفید الاجابة على السؤال "هل یمکن حذف ای من المتغیرات فی نموذج الانحدار؟" وللإجابة على السؤال لابد من اجراء اختبار ما اذا کانت معلمات الانحدار تساوی الصفر أم لا، لذا یتم استخدام اختبار Waldلاختبار معنویة معالم النموذج حیث أنه یختبر فرض العدم ضد الفرض البدیل ، والذی یستند على الاحصائیة الاتیة:
حیث أن هی مقدر الخطأ المعیاری للمعلمات والتی تتبع التوزیع الطبیعی، لهذا تُقارن قیمتها المشاهدة بالقیم الحرجة(p-value). 9-مفهوم التحلیل العنقودی:Cluster Analysis عبارة عن اجراءات تصنف مجموعة حالات أو متغیرات بطرق معینة وترتیبها داخل عناقید بحیث تکون الحالات المصنفة داخل العنقود الواحد متجانسة فیما بینها فی حین أنها تختلف عن الحالات والمتغیرات الموجودة داخل العناقید الاخرى، علیه یمکن الاستنتاج بان اساس التحلیل العنقودی هو ترتیب المتغیرات بشکل عناقید بحیث یعمل على تصغیر التباین داخل العنقود الواحد وتعظیم التباین بین العناقید المختلفة(سلیمان، 2012)، کما أن التحلیل العنقودی یمثل نوعاً من الاسالیب المستخدمة فی تجمیع المفردات وتقلیص عددها ویطلق ایضا على عملیة التحلیل العنقودی بعملیة التحلیل التصنیفی أو عملیة التصنیف الرقمی(Michael, 2001). 10-انواع التحلیل العنقودی: Type Of Cluster Analysis یوجد نوعان من التحلیل العنقودی هما الهرمیةHierarchal Cluster Analysis) ) وغیر الهرمیة(طریقة المتوسطات)K-means) ) المستخدمتان فی تصنیف البیانات. فی هذا البحث تم التطرق الى استخدام طریقة التحلیل العنقودی الهرمی والذی یعد من الاسالیب المفضلة فی التحلیل العنقودی وفیه یتم عنقدة (k) من المتغیرات وبشکل متسلسل فی(m) من العناقید اذ یکون( ) أضعف العناقید و( ) أکثر قوة. 11-اسالیب العنقدة الهرمیة:Hierarchical Cluster Methods هناک طرق عدة ضمن طریقة العنقدة الهرمیة حیث أنه بعد تجمیع المتغیرات على شکل عناقید یجب حساب التماثل ما بین العناقید، وهناک طرق عدیدة تستخدم لهذا الغرض وهی(طریقة الربط المنفرد، طریقة الربط التام، طریقة الربط المتوسط، طریقة النقطة الوسطى، طریقة وارد) ، فی هذا البحث تم استخدام طریقة الربط المنفرد فی الجانب التطبیقی لذلک سیتم توضیح هذه الطریقة بشیء من التفصیل. طریقة الربط المنفرد :Single Linkage تسمى طریقة الجوار الأقرب، تعتمد هذه الطریقة على اعتبار أن العنصرین الأکثر تشابهاً بین العناصر بشکل نواة العنقود، ثم تُضاف باقی الوحدات الى هذه النواة بالتسلسل وحسب درجة الشبه مع عناصر نواة العنقود، اذ تُضاف الأکثر شبهاً ثم الأقل وبالتدریج، وفی حالة ربط مجموعة من العناقید مع بعضها فان ذلک یتم بالاستناد على اقرب المسافات أو معاملات التماثل بین أزواج العناصر (المخلوفی، 2012). تعرف المسافة بین العنقودین (A,B) بأنها أقل مسافة بین نقطة فی A ونقطة اخرى فی B:
حیث أن تمثل العناصر فی العناقید A,B وأن هی المسافة المحسوبة :
وأن العناصر اللذان یتم احتساب المسافة بینهما(رشید وآخرون، 2011). الجانب التجریبی: فی دراسة تطبیقیة لتصنیف عینة مختارة من طلبة المدارس الحکومیة والأهلیة للمراحل المنتهیة فی محافظة نینوى والتی تم الحصول علیها من مدیریة التربیة فی المحافظة ولمعرفة افضلیة الأداء لکل مجموعة من هذه المجامیع المختارة تم تطبیق اسلوب الدالة التمییزیة الخطیة ودالة الانحدار اللوجستی فضلاً عن استخدام اسلوب التحلیل العنقودی الهرمی حیث انه وبعد التأکد من أن البیانات التی تم الحصول علیها تتبع التوزیع الطبیعی تم حساب متجهات متوسطات المتغیرات لکل مجموعة قید الدراسة فضلاً عن تقدیر مصفوفتی التباین – التباین المشترک ، ولتکوین: 12- دالة التمییز الخطی: یجب تقدیر قیم معاملات الدالة من خلال الصیغة و (3) لکل مجموعة من المجموعات ومن خلال النتائج السابقة تم الحصول على النتائج فی الجدول الاتی الذی یوضح قیم المعاملات للدوال التمیزیة لکل مرحلة من مراحل التصنیف : دالة التمیز للمراحل الثلاث (الحکومیة - الأهلیة)
من خلال ملاحظة معادلة الدالة التمییزیة الخطیة للمرحلة الابتدائیة أن المتغیرات المتمثلة بالمواد(التربیة الاسلامیة واللغة العربیة واللغة الانکلیزیة والاجتماعیات) عند زیادة قیمتها بمقدار درجة واحدة یؤدی الى زیادة قیمة الدالة التمییزیة بمعدل(0.0595،0.269318،0.158343،0.089916) لکل مادة على التوالی، أما المتغیرات التی تمثل مادتی(الریاضیات والعلوم) فان اشارة السالب فیها تؤدی الى ان الزیادة فی قیمتها بمقدار درجة واحدة یؤدی الى انقاص قیمة الدالة بمعدل(0.09153،0.05459) على التوالی، کذلک التفسیر بالنسبة للمراحل المتوسطة والاعدادیة مع اختلاف تأثیر المواد على قیمة الدالة. بعد أن تم تکوین الدالة التمییزیة لکل مجموعة من مجامیع الدراسة، فان العملیة التالیة هی ایجاد نقطة الفصل لغرض التنبؤ وتصنیف المشاهدة الجدیدة المجهول انتمائها لأی مجموعة من المجموعات قید الدراسة بعد أن تتم مقارنتها مع قیمة الدالة التی یتم الحصول علیها عند تعویض قیم المشاهدة، ولهذا الغرض یتم الاعتماد على الصیغة الموضحة فی المعادلة(8) و(9) و (10) لإیجاد کل من تم الحصول على قیم نقاط الفصل الموضحة وکالاتی: الجدول(1) یبین قیم نقاط الفصل لکل مرحلة (حکومیة – أهلیة)
وللوقوف عند کفاءة الدالة التمییزیة الخطیة لابد من اجراء الاختبارین التالیین لمعرفة مدى تحقق شروط استخدام التمییز الخطی وحسب المعادلة(12) و(13) وکالاتی: الجدول(2) یبین القیم المحسوبة والجدولیة للمختبر الاحصائی المستخدم لاختبار معنویة الفروق بین المجتمعات
بحسب النتائج الموضحة فانه تم التأکد من تحقق الشرط الاول لاستخدام الدالة التمییزیة الخطیة والمتمثل بوجود الفروق المعنویة للمتوسطات بمعنى أنه یتم قبول الفرض البدیل الذی ینص على وجود الفروق . الجدول(3) یبین القیم المحسوبة والجدولیة لاختبار تجانس التباین
وباستخدام المعادلة(14) و(15) لاختبار تجانس مصفوفتی التباینات فانه تقبل فرضیة العدم للمدارس الابتدائیة والمتوسطة(حکومیة – أهلیة) کون القیمة المحسوبة أقل من القیمة الجدولیة للمختبر Chi-Squareوتُرفض عند المرحلة الاعدادیة ای أن الشرط الثانی لم یتحقق فی بیانات المرحلة الاعدادیة مما یدعو لاستخدام الدالة التمییزیة اللاخطیة . نظرا للنتائج التی تم التوصل الیها فی السابق کان لابد من معرفة اخطاء التصنیف التی تؤثر وبشکل على المعنویة والتجانس للمراحل الثلاثة، حیث تبین فی الجدول الاتی : الجدول(4) یبین اخطاء التصنیف لمفردات المتغیرات للمراحل الثلاث (الحکومیة – الأهلیة)
اخطاء التصنیف کانت بنسبة کبیرة فی مدارس الأهلیة للمرحلة الاعدادیة حیث بلغت قیمته(52.1) أما الحکومیة بلغت قیمة الخطأ (21.2) تلیها المدارس الأهلیة للمرحلة المتوسطة والتی بلغت قیمة الخطأ فیها (33.3) تقابلها نسبة خطأ قلیلة فی المدارس الحکومیة لنفس المرحلة حیث بلغت(5.4)، أما المرحلة الابتدائیة کانت نسبة الخطأ ضئیلة جداً فی المدارس الأهلیة (4.1) والحکومیة(7.1) بمقارنة بقیة المراحل، مما یدلل على وجود مشاهدات صنفت بطریقة خاطئة فی کلا المجموعتین ولجمیع المراحل. 13- دالة الانحدار اللوجستی الثنائی: تم الحصول على النتائج الاتیة والمتمثلة بقیم الدالة ومعلماتها: معاملات الانحدار اللوجستی الثنائی المقدرة للمراحل الثلاثة(الحکومیة – الأهلیة)
الجدول(5) یبین قیم اختبار Wald وقیمة الدالة الأسیة للمراحل الثلاثة (الحکومیة – الأهلیة)
یوضح العمود الاول من الجدول اعلاه معلمات النموذج المقدرة بوحدات ، أما العمود الثالث یوضح إحصاءه اختبار wald لمعنویة المعلمات المقدرة ومن خلال القیم الاحتمالیة یتضح أن فی العمود Sig فی حالة (الأهلیة – الحکومیة) للمرحلة الابتدائیة أن اللغة العربیة والانکلیزیة لها تأثیر معنوی على المتغیر المعتمد Y حیث القیمة الاحتمالیة کانت أقل من 0.01 و0.05، أما بالنسبة لبقیة المتغیرات فان تأثیرها غیر معنوی حیث القیمة الاحتمالیة کانت أکبر من0.01 و0.05، بالنسبة لمعنویة معلمات المرحلة المتوسطة فان التربیة الاسلامیة والعربیة والاحیاء کان تأثیرها معنوی عند مستوى المعنویة0.01 أما مادة الاجتماعیات والفیزیاء لها تأثیر معنوی على قیمة المتغیر المعتمد عند المستوى0.05 للحالة(الحکومیة – الأهلیة)، أما ما یتعلق بمعنویة المعلمات بالنسبة للمرحلة الاعدادیة فانه قد وجد أن مادة الفیزیاء وبالدرجة الاولى تلیها اللغة الانکلیزیة والعربیة ثم الفیزیاء تأثیرها المعنوی عند مستوى المعنویة0.01 لحالة(الحکومیة – الأهلیة) وما یتعلق ببقیة المتغیرات فان تأثیرها غیر معنوی على المتغیر المعتمد. 14- التحلیل العنقودی: وبتطبیق Cluster analysis على درجات الطلبة تم تصنیف للحالات داخل العناقید باستخدام طریقة الربط المنفرد حیث یحتوی کل عنقود على عددا من المتغیرات المتقاربة والمتجانسة فیما بینها، وباستخدام برنامج Minitab للحصول على المخطط العنقودی للمتغیرات، تم الحصول على النتائج الاتیة:
من المخطط الشجری الأکثر وضوحاً وبالنسبة للمدارس الابتدائیة الحکومیة وفی الشکل(1) فقد جُمعت کل من مادة(الریاضیات والعلوم واللغة الانکلیزیة والاجتماعیات) فی عنقود واحد مما یدل على أن هناک تجانس فیما بینها أکثر من باقی المواد الاخرى مع ملاحظة أن مادتی التربیة الاسلامیة واللغة العربیة کانت کل منها منفردة فی عنقود واحد حیث أنها اعطت فروق معنویة أکبر عن العنقود الاول، أما المدارس الأهلیة فی الشکل(2) کانت کل من مادة(التربیة الاسلامیة واللغة العربیة والعلوم) متجانسة فیما بینها ومادتی (اللغة الانکلیزیة والریاضیات) متجانسة فیما بینها أما مادة الاجتماعیات فقد کانت منفردة فی عنقود واحد مما أکد اعطائها فرق معنوی أکبر عن باقی المواد ، وهذا یظهر وجود فرق فی أهمیة المواد بین المدارس الحکومیة والأهلیة فی الاداء.
من المخطط الشجری للمدارس الحکومیة وفی الشکل(3) تبین أن هناک تجانس بین مادة(الریاضیات والفیزیاء واللغة الانکلیزیة والاحیاء والکیمیاء والاجتماعیات) مما جعلها فی عنقود واحد بینما کانت مادتی اللغة العربیة والتربیة الاسلامیة منفردة کل منها فی عنقود واحد بشکل متمیز عن باقی المواد لامتلاکها فروق معنویة کبیرة عن المواد الاخرى ، اما فی المدارس الأهلیة فی الشکل(4) کان لمادتی الریاضیات والاجتماعیات تمیز عن باقی المواد حیث کانت کل منها فی عنقود منفرد فکانت الفروق لکل منهما أکبر أما بقیة المواد جُمعت فی عنقود واحد مما یدل على تجانسها مع بعضها، ونلاحظ اعطاء أهمیة اکبر فی الاداء لمادتی التربیة الاسلامیة واللغة العربیة بشکل عام للمدارس الحکومیة والأهلیة.
ونلاحظ فی المدارس الحکومیة والأهلیة فی الشکلین (5) و(6) وجود المواد العلمیة المتمثلة بـ(اللغة العربیة والاحیاء والفیزیاء والریاضیات والکیمیاء) فی عنقود واحد مما یدل على تجانسها بینما تمیزت مادتی اللغة الانکلیزیة والتربیة الاسلامیة کل منها فی عنقود منفرد لوجود فروق معنویة أکبر جعلها تتمیز عن باقی المواد. وقد تبین ان مادتی (التربیة الاسلامیة واللغة الانکلیزیة) أعطت اهمیة فی الاداء الدراسی بشکل عام للمدارس الحکومیة والأهلیة ولجمیع المراحل فی عملیة التحلیل الاحصائی التی تم دراستها عن باقی المواد. الاستنتاجات: من خلال معادلة الدالة التمییزیة الخطیة تم ملاحظة فی المرحلة الابتدائیة ظهور تأثیر واضح لمادتی التربیة الاسلامیة واللغة العربیة على قیمة الدالة ویکون هذا التأثیر بمقدار وحدة واحدة عن باقی المواد على النقیض من تأثیرهما فی المرحلتین(المتوسطة والاعدادیة) مع ملاحظة التأثیر السلبی(المتناقض) لمرحلتی المتوسطة والاعدادیة فی مادة الفیزیاء على قیمة الدالة، عماً أن انخفاض قیمة الدالة التمییزیة سوف یؤدی الى زیادة فی نسبة الخطأ للتصنیف وهذا ما تم توضیحهُ وتأکیدهُ فی الجدول (4).
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
References | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Statistics Article View: 267 PDF Download: 221 |