Use the k nearest neighbor(KNN) to compare the classification of real age and age through the bone for thalassic patients. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
IRAQI JOURNAL OF STATISTICAL SCIENCES | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Article 9, Volume 17, Issue 2, December 2020, Pages 68-78 PDF (1.74 M) | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Document Type: Research Paper | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DOI: 10.33899/iqjoss.2020.167392 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Author | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Omar Al-rawi* | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Department of Legal Administration, Northern Technical University, Nineveh Technical Institute, Iraq | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Abstract | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Thalassemia is considered a chronic disease, especially children from the first years of life, and the patient goes through stages over long periods, Data were collected for patients by real age and age through the bone, Therefore, a comparison will be made between the two cases. There are many statistical methods used to arrive at a classification of data, the method of nearest neighbor has been relied upon as a method of classification between societies. The method of classifying each observation depends on the three closest values on the basis of which the observation is placed into the correct group, the naturalness of the data was rather close, so it asked us to use a method that helps us to reach a better classification. The k the nearest neighbor is the best way to reach an optimal classification for such data. Classification by real age was better than classification by bone age using classification. Classification by actual age was better than classification by bone age using k nearest neighbor classification | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Highlights | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
In the beginning, the results will be compared between the two samples of the real age and the age through the bone, and in two stages, the training sample and the presentation sample, as follows:
Training sample: What was mentioned in comparison between the real age and the age through the bone. It can be said that the accuracy in the first group was the classification in age through the bone 91.5% better than the real age 89.5% because the disease is in its infancy, and the disease did not affect the age through bone.
As for the second stage, in which the disease began to affect the patient, we note that the classification according to the real age 92.5% is much better than the age according to the bone 32.1%, due to the effect of the disease on the injured.
It is also possible to note the big difference in the classification through the third group as well, as the correct classification of the real age is 75%, compared to the age through the bones of 21.1%. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Keywords | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Nearest neighbor; Classification; Thalassemia | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Full Text | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1- المقدمة Introduction یعتبر التصنیف احدى الاسالیب الاحصائیة المستخدمة للتمییز بین عدة مستویات ، للوصول الى ترتیب للبیانات حسب مستویات ، خصوصا فی العدید من الدراسات ولاسیما فی الدراسات الصحیة للتعرف الى ای من المستویات تنمتی ای المشاهدة ، یتم استخدام العدید من الاسالیب الاحصائیة للتصنیف من خلال المتغیرات ، یمکن الوصول الى قرار بالتصنیف من خلال متغیر واحد او من خلال عدد من المتغیرات ، حسب الاسلوب الاحصائی وطبیعیة الدراسة للوصول الى تصنیف افضل . کان هنالک العدید من الدراسات التی استخدمة اسالیب مختلفة من التصنیف نذکر منها ، Chang and other (1991) استخدامهم الاسالیب الوراثیة فی عملیة التصنیف ،کما تطرق Weinberger and other (2006) الى اسلوب قیاس البعد بین المشاهدات باستخدام اسلوب الجار الاقرب ،استخدم (2007) Al-Rawi دالة التمییز القانونیة کاسلوب فی التصنیف بین الصور الرقمیة ، واستخدم (2007) Al-Rawi ایضا السیطرة النوعیة والدالة التمییزیة فی دراسة تطبیقیة ، ومن المواضیع التی تم التطررق الیها من قبل Anbeek and other (2008) اسلوب تحدید تقسیمات المجامیع للشبکات العصبیة من خلال استخدام تصنیف الجار الاقرب ،تم التطرق من قبل Yong and other (2009) الى اسلوب تصنیف النصوص من خلال الجار الاقرب ،کما استخدم Cai and other (2010) تصنیف الجار الاقرب لتصنیف الاوراق البحثیة ،صنف Guru and other (2010) صور الزهور من خلال ملامح ترکیبها باستخدام السلوب الجار الاقرب ، لم یقتصر استخدام الجار الاقرب على الطرق الکلاسیکیة فقد استخدم Tomašev and other (2011) احتمالیة التصنیف للجار الاقرب من خلال تحلیل بیز ، استخدم Chiang and other (2012) لتصنیف متعدد المراحل من خلال الجار الاقرب ، قارن Kim and other (2012) طرق تصنیف الصور من خلال الجار الافرب والتصنیف من خلال المتجهات ،استخدم Imandoust and other (2013) تصنیف الجار الاقرب للتنبؤ بالتغیرات الاقتصادیة من خلال الاعتماد على الاحداث السابقة ، کما استخدم Khamar (2013) الجار الاقرب فی تصنیف النصوص القصیرة من بالاعتماد على قیاس المسافة بین المجتمعات . ان الهدف من هذا البحث هو استخدام تصنیف الجار الاقرب للمقارنة بین العمر الحقیقی للمریض والعمر من خلال العظم ، و بسبب تقارب البیانات الماخوذة للعینة ، یتم الاعتماد على هذا الاسلوب للوصول الى تصنیف افضل ای باستخدام الجار الاقرب الذی یعتمد على تصنیف القیم المتقاربة لیتم وضعها الى مجموعة معینة . تمت کتابة البحث على مرحلتین الاولى الجانب النظری والثانیة الجانب العلمی ، تم التطرق فی الجانب النظری الى کیفیة حساب تقسیم العینة قید الدراسة عینة التدریب وعینة العرض ، کما ذکر طرق حساب الدول المستخدمة فی التصنیف وقیاس البعد بین المشاهدات بالاضافة الى ذلک تم التطرق الى ذکر اوزان المتغیرات ، اما الجانب العملی فذکر فیة مما تتکون البیانات بالاضافة الى مقارنة نتائج العمر الحقیقی والعمر من خلال العظم ، من ناحیة تقسم العینات التصنیفات الصحیحة واخطاء التصنیف ، رسوم بیانیة توضح توزیع البیانات فی الحالتین ،تم تصنیف المشاهدات الى المجتمعات ، مقارنة الاخطاء بین الحالتین ، حساب اهمیة کل متغیر ، لیتم الوصول الى ان العمر الحقیقی من خلال الجار الاقرب افضل بکثیر من استخدام العمر من خلال العظم . 2- تقسیم العینات : تقسیم البیانات الى عینتین الاولى التدریب والثانیة العرض ، یتم استخدام عینة التدریب لتدریب نموذج یساعد الوصول الى اقرب جار، ان نسبة عینة التدریب هی 70% من اصل البیانات ، یتم الاعتماد على عینة العرض للحصول على النموذج المستخدم فی التصنیف. ان نسبة عینة العرض هو 30% ، ان عینة العرض هی مجموعة مستقلة من البیانات المسجلة والتی تستخدم فی الحصول على النموذج النهائی . وان الخطاء لعینة العرض یعطی تقدیر "صادق" لقابلیة التنبؤ للنموذج لکون عینة العرض لاتسخدم فی بناء النموذج. (Reddy,2019) 3- اختیار المتغیرات: سیتم الترکیز على قوة النموذج بالاعتماد على حقل المتغیرات والتی ستعمل على ادخال واخراج المتغیرات حسب الاهمیة والاعتماد على المتغیرات صاحب الاهمیة الاکبر، وان لوحة اهمیة المتغیرات ستساعدنا فی الوصول الى ای المتغیرات الاهم ، وان لکل متغیر له نسبة اقل من الواحد الصحیح ، اذا یتم جمع القیم لکل المتغیرات یکون مجموعها مساویا الى الواحد الصحیح وان اهمیة المتغیرات لیس لها علاقة بدقة النموذج . وهی مرتبطة باهمیة متغیر التنبؤ المستخدم بالتنبؤ ، سواء التنبؤ دقیق ام لا . بفرض ان المتغیرات ( ) ( ) فی النموذج لعملیة الاختیار المتقدم بنسبة خطاء او مجموع مربعات الاخطاء e. ان اهمیة المتغرات فی النموذج تحسب من الطریقة الاتیة :
4- حساب الدالة : بفرض ان g یمثل عدد من المجامیع ، یمثل عدد المشاهدات فی المجموعة i ، وان هی الاحتمالیة المسبقة للمجموعة i، وافرض ان تشیر الى المشاهدة المقدرة بمتغیر التمییز ذی البعد . ولتنظیم عمل دالة التمییز یمثل متجة المتغیر.والتی تقابل صف من مجموعة البیانات وبفرض ان تمثل دالة الکثافة الاحتمالة للمجموعة ، وبفرض ان تمثل الاحتمالة الشرطیة للمشاهدة والتی تعود الى المجموعة ، تمثل الاحتمالیة المسبقة للمجموعة والتی تعطی المشاهدة کما فی الدالة ضمن نظریة بیز کما یلی ( Pochiraju,2018)
وبتعویض بدلا عن ستکون الدالة کما فی الشکل التالی
لــدالة التمییز الجار الاقرب للحالة k نفرض ان هی عدد الجار الاقرب k للمجموعة i ، وان الاحتمالیة المسبقة للنموذج سیکون (McCormick,2017)
فی حال وجود روابط فی الجار الاقرب ، سوف تزید k العلاقة لتتلائم مع الرابط ،اذا کان لدینا خمس نقاط متقاربة ومتساویة البعد للقیمة المعطات x ، سیتم حساب اقرب ثلاث قیم للجار الاقرب للقیمة x والتی ستساعد للحصول للجار لاقرب قیم . حدد الجار الاقرب بالاعتماد على الاختلاف او على البعد المحسوب ، ان مقیاس التباعد بین للمتغیر فی حال المتغیر المستمر وثانی القیاس تم وصفة فی ((((ملف قیاس الاختلاف )))) ، واذا تم اختیار نفس المقیاس ،والتی ستحول الى التباین باحدى الطریقتین : (IBM,2015)
مع ای مقیاس مستمر ، تحویل مهلنوبس یفضل استخدامة قبل حساب التباین . وان اختیار قیمة k الامثل للجار الاقرب علمیا لیست دقیقة . فی المجموعتین ویجب ان تکون قیمة k فردیة لتفادی الترابط . وان افضل قیمة للثابت k هو حیث ان یمثل الحجم النموذجی للمجموعة . ان سبب استخدام تصنیف ال KNN عندما تکون البیانات متقاربة لذا یتم اختیار نقاط تقارب بین البیانات ، فی البدایة یتم اختیار اقرب جار بعدها یتم تحدید الى ای فئة تنتمی هذا القیمة . وان انضمام القیمة الى ای مجموعة یتم توقعها من خلال القیم المجاورة لها . (International,2017) 5- الجانب العلمی : تم جمع البیانات من خلال 150 مشاهدة مصابة بمرض فقر دم البحر الابیض المتوسط نوع بیتا Beta-Thalassaemia وکانت المتغیرات کما فی الجدول رقم 1 .
تم تقسیم المجامیع الى ثلاث مجامیع بموجب العمر فکانت المجموعة الاولى من العمر 1 سنة الى عمر اقل من 5 سنوات اما المجموعة الثانیة من العمر 5 الى اقل من 10 سنوات والمجموعة الثالثة من العمر 10 الى 16 سنة (Imran,2018)،(دبدوب ، 2006) 6- ملخص المشاهدات : من ما ذکر فی الجانب النظری حول تقسیم البیانات تم تقسیم البیانات الى عینتین التدریب والعرض ،سیتم ذکر البیانات الخاصة بالعمر الحقیقی وبعدها یذکر التفاصیل البیانات للعمر من خلال العظم بالاعتماد على الجدول رقم 2 :
العمر الحقیقی : کان نسبة عینة التدریب هی 68.70% والبالغ عددها 103 مشاهدة ، کان نسبة عینة العرض هی 31.1 % والبالغ عددها 47 مشاهدة ، ان المجموع الکلی للمشاهدات التدریب والعرض 150 مشاهدة لتکون النسبة المئویة 100 % ولایوجد مشاهدات مستبعدة . العمر من خلال العظم : کان نسبة عینة التدریب هی 76.70% والبالغ عددها 115 مشاهدة ، کان نسبة عینة العرض هی 23.30 % والبالغ عددها 35 مشاهدة ، ان المجموع الکلی للمشاهدات التدریب والعرض 150 مشاهدة لتکون النسبة المئویة 100 % ولایوجد مشاهدات مستبعدة . اهمیة المتغیرات: سیتم ذکر اهمیة المتغیرات بالاضافة الى وزن کل متغیر بالاعتماد على الرسم البیانی فضلا عن الجدول المرفق مع الرسم والذی یبین اهمیة کل متغیر بالنسبة الى العمر الحقیقی للمریض والعمر من خلال العظم من خلال العمر الحقیقی وبالاعتماد على الجدول رقم 3 والشکل رقم 1 والذی یمثل المدرج التکراری ،تم توضیح اهمیة المتغیرات حسب وزن کل متغیر فکانت المتغیرات حسب الاهمیة من اکثر متغیر مهم الى اقل متغیر مهم على النحو التالی فان المتغیر الاکثر اهمیة هو (x9=0.2375) والمتغیر الثانی حسب الاهمیة هو (x2=0.1072) المتغیر الثالث حسب الاهمیة هو (x7=0.1037) المتغیر الرابع حسب الاهمیة هو (x8=0.1037) المتغیر الخامس حسب الاهمیة (x3=0.0931) المتغیر السادس حسب الاهمیة هو (x6=0.0931) المتغیر السابع حسب الاهمیة هو (x10=0.0931) المتغیر الثامن حسب الاهمیة هو (x4=0.0896) المتغیر التاسع حسب الاهمیة هو (x5=0.079) . من خلال ما ذکر اعلاه فانه سیتم اختیار اول ثلاث متغیرات وتهمل البقیة فی الرسم وسیتم الاعتماد على المتغیرات التالیة حسب التسلسل(x7,x2,x9) .
من خلال العمر من خلال العظم وبالاعتماد على الجدول رقم 4 والشکل رقم 2 والذی یمثل المدرج التکراری ،تم توضیح اهمیة المتغیرات حسب وزن کل متغیر فکانت المتغیرات حسب الاهمیة من اکثر متغیر مهم الى اقل متغیر مهم على النحو التالی ،ان المتغیر الاکثر اهمیة هو (x9=0.126) والمتغیر الثانی حسب الاهمیة هو (x8=0.1203) المتغیر الثالث حسب الاهمیة هو (x3=0.1147) المتغیر الرابع حسب الاهمیة هو (x6=0.1128) المتغیر الخامس حسب الاهمیة
(x10=0.1109) المتغیر السادس حسب الاهمیة هو (x4=0.1071) المتغیر السابع حسب الاهمیة هو (x5=0.1034) المتغیر الثامن حسب الاهمیة هو (x7=0.1034) المتغیر التاسع حسب الاهمیة هو (x2=0.1015) . من خلال ما ذکر اعلاه فانه سیتم اختیار اول ثلاث متغیرات وتهمل البقیة فی الرسم وسیتم الاعتماد على المتغیرات التالیة حسب التسلسل(x3,x8,x9) ، الرسم ثلاثی الابعاد. 7- الرسم البیانی للمجامیع :
من الشکل رقم 4 والذی یمثل الرسم البیانی ،تم استخدام الرسم البیانی ثلاثی الابعاد بالاعتماد على ثلاث متغیرات (x3,x8,x9) ان هذه المتغیرات الاکثر اهمیة وتم اهمال بقیة المتغیرات ای تم تصنیف البیانات بموجب الرسم ثلاثی الابعاد ، ولتوضیح نفس الرسم فقد تم تلوین المجامیع الى ثلاث الوان مختلف مؤشرة على جانب الرسم (3،2،1) ، من خلال ما ذکر اعلاه فان البیانات کانت على نوعین التدریب والعرض اخذت بیانات التدریب شکل المثلث بالنسبة الى المجموعات الثلاث اما بیانات العرض فاخذ شکل الدائرة بالنسبة الى بیانات العرض .
8- اختیار الجار الاقرب: تم اعتماد قیمة المتغیر k=3 ای سیکون اتخاذ القرار بالنسبة الى الجار الاقرب من خلال اقرب ثلاث مشاهدات ، تم اختیار نقطة بشکل عشوائی للتوضیح ، فاعطت اقرب ثلاث نقاط وهو الاسلوب المستخدم فی اختیار المجموعة بالنسبة الى الجار الاقرب لثلاث قیم ، باستخدام اسلوبین الاول من خلال رسم المتغیرات وکما هو موضح فی الرسمین التوضیحیین (1) و(2) ، والطریقة الثانیة من خلال جدول لقیاس البعد بین المشاهدات کما فی الجدولین (5) و(6) . العمر الحقیقی :من الشکل رقم 5 والذی یمثل الرسم التوضیحی ،تم توضح الجار الاقرب بالنسبة الى قیمة المشاهدة المختارة وهی 121 وسیتم اختیار الجار الاقرب من خلال القیم القریبة من خلال عدة متغیرات بالنسبة الى متغیر العمر الحقیقی(X1) بالاضافة الى المتغیرات الاهم فالاقل اهمیة ، فکانت المشاهدات (3،108،27) هی الجار الاقرب للمشاهدة 121 ویمکن مشاهدتها حسب المتغیرات (x3,x8,x7,x2,x9) والتی بدورها ستنظم الى المجموعة الثانیة من خلال قرب القیمة الى قیم المجموعة الثانیة .
العمر من خلال العظم : من الشکل رقم 6 والذی یمثل الرسم التوضیحی ،تم توضح الجار الاقرب بالنسبة الى قیمة المشاهدة المختارة وهی 121 وسیتم اختیار الجار الاقرب من خلال القیم القریبة من خلال عدة متغیرات بالنسبة الى متغیر العمر من خلال العظم (Y1) بالاضافة الى المتغیرات الاهم فالاقل اهمیة ، فکانت المشاهدات (13،40،27) هی الجار الاقرب للمشاهدة 121 ویمکن مشاهدتها حسب المتغیرات (x10,x6,x3,x8,x9) والتی بدورها ستنظم الى المجموعة الثانیة من خلال قرب القیمة الى قیم المجموعة الثالثة .وبالاعتماد على هذا الاسلوب تم تصنیف المشاهدات الى المجامیع.
العمر الحقیقی : ومن خلال الجدول رقم (5) الخاص بقیم الجار الاقرب والذی بین الجار الاقرب للمشاهدة 121 مع المشاهدات الاقرب ذات التسلسل (3،108،27) ذات الابعاد والتی تمثل القیم الاقرب للمشاهدة المذکورة لذا یمکن القول ان قیم الابعاد(0.502،493،0.493) یمکن الاعتماد علیها لتصنف القیمة 121 الى المجموعة الثانیة بالاعتماد على الجار الاقرب حسب الجدول رقم (5) . العمر من خلال العظم : ومن خلال الجدول رقم (6) الخاص بقیم الجار الاقرب والذی بین الجار الاقرب للمشاهدة 121 مع المشاهدات الاقرب ذات التسلسل (13،40،27) ذات الابعاد والتی تمثل القیم الاقرب للمشاهدة المذکورة لذا یمکن القول ان قیم الابعاد(0.492،0.491،0.490) یمکن الاعتماد علیها لتصنف القیمة 121 الى المجموعة الثالثة بالاعتماد على الجار الاقرب حسب الجدول رقم (6) . 9- جدول التصنیف : حسب ما ذکر اعلاه حول جدول التقسیم للبیانات الى عینتین التدریب والعرض ، فقد تم عمل جدول لعرض التصنیف الصحیح واخطاء التصنیف للعینتین التدریب والعرض للعمر الحقیقی والعمر من خلال العظم وکانت على النحو التالی :
عینة التدریب : ان عدد المشاهدات التی تنتمی الى المجموعة الاولى وهی تنتمی الى المجموعة الاولى هی 34 مشاهدة ، اما عدد المشاهدات التی تنتمی الى المجموعة الاولى وصنفت بشکل خاطى الى المجموعة الثانیة فکانت 4 مشاهدات ولاتوجد مشاهدة صنفت الى المجموعة الثالثة بشکل خاطى ، ان نسبة التصنیف فی المجموعة الاولى بشکل صحیح هو 89.5% اما فیما یخص العمر من خلال العظم فکانت عدد المشاهدات التی تنتمی الى المجموعة الاولى وهی تنتمی الى المجموعة الاولى هی 54 مشاهدة ، اما عدد المشاهدات التی تنتمی الى المجموعة الاولى وصنفت بشکل خاطى الى المجموعة الثانیة فکانت 4 مشاهدات ومشاهدة واحدة تنتمی المجموعة الثالثة وصنفت الى المجموعة الثالثة وهی تنتمی الى المجموعة الاولى ، ان نسبة التصنیف فی المجموعة الاولى بشکل صحیح هو 91.5% ،. اما بالنسبة الى العمر الحقیقی المجموعة الثانیة تم تصنیف ال3 مشاهدات الى المجموع الاولى وهی تنتمی الى المجموعة الثانیة ، وتصنیف 49 مشاهدة بشکل صحیح الى المجموعة الثانیة وهی منتمیة الى المجموعة الثانیة ، تصنیف مشاهدة الى المجموعة الثالثة وهی تنتمی الى المجموعة الثانیة ، ان نسبة التصنیف الصحیح للمجموعة الثانیة هی 92.5% ، اما بالنسبة الى العمر من خلال العظم ففی المجموعة الثانیة تم تصنیف 20 مشاهدات الى المجموع الاولى وهی تنتمی الى المجموعة الثانیة ، وتصنیف 12 مشاهدة بشکل صحیح الى المجموعة الثانیة وهی منتمیة الى المجموعة الثانیة ، تصنیف 5 مشاهدات الى المجموعة الثالثة وهی تنتمی الى المجموعة الثانیة ، ان نسبة التصنیف الصحیح للمجموعة الثانیة هی 32.4% ، اما بالنسبة الى العمر الحقیقی المجموعة الثالثة لم تصف ای مشاهدة الى المجموعة الاولى ، تم تصنیف 3 مشاهدات الى المجموعة الثانیة وهی تنتمی الى المجموعة الثالثة ، وتصنیف 9 مشاهدات الى المجموعة الثالثة وهی تنتمی الى المجموعة الثالثة ، ان نسبة التصنیف الصحیح للمجموعة الثالثة هو 75% وهی اقل نسبة تصنیف صحیح فی عینة التدریب للعمر الحقیقی، اما بالنسبة الى العمر من خلال العظم ففی المجموعة الثالثة تم تصنیف 9 مشاهدات الى المجموعة الاولى وهی تنتمی الى المجموعة الثالثة ، تم تصنیف 6 مشاهدات الى المجموعة الثانیة وهی تنتمی الى المجموعة الثالثة ، وتصنیف 4 مشاهدات الى المجموعة الثالثة وهی تنتمی الى المجموعة الثالثة ، ان نسبة التصنیف الصحیح للمجموعة الثالثة هو 21.1% وهی اقل نسبة تصنیف صحیح فی عینة التدریب ، للعمر من خلال العظم . عینة العرض : بالنسبة الى العمر الحقیق ان عدد المشاهدات التی تنتمی الى المجموعة الاولى وهی تنتمی الى المجموعة الاولى هی 15 مشاهدة ، اما عدد المشاهدات التی تنتمی الى المجموعة الاولى وصنفت بشکل خاطى الى المجموعة الثانیة فکانت 3 مشاهدات ولاتوجد مشاهدة صنفت الى المجموعة الثالثة بشکل خاطى ، ان نسبة التصنیف فی المجموعة الاولى بشکل صحیح هو 83.3% ، اما بالنسبة الى العمر من خلال العظم فکانت عدد المشاهدات التی تنتمی الى المجموعة الاولى وهی تنتمی الى المجموعة الاولى هی 18 مشاهدة ، اما عدد المشاهدات التی تنتمی الى المجموعة الاولى وصنفت بشکل خاطى الى المجموعة الثانیة فکانت 5 مشاهدات ولاتوجد مشاهدة صنفت الى المجموعة الثالثة بشکل خاطى ، ان نسبة التصنیف فی المجموعة الاولى بشکل صحیح هو 78.3% . اما بالنسبة الى العمر الحقیقی المجموعة الثانیة تم تصنیف 5 مشاهدات الى المجموع الاولى وهی تنتمی الى المجموعة الثانیة ، وتصنیف 17 مشاهدة بشکل صحیح الى المجموعة الثانیة وهی منتمیة الى المجموعة الثانیة ، ولا یوجد تصنیف الى المجموعة الثالثة وهی تنتمی الى المجموعة الثانیة ، ان نسبة التصنیف الصحیح للمجموعة الثانیة هی 77.3% ،اما بالنسبة الى العمر من خلال العظم ففی المجموعة الثانیة تم تصنیف 5 مشاهدات الى المجموع الاولى وهی تنتمی الى المجموعة الثانیة ، وتصنیف 1 مشاهدة بشکل صحیح الى المجموعة الثانیة وهی منتمیة الى المجموعة الثانیة ، تم تصنیف 2 مشاهدة الى المجموعة الثالثة وهی تنتمی الى المجموعة الثانیة ، ان نسبة التصنیف الصحیح للمجموعة الثانیة هی 12.5%، اما بالنسبة الى العمر الحقیقی المجموعة الثالثة لم تصف ای مشاهدة الى المجموعة الاولى ، تم تصنیف 3 مشاهدات الى المجموعة الثانیة وهی تنتمی الى المجموعة الثالثة ، وتصنیف 4 مشاهدات الى المجموعة الثالثة وهی تنتمی الى المجموعة الثالثة ، ان نسبة التصنیف الصحیح للمجموعة الثالثة هو 57.1% وهی اقل نسبة تصنیف صحیح فی عینة التدریب بالنسبة الى العمر الحقیقی ،اما بالنسبة الى العمرمن خلال العظم ففی المجموعة الثالثة تم تصنیف 3 مشاهدات الى المجموعة الاولى وهی تنتمی الى المجموعة الثالثة ، لم یتم تصنیف ای مشاهدة الى المجموعة الثانیة بشکل خاطى ، وتصنیف 1 مشاهدة الى المجموعة الثالثة وهی تنتمی الى المجموعة الثالثة ، ان نسبة التصنیف الصحیح للمجموعة الثالثة هو 25.0% . من حالتین التدریب والعرض تبین ان نسبة التصنیف الصحیح فی عینة التدریب افضل بکثیر من مجموعة العرض وکما هو مبین فی جدول التصنیف للتدریب والعرض من خلال ما ذکر فی الجدولین ان تصنیف البیانات من خلال العمر الحقیقی افضل من تصنیف البیانات من خلال عمر العظم للمریض وحسب الفروقات الواضحة فی الجدول رقم (7) . 10- ملخص الاخطاء:
الجدول رقم (8) والذی یمثل نسبة الخطاء للعمر الحقیقی للمریض ، ان نسبة الخطاء فی عینة التدریب هی 10% اما بالنسبة الى عینة العرض فان النسبة کبیرة جدا تصل الى 23% وهی نسبة کبیرة مقارنة بعینة التدریب . من الجدول رقم (8) والذی یمثل نسبة الخطاء للعمر من العظم للمریض ، ان نسبة الخطاء فی عینة التدریب هی 39.10% اما بالنسبة الى عینة العرض فان النسبة کبیرة جدا تصل الى 42.90% وهی نسبة کبیرة مقارنة بالتدریب . 11- النتائج التوصیات : فی البدایة سیتم مقارنة النتائج بین عینتین العمر الحقیقی والعمر من خلال العظم وعلى مرحلتین عینة التدریب وعینة العرض النحو التالی: عینة التدریب : ان ما ذکر بالمقارنة بین العمر الحقیقی والعمر من خلال العظم یمکن القول بان ان الدقة فی المجموعة الاولى کانت التصنیف فی العمر من خلال العظم 91.5 % افضل من العمر الحقیقی 89.5% لکون المرض فی بدایتة ، کما ان المرض لم یوثر العمر من خلال العظم. اما فی المرحلة الثانیة التی بدا المرض بالتاثیر على المریض نلاحظ ان التصنیف من خلال العمر الحقیقی 92.5%هو افضل بکثیر من العمر من خلال العظم 32.1% وذلک بسبب تاثیر المرض على المصابین . کذلک یمکن ملاحظة الفرق الکبیر فی التصنیف من خلال المجموعة الثالثة ایضا حیث ان التصنیف الصحیح للعمر الحقیقی هو 75% مقارنة مع العمر من خلال العظم 21.1% . عینة العرض : ان ما ذکر بالمقارنة بین العمر الحقیقی والعمر من خلال العظم یمکن القول بان ان الدقة فی المجموعة الاولى کانت التصنیف فی العمر الحقیقی 83.3 % افضل من العمر من خلال العظم 87.3% . اما فی المرحلة الثانیة التی بدا المرض بالتاثیر على المریض نلاحظ ان التصنیف من خلال العمر الحقیقی 77.3%هو افضل بکثیر من العمر من خلال العظم 12.5% وذلک بسبب تاثیر المرض على المصابین . کذلک یمکن ملاحظة الفرق الکبیر فی التصنیف من خلال المجموعة الثالثة ایضا حیث ان التصنیف الصحیح للعمر الحقیقی هو 57.1% مقارنة مع العمر من خلال العظم 25% . ان دقة التصنیف فی عینتین التدریب والعرض للعمر الحقیق افضل بکثیر من العمر من خلال العظم . اما بالنسبة الى اجمالی الاخطاء فی عینتی التدریب والعرض فکانت عینة التدریب افضل بشکل واضح مقارنتة بعینة العرض وان نسبة الخطاء اقل بشکل اوضح فی عینتی التدریب والعرض للعمر الحقیقی مقارنة بالعمر من خلال العظم . | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
References | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1- Dabdoub, Marwan Abdel-Aziz and Al-Nuaimi, Aswan Muhammad Tayeb (2006), “Suggested Methods for Character Decline”, Iraqi Journal of Statistical Sciences, University of Mosul, Iraq, 85-106Al-Rawi.O.F ,(2007), The Discrimination between Digital Photos by Using Canonical Discriminate Function, TANMIAT AL-RAFIDAIN, 29(88),221-233.
2- Al-Rawi.O.F, (2007). The use of quality control and the discriminatory function in applied studies .Journal of education and Science ,19(17),203-220.
3- Anbeek, Petronella, Koen L. Vincken, and Max A. Viergever. (2008). "Automated MS-lesion segmentation by k-nearest neighbor classification." MIDAS Journal
4- Cai, Yun-lei, Duo Ji, and Dongfeng Cai. (2010) "A KNN Research Paper Classification Method Based on Shared Nearest Neighbor." NTCIR..
5- Chiang, Tsung-Hsien, Hung-Yi Lo, and Shou-De Lin. (2012) "A ranking-based KNN approach for multi-label classification." Asian Conference on Machine Learning...
6- Chang, Eric I., and Richard P. Lippmann. (1991) "Using genetic algorithms to improve pattern classification performance." Advances in neural information processing systems..
7- IBM Corporation. (2011). IBM SPSS Modeler 14 . 2 User ’s Guide.
8- Guru, D. S., Y. H. Sharath, and S. Manjunath. (2010)"Texture features and KNN in classification of flower images." IJCA, Special Issue on RTIPPR (1) : 21-29.
9- IBM. (2015). IBM SPSS Modeler 17 Algorithms Guide. IBM SPSS Modeler 17 Algorithms Guide, 73–86.
10- International Business Machines Corporation. (2017). IBM SPSS Modeler 18.1.1 Algorithms Guide. 806.
11- Imandoust, Sadegh Bafandeh, and Mohammad Bolandraftar. (2013)"Application of k-nearest neighbor (knn) approach for predicting economic events: Theoretical background." International Journal of Engineering Research and Applications 3.5: 605-610.
12- Khamar, Khushbu. (2013)"Short text classification using kNN based on distance function." International Journal of advanced research in computer and communication engineering 2.4: 1916-1919
13- Kim¹, J. I. N. H. O., Kim, B. S., & Savarese, S. (2012). Comparing image classification methods: K-nearest-neighbor and support-vector-machines. In Proceedings of the 6th WSEAS international conference on Computer Engineering and Applications, and Proceedings of the 2012 American conference on Applied Mathematics (Vol. 1001, pp. 48109-2122).
14- Imran, A., Wani, G., & Singh, K. (2018). Assessment of thyroid profile in children with thalassemia and its correlation with serum ferritin level. Assessment, 4(10).
15- McCormick, Keith, and Jesus Salcedo. (2017) IBM SPSS Modeler essentials: Effective techniques for building powerful data mining and predictive analytics solutions. Packt Publishing Ltd,.
16- Pochiraju, Bhimasankaram, and Sridhar Seshadri, eds. (2018) Essentials of Business Analytics: An Introduction to the Methodology and Its Applications. Vol. 264. Springer,.
17- Reddy, M. Venkataswamy. (2019)Statistical methods in psychiatry research and SPSS. CRC Press.
18- Tomašev, Nenad, et al. (2011)"A probabilistic approach to nearest-neighbor classification: Naive hubness bayesian knn." Proc. 20th ACM Int. Conf. on Information and Knowledge Management (CIKM).
19- Weinberger, Kilian Q., John Blitzer, and Lawrence K. Saul. (2006)"Distance metric learning for large margin nearest neighbor classification." Advances in neural information processing systems.
20- Wendler, Tilo, and Sören Gröttrup. (2016)Data mining with SPSS modeler: theory, exercises and solutions. Springer.
21- Yong, Zhou, Li Youwen, and Xia Shixiong. (2009)"An improved KNN text classification algorithm based on clustering." Journal of computers 4.3: 230-237. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Statistics Article View: 329 PDF Download: 306 |