Comparison of Two Methods for Estimating Parameters of the Model Binary Logistic Regression. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
IRAQI JOURNAL OF STATISTICAL SCIENCES | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Article 4, Volume 18, Issue 2, December 2021, Pages 41-50 PDF (1.87 M) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Document Type: Research Paper | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DOI: 10.33899/iqjoss.2021.169971 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Authors | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Farah Haitham Fathi* 1; Safaa Younis Alsaffawi2 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1Quality assurance, College of Medicine University of Mosul, Mosul, Iraq | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2Professor/ Department of Statistics and Informatics/ College of Computer Science and Mathematics - University of Mosul/ Iraq | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Abstract | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
This paper we deal with one of the most important nonlinear regression models widely used in modeling statistical applications, which is the binary logistic regression model, and then estimating the parameters of this model using statistical estimation methods. However, while using this model we face a problem in estimating its parameters as the number of parameters is (p+1), and finding the estimation of parameters using numerical methods sometimes does not provide the best solution because it depends on primitive estimations. In this paper, some ordinary estimation methods are employed to fit the estimation of the parameters of this type of non-linear regression model, and then we compare these estimation methods. Further, the comparison includes some of the important estimation methods, which are the ordinary estimation methods that included the Weighted Least Squares Method (WLS), and the Bayes Method (BM). In order to choose the best method for estimating, by taking a number of models and different sample sizes and using the statistical standard mean error squares (MSE) for the logistic model estimations for the purpose of comparison. Among the preferred methods for estimating model parameters, and it was generally concluded that the WLS method provides the MSE of estimators compared to the other methods. On the practical side, this model was also used to model data for people with diabetes and to estimate parameters using the best methods, and it was reached by comparing patients with diabetes. A census of diabetes with those who did not have diabetes with the appropriateness of the model in modeling this type of data and extracting the main cause of diabetes incidence, which is insulin, as well as the accuracy of the methods in estimating the model parameters. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Highlights | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1- The use of variables other than those mentioned in the research, such as the C-peptide variable, the hormone resistin, or the leptin hormone, and other factors that affect diabetes. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Keywords | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
binary logistic regression model; estimation parameters; Weighted least squares method | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Full Text | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1- مقدمة Introduction یعد انموذج الانحدار اللوجستی الثنائی احد النماذج اللاخطیة التی یمکنها وصف العلاقة بین متغیر تابع ثنائی القیمة ای بمعنى یاخذ قیمتان هما الصفر لاحتمال عدم حدوث حدث معین والواحد الصحیح لاحتمال حدوث ذلک الحدث اما المتغیرات المستقلة فانها تاخذ قیم وصفیة او کمیة، وعلیه تستعمل ستراتیجیة تحویل الاستجابات الى فئتی او فئات المتغیر التابع من نوع لوجت ووقتها فقط سوف تتحول العلاقات غیر الخطیة الى علاقات خطیة بین متغیر الاستجابة التابع والمتغیرات التوضیحیة (المستقلة)، حیث تم الاعتماد على بعض طرائق التقدیر ومنها طریقة تقدیر المربعات الصغرى الموزونة (WLSE) وطریقة تقدیر بیز (BE) من اهم الطرائق التی تطبق فی تقدیر معلماتها من اجل الحصول على قیم المعلمة المثلى اذ یتم الحصول على معادلات الامکان من الدرجة الاولى لمعلمات دالة الامکان من الانموذج اللوجستی الثنائی مما یزید من احتمالیة مشاهدة الفرد وتکون بذلک غیر خطیة وبالتالی لایمکننا الحصول على تحلیل للقیم المثلى للمعلماتHosmer, & Sturdivant, 2013) )Groenwald & Mokgatlhe, 2005)). الهدف من البحث هو تقدیر معلمات انموذج الانحدار اللوجستی الثنائی باستخدام طرق التقدیر الکلاسیکیة (الاعتیادیة) (BE،WLSE)، مع المقارنة بین هذه الطرق باستعمال المعیار الاحصائی متوسط مربعات الخطأ (MSE)، للوصول الى افضل طریقة، ومن اجل بناء أنموذج الانحدار اللوجستی بالجانب التطبیقی. 2- انموذج الانحدار اللوجستی الثنائی (Binary logistic regression model) یعد هذا النموذج من نماذج الانحدار اللاخطی وأن متغیر الاستجابة (Y) یتبع توزیع برنولی (Bernoulli distribution) والذی یأخذ القیم (0) و (1)، ( Hosmer & Sturdivant , 2013) ای أن متغیر الاستجابة الفئوی (Y) له حالتین تتمثل الاولى (Y=1) عند وقوع حدث معین والثانیة (Y=0) عند عدم وقوع ذلک الحدث (النجاح) هو ( π (Xi) ) بالاعتماد على قیم المتغیرات التوضیحیة للمشاهدات واحتمال عدم وقوع الحدث (الفشل) هو ( π (Xi) -1) وبذلک تکون دالة الکثافة الاحتمالیة بالصیغة الاتیة Rodriguez,2007)):- 𝑃(𝑌𝑖/𝑋𝑖 ) = ... (1) 𝑌𝑖 = 0,1 𝑃(𝑌 = 0 /𝑋𝑖) = 1 − 𝜋(𝑋𝑖) ... (2) 𝑃(𝑌 = 1 /𝑋𝑖) = 𝜋(𝑋𝑖) اذ أن: 𝜋(𝑋𝑖) تمثل التوقع الشرطی E(Y/X) (Conditional mean) لمتغیر الاستجابة (Y) عند قیمة معینة ل (X) وتکون بحالتین: 𝜋(𝑋𝑖) احتمال حدوث الاستجابة او احتمالة النجاح (success) (failure) احتمال عدم حدوث الاستجابة او احتمال الفشل 1 − 𝜋(𝑋𝑖) ویکون توقع متغیر الاستجابة یمثل احتمال النجاح E(𝑌𝑖) = 𝜋(𝑋𝑖( والتباین لمتغیر الاستجابة یمثلنا احتمال حاصل ضرب النجاح مع احتمال الفشل Var(𝑌𝑖) = 𝜋(𝑋𝑖)(1 − 𝜋(𝑋𝑖)) وللتعبیر عن انموذج الانحدار اللوجستی فی حال احتوائه على متغیر توضیحی واحد(X) بالصیغة الریاضیة التالیة (عبد الرزاق واخرون, 2016(: - … (3) ... (4) … (5) ... (6) : معلمتا انموذج الانحدار اللوجستی. 𝛽 و ₁𝛽اذ ان ₀ -4طرائق تقدیر معلمات الانموذج اللوجستی الثنائی (Methods of Estimating Parameters of The Binary Logistic Model) سیتم التطرق الى طریقتین فی هذا البحث: 1-طریقة المربعات الصغرى الموزونة Weighted Least Squares Method (WLSM) 2-طریقة بیز Bayes Method (BM) 4-1 طریقة المربعات الصغرى الموزونة ( Weighted Least Squares Method(WLSM انموذج الانحدار اللوجستی الثنائی هو حالة خاصة من النماذج الخطیة العامه والتی ممکن ان تعتبر امتدادا للانموذج الخطی البسیط Muller, 2004)) .حیث یمکن کتابة انموذج الانحدار الخطی العام بالشکل التالی Mccullagh & Nelder, 1983)) :-
…(7) قدرت معلمات انموذج الانحدار اللوجستی الثنائی باستخدام طریقة المربعات الصغرى الموزونة WLS) ( للحصول على افضل تقدیر. 𝑊𝑖= 𝜋𝑖 (1 − 𝜋𝑖) … (8) حیث ان: 𝑊𝑖 : مصفوفة التباینات التی تمثل الاوزان المختارة للمستوى 𝑖 تقدر المعلمات (𝛽°,𝛽1, … , 𝛽𝑝) حسب WLS) ( بایجاد القیم التی تجعل الفرق بین استجابة المشاهدة والاستجابة المقدرة اقل مایمکن بمعنى تصغیر مجموع مربعات الخطأ ((𝑆𝑆𝐸 Hosmer, & Sturdivant , 2013)) :- ….(9)
وبهذا نکون قد وصلنا الى قیمة ̂𝛽 المقدرة وکما یلی Strutz, T. 2016)) :- …(10) 4-2 طریقة بیز (Bayes Method (BM ان اسلوب طریقة بیز تتکون من ثلاث اقسام هی التوزیع السابق والتوزیع اللاحق ودالة الامکان الاعظم ووفقا لهذا الاسلوب یمکن کتابة دالة التوزیع اللاحق لمعلمات الانموذجی اللوجستی وفق الصیغ التالیة(Hoff,2009): …..(11) .....(12) فإن: : تمثل دالة التوزیع اللاحق للمعلمات المراد تقدیرها. : تمثل دالة الامکان الاعظم کما قد ذکرناها سابقا. : تمثل دالة التوزیع السابق للمعلمات. وتطبق معاینة جبس من خلال التوزیع الشرطی لـــ ( ) وبالتکرار یمکن تولید بیانات عشوائیة من التوزیع المنتظم حسب الصیغة الریلضیة التالیة Groenwald & Mokgatlhe2005)): ….(13)
اذ ان
ونحصل على قیم) ( التقدیریة بأخذ متوسط العینة المسحوبة (المتولدة) من التوزیع اللاحق وحسب الصیغة الریاضیة التالیة Chatterjee,2012)) :
…(14)
-5 معیار المقارنة بین طرائق التقدیر المستخدمة (Comparison Criterion Between Used Estimation Methods) لقد تم الاعتماد على مقیاس متوسط مربعات الخطأ (𝑀𝑒𝑎𝑛 𝑆𝑞𝑢𝑎𝑟𝑒 𝐸𝑟𝑟𝑜𝑟 (𝑀𝑆𝐸 لکافة محاولات (تکرارات) الظاهرة قید الدراسة مقسما على عدد المحاولات کمقیاس للمقارنة بین طرائق التقدیر المستخدمة والتی تشیر الى مدى دقة التقدیر وان قیمته تتناقص وتشیر الى دقه وجودة المقدرات والهدف المراد تحقیقه هنا هو للحصول على المقدر فی الصیغة (10-2) ویکون حسابة بالشکل التالی Kubsch ,2021)):- …(15) حیث أن: : تمثل القیمة التقدیریة للمشاهدات 𝑛 ,: تمثل حجم العینة 𝑝 ,: تمثل عدد المعلمات . -6وصف البیاناتالتطبیقة اعتمدت الدراسة على البیانات الطبیة لمحافظة دهوک لسنة 2020 م الصادرة من مرکز امراض السکر فی مستشفى ازادی وتم استخدام خمس متغیرات منها متغیر واحد تابع (متغیر الاستجابة y) والذی یأخذ قیمتین هما الصفر للمصاب بمرض السکری (ای لدیة استعداد للاصابة بالمرض) والواحد الصحیح للسلیم (ای لیس لدیة مرض السکری) وستة متغیرات توضیحیة، وقد تم تعریف کل متغیر فی الجدول (1) والجدول (2) فی الملحق کما واخذت المتغیرات التالیة: 1-6متغیر الاستجابة (Response Variable) : 𝑌𝑖: المصابین بأمراض السکری،0,1 = 𝑖 ، 𝑌 = 0: لدیة استعداد للاصابة ، 1 =𝑌: لیس لدیة استعداد للاصابة. 2-6 المتغیرات التوضیحیة (variable explanatory): 𝑋1 : (الجنس) : متغیر وصفی یمثل جنس المریض. 𝑋2: (العمر): متغیر کمی یمثل عمر المریض ویقاس بوحدة (السنة). 𝑋3: (مؤشر کتلة الجسم): متغیر کمی یمثل کتلة الجسم حیث یتم قیاسة عن طریق المعادلة التالیة: الوزن (کغم) \ ⟮الطول (م) ⟯ 2 𝑋4: (الکلوکوز): متغیر کمی یمثل مستوى السکر بالدم حیث تتراوح النسب الطبیعیة من (72-99) ووحدة قیاسة mg/dl وتم قیاسه بعد صیام ثمان ساعات. 𝑋5: (الانسولین): متغیر کمی یمثل مستوى الانسولین فی الدم ووحدة قیاسة mu/ml 𝑋6: (مقاومة الانسولین): متغیر کمی یمثل مقاومة الجسم للانسولین ویقاس عن طریق المعادلة التالیة: (الکلوکوز* الانسولین )/ 405. حیث أن النسب الطبیعیة تتراوح من (0.5-1.4)، واذا زادت النسبة عن 1.9 فهذا یعنی ان الشخص لدیة استعداد للاصابة بالمرض. 7- تحلیل النتائج التطبیقیة Analysis of Applied)) سیتم عرض نتائج الجانب التطبیقی وتحلیلها لیتم قیاس مدى ملائمة البیانات الحقیقیة مع انموذج الانحدار اللوجستی الثنائی المقدر وذلک من خلال اجراء اختبارات خاصة بمقدرات الانموذج اللوجستی. فقد تم التوصل الى کافة النتائج التطبیقیة باستخدام برنامج (MATLAB) ، الجدول 1 یمثل نتائج تحلیل طرائق الانحدار اللوجستی الثنائی جدول (1) تقدیر معلمات انموذج الانحدار اللوجستی الثنائی بکلا الطریقتین
نلاحظ من الجدول (1) قیم مقدرات انموذج الانحدار اللوجستی الثنائی من خلال تحدید متجه مقدر المعلمات ویتم بتعویضها مع المتغیرات التوضیحیة لنحصل على مقدرات انموذج الانحدار اللوجستی الثنائی وبدورها تقلل مجموع مربعات الخطأ الى أصغر مایمکن حسب طرق التقدیر طریقة المربعات الصغرى الموزونة (WLS)، طریقة بیز (BM) والنتائج موضحة فی الجدول اعلاه. والجدول 2 یوضح نتائج معیار المقارنة الاحصائی MSE جدول (2) متوسط مربعات الخطأ (MSE)
نلاحظ من الجدول (2) ان طریقة WLS تعطی اقل نسبة خطا MSE . 8- معیار جدول التصنیف (Classification Table Criterion (CTC) ) یظهر جدول (3) التصنیف امکانیة ملائمة الانموذج وهذه المقارنة تتمثل بمقارنة النتائج المتوقعة من خلال الانموذج مع نتائج المشاهدة ومن خلال التصنیف للقیم المتوقعة على اساس القیم الاحتمالیة المعینة. جدول (3) تصنیف بیانات
تمثل قیمة d قیمة true positive : ای بمعنى انه تمت مشاهدة المریض مصاب (Positive) وان التنبؤ وفق الطریقة تعطی positive ایضا. ای من خلال البیانات نخبر المریض بانه مصاب وهو بالفعل مصاب. فهذه القیمة تعتبر صحیحة تمثل قیمةa قیمة true negative: ای بمعنى انه تمت مشاهدة المریض غیر مصاب negative وان التنبؤ وفق الطریقة تعطی negative ایضا. ای من خلال البیانات نخبر المریض بانه غیر مصاب وهو بالفعل غیر مصاب. فهی قیمة صحیحة. تمثل قیمة c قیمة false negative : ای بمعنى انه تمت مشاهدة المریض بانه مصاب positive والتنبؤ وفق الطریقة اعطى نتیجة negative . ای من خلال البیانات نخبر المریض بانه غیر مصاب ولکنه مصاب بالمرض. فهی نتیجة غیر صحیحة وقد تکون لها عواقب. تمثل قیمة b قیمة false positive: ای ان تخبر المریض بانه مصاب وهو غیر مصاب بالحقیقة. هذه النتیجة قد تکون مؤثرة ولکن لیست بخطورة القیمة c. ولمعرفة اداء الطرق نقوم بحساب القیم التالیة: 1- دقة النموذج Accuracy (AC) وهی تعرف بان تکون القیم المتوقعة صحیحة نسبة الى کافة التوقعات = = AC = 2- معدل الخطاء(ER) Error Rate وهی معدل القیم المتوقعة الخاطئة الى بقیة القیم = = ER = 3- حساسیة النموذج Sensitivity (SE) وهی توقع ان یکون التصنیف المتوقع موجبا نسبة للحالة التی تکون موجبا SE = 9- النتائج 9-1 نتائج طریقة (WLS) نلاحظ فی الجدول (4) ان انموذج الانحدار اللوجستی الثنائی قام بتصنیف المتغیرات المعنویة من خلال ایجاد قیم انموذج الانحدار اللوجستی الثنائی , حیث صنف الانموذج 13 من اصل 40 حالة تصنیفا صحیحا لتنبؤ وجود المرض عند وجود المرض بالفعل. و 27 حالة تم التنبؤ بها بعدم وجود المرض عند وجوده. ای بلغت نسبة التصنیف الصحیح بوجود المرض حولی 35% وهی نسبة منخفضة جدا. ومن جهة اخرى تنبؤات الطریقة ب 359 من 360 حالة صحیحة بعدم وجود المرض ای بنسبة 99%. و بما انه من الضروری ان نتنبا بوجود المرض عند وجوده بالفعل فان هذه الطریقة قد تکون غیر محبذة لکشف وجود المرض. فی الجدول (5) نلاحظ ان نسبة الدقة بحدوث المرض قلیلة ونسبة الصحیحة لتنبوء بوجود المرض ما قلیلة وهی حوالی 88%. نسبة حساسیة النموذج ونسبة التصنیف الصحیح مقبولة نوعا ما. جدول (4) تصنیف بیانات العینة باستخدام طریقة (WLS)
9-2 نتائج طریقة (BM) جدول (5) تصنیف بیانات العینة باستخدام طریقة (BM)
10-الترابط بین البیانات correlation وتحلیل الارتباط فی الجدول (5) الذی ولدناه من برنامج IBM spss ) (نلاحظ الترابط (Pearson Correlation)بین قیم x الستة مع بعضها و مع قیمة ال y. کما نلاحظ قیمة ال p-value المتمثلة بقیمة Sig (2-tailed) فی الجدول. نلاحظ فی الجدول ان قیمة p-value اکبر من 0.05 بین y والادخال x6 مما یخبرنا انه لا توجد علاقة بین ثبوت الاصابة بالمرض و قیمة مقاومة الجسم للانسولین. کما توضح قیمة Pearson correlation علاقة ضعیفة بین y و قیمة x6 . مما یعنی انه ممکن ان نتخلى عن x6 فی الحسابات فی الطرق الاربعة تحت الاختبار. 10-1 الفحوصات الجراحیة . من المرغوب جدا ان یتم الفحص بابسط الطرق لمعرفه حالة المریض. هنا بعض الادخالات التی اخذناه بالاختبار تحتاج الى تدخل جراحی نوعا ما کما یتطلب فحصه وجود اجهزه مختبریة قد تکون مکلفة. مثال على ذلک الادخال x4 وهو یمثل ( (الکلوکوز): متغیر کمی یمثل مستوى السکر بالدم). ولفحص هذا الکلوکوز نحتاج جهاز خاص فی المختبر یدعى spectrophotometer . صورة هذا الجهاز موجودة فی الملحق B. المتغیر x5 الذی یمثل مستوى الانسولین یمکن ان یاخذ فی البیت بواسطة جهاز محمول ورخیص یدعى Glucometer وهو موجود فی الصیدلیات ولا یحتاج الى جراحة فقط وخزة صغیرة ویعطی النتیجة. 10-2 النتائج بدون وجود x4 و x6 رغم ان x4 عامل مهم لکشف المرض کما موضح فی الجدول (6) من خلال عامل ترابط عالی. الا اننا ممکن ان نسغنی عنه لغرض تقلیل الکلفة . کما انه یمکن الاستغناء عن x6 لان عامل الارتباط قلیل مع ال y. لذلک سنقوم فحص الطرقتین بوجود اربع ادخالات فقط : x1,x2,x3, x5 والتی تمثل الجنس العمر الوزن والانسولین.
11- النتائج بوجود البیانات المنزلیة فقط جدول (7) تصنیف بیانات العینة باستخدام طریقة (WLS) بالطریقة غیر الجراحیة
نلاحظ فی الجدول (7) ان انموذج الانحدار اللوجستی الثنائی قام بتصنیف المتغیرات المعنویة من خلال ایجاد قیم انموذج الانحدار اللوجستی الثنائی صنف الانموذج باستخدام الادخالات الاجراحیة الاربعة : x1,x2,x3,x5. حیث نلاحظ عند مقارنته مع الجدول )3) ان الانحدار اللوجستی الثنائی اعطى نتائج جیده حیث زادت نسبة الخطاء من 7 الى 9 بالمئة فقط. جدول (8) تصنیف بیانات العینة باستخدام طریقة (BM)
فی الجدول (8) وضح انه لا یمکن استخدام طریقة BM بالطریقة غیر الجراحیة, ای عند استخدام BM یجب ان تتم النتائج فی المختبر. لان الخطاء زاد من 11 الى 77% وهذا یدل على فشل الطریقة. ملحق A عینة من البیانات المستخدمة : y=0 ای ان المریض مصاب
الملحق B
Spectrophotometer x4 Glucometer x5 12- الاستنتاجات 1- اثبتت طریقة المربعات الصغرى الموزونة (WLS) کفاءتها على کافة طرائق التقدیر الاعتیادیة إذ حققت المرتبة الاولى من الأفضلیة فی تقدیر المعلمات لانموذج الانحدار اللوجستی الثنائی ولحصوله على اقل قیمة ل MSE. 2- تناقص قیمة (MSE) لمقدرات الأنموذج اللوجستی باستخدام کافة طرائق التقدیر الاعتیادیة بازدیاد حجم العینة، وهذا مایطابق النظریة الاحصائیة. 3- نستنتج انه ممکن ان نتنبأ بوجود مرض السکری عند مریض بنسبة خطاء معقولة من خلال معرفة جنسه و عمره ووزنه ونسبة الانسولین غیرالجراحیة (کلها ممکن ان تقاس فی البیت) باستخدام طریقة WLE. طریقة BM لایکن استخدامها الى من خلال نتائج الکلوکوز التی یجب ان تتم فی المختبر. 4- عند وجود نتائج مختبریة من الافضل استخدام BM والا فیمکن استخدام طریقة WLE التوصیات 1- استعمال متغیرات اخرى غیر التی ذکرت فی البحث مثل متغیر ببتاید السی (C-peptide) أو هرمون الرزستین (Resistin) أو هرمون اللبتین (Leptin) وغیرها من العوامل التی تؤثر على مرض السکری. 2- اجراء الطرائق التی تم عرضها باتباع منهجیة الخوارزمیة الجینیة فی مجالات اخرى من غیر الطبیة مثلا تکون بیانات سلوکیة أو اجتماعیة. 3- استخدام طرق ال machine learning فی عملیات تنبؤ البینات. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
References | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1- Abdul-Razzaq, Muhammad Sadiq and Zaalan, Risan Abdul-Imam, (2016) “Using the logistic regression method to analyze the effect of psychological stress on the incidence of blood pressure”, (Basra, Gulf Economics Journal, pages 48-66
2- Talib, H. R., & Mazloum, S. A. (2020). The Use of Binary Logistic Regression Method to Analyze The Factors Affecting Heart Disease Deaths: An Applied Study on A Sample of Patients in Dhi Qar Governorate. Al-Rafidain University College For Sciences, (46).
3-Azen, R., & Walker, C. M. (2021). Categorical data analysis for the behavioral and social sciences. Routledge.
4-Akkus ,Ö. , Demir , E. , (2016), " Comparison Som Classical And Meta-Heuristic Optimazation Techniques in The Estimation Of The Logit Model Parameters", ,(2017) , "The Factors Affecting Eye Patients (Cataract) In Jordan by Using the Logistic Regression Model", MAS, pp. 38-42. 5- Strutz, T. (2016). Data fitting and uncertainty. A practical introduction to weighted least squares and beyond.
6-Chatterjee, S., Hadi, A., (2012) ,"Regression Analysis By Example", John Wiley ,INC.
7-Demir , E. , Akkus , Ö., (2015), " An Introductory Study on How the Genetic Algorithm Works in the Parameter Estimation of Binary Logit Model", IJS:BAR, pp.162-180.
8-Gelman, A. & et al., (2014)," Bayesian Data Analysis", Texts in Statistical Science , CRC , LC , Chapman and Hall Book.
9-Kubsch, M., Stamer, I., Steiner, M., Neumann, K., & Parchmann, I. (2021). Beyond p-values: Using Bayesian Data Analysis in Science Education Research. Practical Assessment, Research, and Evaluation, 26(1), 4.
10- Groenewald, P. C., & Mokgatlhe, L. (2005). Bayesian computation for logistic regression. Computational statistics & data analysis, 48(4), 857-868.
11- Acquah, H. D. G. (2013). Bayesian logistic regression modelling via Markov Chain Monte Carlo algorithm.
12- Hoff, P. D. (2009). A first course in Bayesian statistical methods (Vol. 580). New York: Springer.
13-Hosmer, D., Lemeshow, S. & Sturdivant , R. ,(2013)," Applied Logistic Regression", 3rd edition ,New York: willey,WSIPS, http : // ihmsi.org.
14- McCullagh, P., & Nelder, J. A. (2019). Generalized linear models. Routledge. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Statistics Article View: 375 PDF Download: 247 |