Some wavelet filters to estimate non-parametric GAM models with application and simulation. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
IRAQI JOURNAL OF STATISTICAL SCIENCES | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Article 2, Volume 17, Issue 2, December 2020, Pages 7-18 PDF (2.17 M) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Document Type: Research Paper | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DOI: 10.33899/iqjoss.2020.167385 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Authors | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Alaa Hamoodat* 1; Bashar AL-Talib2 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1Department of Statistics and Informatics, College of Computer and Mathematical Science, University of Mosul. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2Department of Statistics and Informatics, Faculty of Computer Sciences and Mathematics, University of Mosul, Mosul, Iraq | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Abstract | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
This study shed light on the method of estimating the GAM based on Smoothing splines repetitive graders . The Wavelet Shrinkage method was used as a paving of data when estimating the GAM by using some wavelets as filters in calculating the wavy intermittent transformation, including (Haar Wavelet, Daubecheis Wavelet, Coiflets Wavelet, wavelet Least Asymmetric) with one of the types of threshold cutting which is Soft Threshold Thresholding to obtain modified coefficients for intermittent wavelet transformation with explanatory and response variables and dependence on estimating the WGAM model with a comparison of the results of all methods with some comparative statistical criteria, And that is by employing the simulation method as well as through real data analysis, and for this purpose data was collected from Ibn Sina Teaching Hospital (Al-Wafa Specialist Center for Diabetes and Endocrinology Consultant Short Stature) for Nineveh Governorate - 2019, for cases of short stature, and a program was used R for the purpose of writing some code for the purpose of obtaining the desired results from this research. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Highlights | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1- The use of the regular GAM model represents a very flexible method for the problem of data, in addition to that it does not need a preliminary determination of the form of the relationship between the explanatory variables and the response variable, but it collapses when the data is contaminated.
2- When estimating the generalized additive model according to the proposed wavelet minimization method (WGAM) using real data, the wavelet minimization filters gave the best results compared to the usual GAM method, where the wavelet minimization smoothers helped smooth the data, by
By obtaining the lowest values of the efficiency criteria (i.e. higher efficiency), the Coiflets showed superiority over the rest of the other wavelets.
In the case of using the simulation method and when using the first and second models, and polluting the data with distributions (Exp. dist., Laplace dist., Dist. (t)) with percentages (5%, 15%, .35%) and sample sizes (50, 150, 300). It was also noted that the smoothing method using the DuPagez function (DWGAM) and the smoothing method using the Haar function (HWGAM) had the best performance compared to the rest of the methods for the simulation scenarios that were dealt with. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Keywords | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Generalized additive model estimation method; nonparametric; introductory; Use of wavelet reduction technique | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Full Text | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1.المقدمة Introduction یهدف البحث إلى توظیف تقنیة المویجة الصغیرة (Wavelet) لفلترة وتمهید البیانات بإستخدام بعض أنواع المویجات کمرشحات فی حساب التحویل المتقطع للمویجة وإستخدام البیانات الممهدة لتقدیر النموذج الجمعی المعمم (WGAM) والحکم على کفاءة النتائج بإستخدام بعض معاییر المقارنة الإحصائیة لتحدید أسلوب التقدیر الأفضل من بین نموذجی GAM وأسلوب WGAM المقترح بأسلوب المحاکاة ولبیانات الواقعیة. 2.النماذج الجمعیة المعممةGeneralized Additive Models (GAM) تعد النماذج الجمعیة المعممة (GAM) احد مداخل الانحدار اللامعلمی وهی نماذج اکثر تقییداً والفرض الوحید الذی تقوم علیه عملیة التقدیر هذه هو أن دوال التقدیر تکون جمعیة ومتغیراتها ممهدة، ویعتبر الانموذج الجمعی المعمم GAM اداة فعالة لتحلیل البیانات وتمتلک القدرة على التعامل مع العلاقات غیر الخطیة الشدیدة بین المتغیر المعتمد والمتغیرات المستقلة وهو اسلوب مقترح من قبل (Friedman & Jorome, 1999) و (Werner Stuetzle) عام 1981. وهذا النموذج یخلط بین خصائص النماذج الخطیة المعممة Generalized Linear Models (GLM) والنماذج الجمعیة Additive Models AM)) کما بین (Friedman & Jorome, 1999) وإن دراسة الانحدار اللامعلمی المتعدد بشکل عام ستفرز عنه مشکلة البعدیة (زیادة ابعاد النموذج) والتی یعانی منها الباحثین حیث تقیدهم نحو تعمیم حالة احادی المتغیرات الى حالة متعدد المتغیرات والتی ستتعامل مع الحالة الاعم للشرائح التمهیدیة وهی Thin Plate Spline (TPS). فعند ایجاد مقدار تقاربی لبعدین او اکثر یصعب عمل مصفوفة المتغیرات المقاسة بوحدات مختلفة وغیرها من المشاکل، لذلک ظهرت الحاجة لظهور النموذج الجمعی کحل عملی ، حیث یعمل بصفة تجمیعیة تساعد فی سهولة تفسیر الظواهر المختلفة، وبصورة عامة فإن النموذج الجمعی المعمم یعد إمتداداً شبه معلمیاً للنموذج الخطی المعمم. وعلیه فان النموذج الجمعی اللامعلمی Non-Parametric Additive Model یکون کالاتی (He, 2004) :-
: متجه دوال مقدرة من البیانات والتی تعبر عن المتغیر التوضیحی والتی یمکن تقدیرها عن طریق الشرائح التمهیدیة (Smoothing Spline) وهنالک عدة طرق للحصول على تقدیر للنموذج الجمعی المعمم GAM ومن أهمها خوارزمیة التوفیق التراجعی. 3.خوارزمیة التوفیق التراجعی Backfitting Algorithm ان اول من قدم هذه الطریقة هما الباحثان (Friedman & Stuetzle) عام 1981 ، حیث اعتمدت هذه الطریقة على الاسلوب التکراری ، وان النموذج الجمعی یفترض دالة التوقع الشرطی لمتغیر الاستجابة y والتی یمکن ان تکتب کمجموع الحدود الممهدة للمتغیرات ,… ، ولمطابقة المعادلة (1) سیکون التوقع الشرطی لکل K من الـ کالاتی (Friedman & Jorome, 1999) :
الخطوة الاولى لتقدیر هذه المعادلة هو البدء مع قیم اولیة کخطوة ابتدائیة (°) فی عملیة تقدیر تکراریة: , الخطوة الثانیة هو القیام بالدورة :
اذ ان : تمثل مصفوفة تحویل ممهدة .
یعاد إیجاد لکل من المتغیرات التوضیحیة. ویتم تکرار هذه العملیات لإیجاد التقدیرات الجدیدة للدوال بواسطة تمهید الاخطاء حتى تتقارب الدوال الجزئیة ، ویتم التوقف عندما تستقر الدوال الممهدة بدون تغییر . وحسب معیار التقارب (Buja et. al., 1989) :
وتعرف البواقی الجزئیة بأنها القیم المتطابقة لکل دالة مضافاً الیها البواقی الاجمالیة من النموذج التجمیعی بشرط أن: وان مصفوفة التمهید S لا تعتمد على قیم متغیر الاستجابة y بل تعتمد على قیم المتغیرات التوضیحیة وهذا یشابه الحالة المعلمیة حیث ان :
حیث یتم استبدال مصفوفة التمهید بمصفوفة تمهید اخرى حیث تقوم بعملیة التمهید اولاً ثم تقوم بحذف متوسط التمهید للحصول على تقدیرات یمکن التعرف علیها Identifiable للتقدیرات وهذا ما یسمى بالممهد الممرکز Smoother Centered بحیث أن:
حیث ان عبارة عن متجه کل عناصره واحد . ویتم الحصول على تقدیر للنموذج الجمعی المعمم GAM، والذی یوظف لتصغیر المقدار التالی:
ویلاحظ من المعادلة (3) بأنها تکون جزائیة بثابت منفصل لکل حد ، ویمکن کتابة المعادلة (3) بصیغة المصفوفات وکالاتی :
تمثل مصفوفة جزاء لکل . وبأخذ التفاضل للمعادلة (4) بالنسبة ومساواتها بالصفر نحصل على:
ویمثل المقدار البواقی الجزئیة من التمهید ، وان ، ومن ثم یتم تکرار او اعادة عملیة التمهید للبواقی الجزئیة . ویتم اختیار المعلمة التمهیدیة (Smoothing Parametric) ( ) بطریقة الاسلوب المجرد (الالی) Objective (Automatic) Method، اذ تترک البیانات لتحدد بذاتها قیمة المعلمة التمهیدیة (المثلى) عن طریق تصغیر معیار معین یعتمد بدوره على البواقی ، ومن اشهر المعاییر لاختیار المعلمة التمهیدیة هو ((GCV( Generalized Cross Validation) والذی تم إعتماده کمعیار رئیسی للمقارنة فی هذا البحث (Green and Siverman,1994). المویجة wavelet المویجة (Wavelet) او ما تسمى بالموجة الصغیرة (Small Wave) هی احد انواع الدوال الریاضیة تتیح إمکانیة تجزئة الدالة المعطاة الى مرکبات تردد مختلفة ودراسة کل مرکب مع اعادة التصمیم Resolution الملائم عند کل قیاس ، وتعرف المویجة ریاضیاً بانها دالة قیمة حقیقیة معرفة على محور حقیقی کامل وتتذبذب صعوداً ونزولاً بشکل منتظم حول الصفر. (Crowley et. al. ,2006) وسمیت بالمویجة لصغرها وتمیزها عن اشارة الموجة الکبیرة (Big wave) مثل موجة دالة الجیب (Sine) وموجة الجیب تمام (cosine) . وتتکون المویجات عادة من جزئیین رئیسین هما (Kumar & Lavanya, 2011) :- 1- دالة القیاس (Scaling Function) التی تعرف ایضا بدالة الاب (Father Function) وتعتبر الجزء التقریبی للبیانات ، ویتم الحصول علیها من خلال الصیغة الاتیة :-
حیث ان :- : تمثل معاملات مرشح التمریر الواطئ Low-Pass Filter . 2- دالة المویجة Wavelet Function والتی تعرف ایضاً بدالة الام Mother function والتی تمثل معادلة المویجة Wavelet Equation ، صیغتها کالاتی :-
حیث ان یمثل مرشح التمریر العالی High-Pass Filter . 4 . بعض دوال المویجة Some Wavelet Functions فیما یلی بعض الدوال المویجیة شائعة الاستخدام : اولاً - مویجة هار Haar wavelet درست المویجة Haar من قبل العالم الریاضی (Alfred Haar) فی الفترة (1909-1910)، وتعرف المویجة الام لــــــ هار (Haar Mother Wavelet) کالآتی:-
اما دالة القیاس للمویجة الاب لها (Haar Father Wavelet) فهی تعرف کالاتی :- (Green , 1994)
ثانیا -المویجة دوبشیز Daubechies wavelet سمیت هذه المویجة نسبة الى الباحثة Daubechies Ingrid ، وتکتب مویجات هذه العائلة اختصاراً (dbLi) او (DN) حیث ان N تمثل رتبة المرشح فی حین ان Li هو عدد العزوم المتلاشیة والذی یعنی تقارب Convergence مفکوک المویجة بحیث ان :
: تمثل معاملات مرشح التمریر الواطئ (Low-Pass Filter) . (Crowley et. al. ,2006) ثالثاً-المویجة(کویفلیتز) Coiflets Wavelet بناءاً على طلب قدمه الباحث Coifman فی 1989 اوجدت الباحثة Daubechies المویجة کویفلیتز ونسب الیه ، حیث قام الباحث بطرح فکرة الحصول على العزوم المتلاشیة او الزائلة لمرشحات التمریر الواطئ ومرشحات التمریر العالی معاً لکلتا الدالتین الام والاب . (Rajeev et. al., 2011) رابعاً المویجة ساملت The Lest Asymmetric Daubechies Symmetric Wavelet (Symmlets) المویجة ساملت هی مویجة متعامدة قریبة من التماثل اقترحتها الباحثة Daubechies حیث اجرت تعدیلات على عائلة (db) بزیادة التماثل مع بقاء بساطة المویجة وهی متماثلة ولها نفس خصائص (دویجیز) (Zhang et. al. , 2016) 5.قطع العتبة الناعمة Soft Thresholding ان الخطوة الثانیة من خطوات تقدیر دالة المویجة هی ازالة التشویش الموجودة فی الاشارة عن طریق حد العتبة ، وباستخدام التحویل المویجی یتم وضع عتبة ترددیة بحیث تلغی هذه العتبة معاملات التشویش وتحافظ على معاملات الاشارة الاصلیة K واحد انواع قطع العتبة هو قطع العتبة الناعمة ویستخدم لإزالة التشویش فی الاشارة والتی قدمها کل من الباحثین (Donoho & Johnstone) ، حیث ان قطع العتبة الناعمة تدفع کل المعاملات باتجاه الصفر أی یتم فیها انهاء القیم ما دون العتبة الى الصفر والمحافظة على القیم الاعلى من العتبة ، وتعرف قطع العتبة الناعمة بالشکل الاتی (Rajeev et. al., 2011) :
6.معاییر المقارنةComparison Criteria’s هنالک العدید من المعاییر تقیس مقدار الجودة فی تقدیر دوال الانحدار اللامعلمیه، ومنها: 1- معیار العبور الشرعی المعمم (GCV)Generalized Cross Validation وضع معیار Generalized Cross Validation (GCV) من قبل الباحث Wahba Graven عام 1979 ، و یستخدم معیار العبور الشرعی GCV فی اتجاهین الاول ضمن سیاق اختیار انسب معلمة تمهید لمقدر الشریحة الممهدة ، اما الاتجاه الثانی فإستخدامه للمقارنة بین طرائق تقدیرات الانحدار اللامعلمی، وتأخذ صیغته الریاضیة الشکل التالی (Roppert , 2003):
2- معیار (AIC)Akaike Information Criterion وضع من قبل Akaike عام 1973 ، والصیغة العامة لمعیار (AIC)تکون کما یلی:
: درجة حریة التمهید ویعبر عنها بأثر مصفوفة التمهید ، . (Ulrich,2001) 3- معیار (BIC)Bayesian Information Criterion الصیغة العامة لمعیار (BIC) تکون کالاتی :- (Li & Ruppert, 2008)
4- معیار الإعتمادیة غیر الخطیةConcurvity وهو معیار یبین تعمیم لمشکلة تعدد العلاقة الخطیة (التی من الممکن أن تحدث فی النموذج الخطی العام GLM) بین المتغیرات المستقلة ولکن هذه المرة فی النموذج الجمعی العام والذی قد یؤدی بالنتیجة إلى الحصول على مقدرات غیر مستقرة وهذا المعیار یعبر عن الإعتمادیة غیر الخطیة، وکما أن تعدد العلاقة الخطیة ینتج عنها تضخم فی التباین فإن مشکلة الإعتمادیة غیر الخطیة (Concurvity) ینتج عنها معاملات مقدرة غیر مستقرة (Amodio et. al., 2015). ویمکن التعبیر ریاضیاً عن هذه المشکلة کما هو موضح فی الصیغة الاتیة : (He , 2004)
7.تجارب المحاکاة Simulation trials دوال التولید المستخدمة Used Generation Functions تتنوع الدوال بتنوع الظاهر التی تمثلها ، حیث تتمیز هذه الدوال کونها صممت لتعرض مجموعة من الظواهر غالباً ما تحدث فی واقع الحیاة، وقد تم توظیف دالتین معتمدتین فی أغلب البحوث العالمیة وهما:-
1- دالیة خطیة من الدرجات العلیا :(Augustin et. al., 2012) 0.2*x^1 0*(10*x)^3*(1-x)^10 2- دالةDoppler (Donoho & Johnstone, 1994)
خوارزمیة تجارب المحاکاة Simulation Trials Algorithm تم تطبیق العدید من السیناریوهات لتجارب المحاکاة ، اذ تم تلویث المتغیرات التوضیحیة تارة وتلویث y تارة اخرة بمختلف التوزیعات وبمعلمات مختلفة ، ولأحجام عینة مختلفة (50 , 150 , 300 ) ولنموذج بأربعة متغیرات وبنسب تلویث (5% , 15%, ,35%) وذلک لتولید البیانات الخاصة بالمتغیرات العشوائیة ، ثم تکرار کل تجربة (Replicates=100) مرة لغرض الحصول على نتائج متسقة ، ولإعطاء صورة شاملة عن کفاءة الطرق تم اختیار معلمات مختلفة للتوزیعات الاحتمالیة وکما یلی : 1- تولید اربع متغیرات توضیحیة تتوزع توزیع منتظم قیاسی مستقل . 2- تولید الاخطاء العشوائیة من توزیع طبیعی بوسط حسابی یساوی صفر وتباین معین . 3- تولید المتغیر العشوائی y مباشرة من خلال النموذج المستخدم فی تجارب المحاکاة ، وذلک باستخدام دوال الانحدار بدلالة المتغیرات التوضیحیة التی تم تولیدها اعلاه ، مضافاً الیهما الخطأ العشوائی . 4- تقدیر النموذج الجمعی المعمم GAM الاعتیادی ، ومن ثم تمهید البیانات بدوال المویجة (Db, Haar, Least A. , Coiflets) ومن ثم تقدیر النموذج الجمعی المعمم (WGAM) وذلک للحصول على المقدرات الممهدة (DWGAM, HWGAM, LAWGAM, CWGAM). 5- المقارنة بین GAM و WGAM للمقدرات الممهدة الأربعة فی النقطة (4) وذلک من خلال معاییر المقارنة (GCV ,Con. , BIC , AIC) . نتائج تجارب المحاکاة Simulation Results تم وضع اربع نماذج من الجداول وهی (4, 5 , 6 , 7 , 8) وذلک لمحدودیة المساحة فی البحث أما بقیة الجداول فهی متوفرة لدى الباحثین ولنسب تلویث واحجام عینات وتوزیعات احتمالیة مختلفة، وعلیه وللاختصار تم انتخاب اربعة جداول بشکل عشوائی لعرضها ومقارنة أداء أسالیب التقدیر وستتم المناقشة داخل الجداول. جدول (1) : المقارنة مع اسلوب GAM الاعتیادی للنموذج الاول وعند تلویث y بتوزیع t وبنسب التلویث واحجام عینات مختلفة
جدول (2) : یمثل تقدیر GAM وتقدیر WGAM للنموذج الاول وعند حالة تلویث X بتوزیع Laplace وبنسب التلویث واحجام عینات مختلفة
جدول (3) : یمثل تقدیر GAM وتقدیر WGAM للنموذج الثانی وعند حالة تلویث y بتوزیع Exp.وبنسب تلویث واحجام عینات مختلفة
جدول (4) : یمثل تقدیر GAM وتقدیر WGAM للنموذج الثانی وعند حالة تلویث X بتوزیع t(7)وبنسب التلویث واحجام عینات مختلفة
جدول (5) : خلاصة نتائج المحاکاة للمقارنة بین طرق التقدیر
وکحصیلة نهائیة لتجارب المحاکاة ومن خلال الجدول (5) أعلاه نلاحظ بأن ال 36 تجربة محاکاة لتوزیعات t والتوزیع الأسی Exp. وتوزیع لابلاس ولنسب التلویث المختلفة فإن أسلوب التمهید بدالة دوبیجیز (DWGAM) وأسلوب التمهید بدالة هار (HWGAM) کان لهما الأداء الأفضل مقارنة ببقیة الطرق لسیناریوهات المحاکاة التی تم تناولها. الجانب التطبیقی تناول الجانب التطبیقی مقارنة الطریقة المقترحة التی تقوم على توظیف ممهدات تقنیة المویجة الصغیرة المستندة على الشرائح التمهیدیة فی تقدیر وذلک للحصول على نموذج جمعی معمم مستند إلى تقنیة التقلیص المویجی والذی أشیر له فی هذا البحث إختصاراً (WGAM) ومقارنتها مع النموذج الجمعی المعمم الاعتیادی GAM بتطبیقهما على البیانات الأصلیة والمرشحة والمؤلفة من تسعة من المتغیرات التوضیحیة ومتغیر استجابة واحد، وقد تم الاعتماد على البرنامج R لتطبیق الطریقة المقترحة الواردة فی الجانب النظری. جمع البیانات طبقت هذه الدراسة على بیانات حقیقیة تم جمعها من مستشفى ابن سینا التعلیمی (مرکز الوفاء التخصصی لأمراض السکری والغدد الصم استشاریة قصار القامة) لمحافظة نینوى-2019 ، على حالات مصابة بقصر القامة ، وقد تم فی هذا البحث جمع بیانات لـ 150 من الاشخاص المصابین بهذا المرض وهی عینة بحجم مناسب جداً لنموذج بتسعة متغیرات فقط (تجمع أغلب البحوث أن حجم العینة الملائم لتقدیر نماذج الإنحدار هو أن یکون عشرة أضعاف عدد المتغیرات المستقلة على الأقل) حیث أن هذا العدد هو حوالی 17 ضعف عدد المتغیرات، وبعد مراجعة مجموعة من الاطباء الاختصاصیین تم اختیار تسعة متغیرات توضیحیة ومتغیر استجابة واحد (الطول) حیث بین الاطباء الاختصاصیون فی مستشفى أبن سینا التعلیمی والذین تمت استشارتهم أنها العوامل الرئیسیة التی تؤثر على الاصابة بهذا المرض وکما هی موضحة بالجدول رقم (6) :-
جدول رقم (6) : یوضح متغیرات الدراسة
اختبار التوزیع الطبیعی (Normality Test) تم اختبار التوزیع الطبیعی باستخدام إختبار کولموکوروف سمیرنوف وکذلک من رسم الاحتمال الطبیعی: 1- اختبار Kolmogorov-Smirnov ویعد من اهم اختبارات التوزیع الطبیعی ویسمى أحیاناً بإختبار حسن المطابقة، کما موضح بالجدول (7)، حیث أن فرضیتی الاختبار هی: H0: عدم وجود مشکلة للتوزیع الطبیعی (البیانات تتبع التوزیع الطبیعی) H1: وجود مشکلة للتوزیع الطبیعی (البیانات لا تتبع التوزیع الطبیعی) الجدول (7): جدول اختبار Kolmogorov-Smirnov
وبما ان قیمة p-value تساوی (1.091e-06) هی اقل من مستوى المعنویة 0.05 فان البیانات لا تتبع التوزیع الطبیعی . 2- رسم الاحتمال الطبیعی Q-Q plot لمتغیر الإستجابة وأحد المتغیرات المستقلة (البقیة کانوا على نفس الشاکلة)، ویوضح الشکل (1) یوضح ان البیانات لدینا لا تتوزع وفق التوزیع الطبیعی.
الشکل (1) : یوضح مخطط Q-Q plot لمتغیر الإستجابة y وأحد المتغیرات المستقلة تقدیر النموذج الجمعی المعمم المقترح (WGAM) Wavelet Generalized Additive Model تم تطبیق الخوارزمیة المقترحة لتقدیر النموذج الجمعی المعمم الممهد بالتقلیص المویجی (المویجة الصغیرة) WGAM وحسب الخطوات الاتیة: 1- البدء بإعطاء قیم اولیة للدالة 2- ایجاد المصفوفتین و کما فی المعادلتین (1) و (2) على التوالی لکل من المتغیرات التوضیحیة ، ومن ثم ایجاد مصفوفة الجزاء التربیعیة . 3- ایجاد المعلمة التمهیدیة 𝜆 بالاسلوب الالی بالاعتماد على المعیار الشرعی المعمم GCV والمشار الیه فی المعادلة (9) ، ومن ثم حساب مصفوفة التمهید S وکما تم توضیحه تحت المعادلة (2) . 4- تحدیث تقدیرات وذلک بإعادة او تکرار عملیة التمهید للبواقی الجزئیة . 5- تقدیر النموذج التجمیعی المعمم المقترح المستند إلى التقلیص المویجی WGAM باستخدام أربع انواع من دوال المویجة الاکثر شیوعاً (Daubechies,Haar, Least Asymmetric, Coiflets) وباستخدام قطع العتبة الناعم ومقارنتها مع GAM الاعتیادیة ، والنتائج موضحة فی الجدول (8) لأربعة مقدرات مقترحة (DWGAM, HWGAM, LAWGAM, CWGAM):- جدول رقم (8) : یوضح نتائج تقدیر GAM الاعتیادی و WGAM
من ملاحظة الجدول (8) وباستخدام البیانات الحقیقیة نجد ان هناک انخفاضاً فی قیم معاییر الکفاءة (BIC, AIC, Con., GCV,) عند تقدیر الـنموذج الجمعی المعمم وفق تقنیة التقلیص المویجی المقترحة WGAM مقارنة بالنموذج الجمعی المعمم الاعتیادی GAM. کما اظهر المرشح Coiflets (CWGAM) تفوقاً واضحاً على باقی المرشحات وذلک من خلال انخفاض قیم المعاییر (GCV , Con. , AIC, BIC) مقارنة بباقی المقدرات الممهدة، وعلیه وبالمجمل فإن المقدرات المقترحة تمتلک کفاءة عالیة مقارنة بمقدر GAM (کفاءتها حوالی ضعف کفاءة GAM) وخاصة مقدر CWGAM والذی سجل أصغر قیمة مقارنة بالقیم المقترحة الثلاثة الأخرى فضلاً عن المقدر GAM قیمة منخفضة لمؤشر الإعتماد غیر الخطی (Concurvity) للسب المذکور آنفاً. والشکل (2) یوضح رسم النموذج الجمعی المعمم GAM الاعتیادی ونماذج WGAM المقترحة.
شکل (2): یوضح رسم الـ GAM الاعتیادی و WGAM ویلاحظ من الشکل (2) الذی یسمى رسم دالة الصفیحة Spline Function Plot المحور X یحوی على قیم المتغیرات التوضیحیة، بینما یحتوی المحور y على قیم متغیر الاستجابة ، ویشیر الرقم فی المحور y الى الدرجات الحریة الفعالة للمتغیرات التوضیحیة ، وان الشکل K یمثل رسم النموذج GAM الاعتیادی ، اما باقی الاشکال فتشیر الى رسم النموذج GAM بدوال التقلیص المویجی الأربعة. ویرجع السبب فی الاشکال المتعرجة (المکسورة) للمتغیرات التوضیحیة الى الخطوط التمهیدیة التی تصوغ النماذج اللاخطیة فی البیانات ، ای رسم کل دالة انحدار جزئی بشکل منفصل وهذه احد مزایا نموذج الانحدار الجمعی ، حیث یقلل من مشکلة الانحدارات متعددة الابعاد ، وتوفر هذه الخطوط نقطة سماح بنسبة 95% حول النموذج الموفق ومن ملاحظتنا للرسم نجد أن طریقة CWGAM کانت الأکثر تمهیداًحیث نلاحظ ان الحدود فی دوال المویجة اقتربت من الصفر ونلاحظ ان رسم k ابتدا تقریبا من _0.5 اما رسم دوال المویجة فقد اقترب من الصفر ابتدا من -0.2 و 0.1 تقریبًا. الاستنتاجات : یمکن ادراج الاستنتاجات الخاصة بالبحث على ضوء نتائج التحلیل : 1- ان استخدام نموذج GAM الاعتیادی یمثل طریقة مرنة للغایة لمشکلة البیانات ، بالإضافة الى انها لا تحتاج الى تحدید اولی لشکل العلاقة بین المتغیرات التوضیحیة ومتغیر الاستجابة ولکنها تنهار عندما تکون البیانات ملوثة. 2-عند تقدیر النموذج الجمعی المعمم وفق اسلوب تقلیص المویجة المقترحة (WGAM) باستخدام البیانات الحقیقیة فقد اعطت مرشحات تقلیص المویجة افضل النتائج مقارنة بطریقة GAM الاعتیادیة حیث ساعدت ممهدات التقلیص المویجی على تمهید البیانات وذلک من خلال الحصول على اقل القیم لمعاییر الکفاءة (أی کفاءة أعلى)، واظهرت المویجة Coiflets تفوقاً على باقی المویجات الاخرى . فی حالة استخدام اسلوب المحاکاة وعند استخدام النموذج الاول والثانی وتلویث البیانات بالتوزیعات ( Exp. dist. , Laplace dist., Dist. (t)) بنسب (5% , 15%, ,35%) وبأحجام عینة (50 , 150 , 300) لوحظ ایضاً ان أسلوب التمهید بدالة دوبیجیز (DWGAM) وأسلوب التمهید بدالة هار (HWGAM) کان لهما الأداء الأفضل مقارنة ببقیة الطرق لسیناریوهات المحاکاة التی تم تناولها. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
References | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1- Amodio, S. ; Aria, M ; and D’Ambrosio, A, (2015), “On Concurvity in nonlinear and nonparametric models”, STATISTICA, vol. 74, no.1 , pp. 85-98.
2- Augustin , N. H. H. , Sauleau , E. j A. , & Wood S. N. ,(2012) , " On Quantile Quantile Plots for Generalized Linear Models" , Computational Statisstics & Data Analysis 56 , 2404-2409 .
3- B. Mphan Kumar , R. Vidhya Lavanya , (2011) , " Signal Denoising with Soft Threshold By Using Chui-Lian (CL) Multiwavelet " , International Journal of Electronics & Communication Technology IJECT Vol . 2 , Issue 1 , pp 38-42 .
4- Buja , A. , Hastie,T.J. and Tibshirani , R.J. ,(1989) , "Linear Smoothing and Addition Models" , Annass of Statistic , Vol.17,PP.453-555 .
5- Crowley . P. & Maraum . p. & Mayes , P. , (2006) " How hard is the euro core ? an evaluation of growth cycles using wavelet analysis " , Bank of Finland Research .
6- Donoho , L.D , Johnstone , M.l. , (1994) , " Ideal Spatial adaptation by wavelet Shrinkage " Biometrika , 81 , 3 , pp . 425-550 .
7- Friedman , J.H.,(1999)," Multivariat Adaptive Regression Spline" , The Annals of Statitics , Vol.19,No.1,pp 1-141.
8- Green,O.J. and Silverman, B.W.,(1994) , "Nonparametric Regression and Generalized Linear Models :ARoughness Penalty Approach" , Chapman and Hall , London .
9- He , Shui , (2004) , "Generalized Additive Models for Data With Concurvity: Statistical Issus and a novel model Fitting Approach " , School of Public Health Library , University of Pittsburgh .
10- Li,Y. and Ruppert , D. (2008) ,"On the asymptotic of Penalized Splines" , Biometricka , 95,415-436 .
11- Rajeev Aggarwal, Jai Karan Singh,and Other , (2011) , "Noise Reducation of Speech Signal Using Wavelet Transform with Modified Universal Threshold " International Journal of Computer Application , Volume 20, No.5 , P14-19.
12- Ruppert , D. , Wand , M.P. ,and Carroll,R.J. (2003) , " Semmiparametric Regression" Cambrdge Univeristy Press , New York .
13- Zitong , Z . , & Qawik.T , (2016) , "Choosing Wavelet Method , Filter , and Length for Function Brain Network Construction " , Jornal List , Plos one ,V.11(6) . | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Statistics Article View: 419 PDF Download: 297 |