[صفحه اصلی ]   [Archive] [ English ]  
:: صفحه اصلي :: درباره نشريه :: آخرين شماره :: تمام شماره‌ها :: جستجو :: ثبت نام :: ارسال مقاله :: تماس با ما ::
بخش‌های اصلی
اطلاعات نشریه::
آرشیو مجله و مقالات::
ثبت نام و اشتراک::
ارسال مقاله::
پایگاه‌های مرتبط::
برای داوران::
اخلاق در پژوهش::
تماس با ما::
تسهیلات پایگاه::
::
جستجو در پایگاه

جستجوی پیشرفته
..
دریافت اطلاعات پایگاه
نشانی پست الکترونیک خود را برای دریافت اطلاعات و اخبار پایگاه، در کادر زیر وارد کنید.
..
Google Scholar Metrics

Citation Indices from GS

AllSince 2020
Citations4817
h-index32
i10-index00
..
ثبت شده در

AWT IMAGE


..
نماد اعتماد الکترونیکی
..
آمار نشریه
تعداد دوره های نشریه: 19
تعداد شماره ها: 37
تعداد مشاهده ی مقالات: 3369087
تعداد دریافت (دانلود) مقالات: 874048

مقالات دریافت شده: 861
مقالات پذیرفته شده: 358
مقالات رد شده: 490
مقالات منتشر شده: 355

نرخ پذیرش: 41.58
نرخ رد: 56.91

میانگین دریافت تا پذیرش: 403 روز
میانگین دریافت تا اولین داوری: 5.7 روز
میانگین پذیرش تا انتشار: 514.6 روز
____
..
:: ::
برگشت به فهرست مقالات برگشت به فهرست نسخه ها
روش‌های پیشرفته جانهی مقادیر گم‌شده: روش‌های یادگیری ماشین با تاکید بر یک روش ترکیبی برای جانهی چندگانه با استفاده از معادله‌های زنجیره‌ای
مهرداد قادری ، زهرا رضائی قهرودی* ، مینا گندمی
چکیده:   (330 مشاهده)

نحوه برخورد با داده‌های گم‌شده یکی از مسائلی است که اغلب محققان با آن روبرو هستند. جانهی چندگانه با استفاده از معادله‌های زنجیره‌ای یکی از رایج‌ترین و انعطاف‌پذیرترین روش‌ها برای جانهی است.  از دیدگاه تئوری، هر مدل جانهی می‌تواند  برای پیش‌بینی مقادیر داده‌های گم‌شده استفاده شود اما اگر مدل‌های پیشگویی نادرست باشند می‌تواند منجر به برآوردهای اریب و استنباط‌های نامعتبر شود. یکی از جدیدترین راه‌حل‌ها برای برخورد با داده‌های گم‌شده، روش‌ ترکیبی یادگیری ماشین و ابریادگیرنده است. در این مقاله،  چند شبیه‌سازی‌ برای نشان دادن رویکرد بهتر این روش از نظر اریبی کمتر و همگرایی بهتر برآورد پارامتر نهایی نسبت به  روش‌های جانهی رایج ارائه شده است.  همچنین، به پیاده‌سازی برخی روش‌های یادگیری ماشین و یک الگوریتم ترکیبی از ابریادگیرنده، روی داده‌های کارگاه‌های صنعتی  پرداخته شده است که در آن جانهی متغیرهای مختلف در داده‌ها به‌طور همزمان صورت می‌گیرد. همچنین به ارزیابی روش‌های مختلف  و معرفی روش دارای عملکرد برتر، پرداخته شده است.

واژه‌های کلیدی: داده‌های گم‌شده، الگوریتم ترکیبی ابریادگیرنده، جانهی چندگانه با استفاده از معادلات زنجیره‌ای، روش‌های یادگیری ماشین، آمارگیری از کارگاه‌های صنعتی
متن کامل [PDF 6724 kb]   (147 دریافت)    
نوع مطالعه: كاربردي و توسعه ای | موضوع مقاله: آمار کاربردی
دریافت: 1403/7/22 | پذیرش: 1403/6/10
فهرست منابع
1. Aerts, M., Claeskens, G., Hens, N., and Molenberghs, G. (2002). Local Multiple Imputation. Biometrika, 89(2), 375-388. [DOI:10.1093/biomet/89.2.375]
2. Alwateer, M., Atlam, E. S., Abd El-Raouf, M. M., Ghoneim, O. A., and Gad, I. (2024). Missing Data Imputation: A Comprehensive Review. Journal of Computer and Communications, 12(11), 53-75. [DOI:10.4236/jcc.2024.1211004]
3. Emmanuel, T., Maupong, T., Mpoeleng, D., Semong, T., Mphago, B., and Tabona, O. (2021). A Survey on Missing Data in Machine Learning. Journal of Big Data, 8(1), 1-37. [DOI:10.1186/s40537-021-00516-9] [PMID] []
4. Graham, J. W., Olchowski, A. E., and Gilreath, T. D. (2007). How Many Imputations Are Really Needed? Some Practical Clarifications of Multiple Imputation Theory. Prevention Science, 8, 206-213. [DOI:10.1007/s11121-007-0070-9] [PMID]
5. Laqueur, H. S., Shev, A. B., and Kagawa, R. M. (2022). SuperMICE: An Ensemble Machine Learning Approach to Multiple Imputation by Chained Equations. American Journal of Epidemiology, 191(3), 516-525. [DOI:10.1093/aje/kwab271] [PMID]
6. Little, R. J. (1988). Missing-data Adjustments in Large Surveys. Journal of Business and Economic Statistics, 6(3), 287-296. https://doi.org/10.2307/1391881 [DOI:10.1080/07350015.1988.10509663]
7. Marshall, A., Altman, D. G., Royston, P., and Holder, R. L. (2010). Comparison of Techniques for Handling Missing Covariate Data Within Prognostic Modelling Studies: A Simulation Study. BMC Medical Research Methodology, 10(1), 1-16. [DOI:10.1186/1471-2288-10-7] [PMID] []
8. Nadaraya, E. A. (1964). On Estimating Regression. Theory of Probability and Its Applications, 9(1), 141-142. [DOI:10.1137/1109020]
9. Quinlan, J. R. (1987). Simplifying Decision Trees. International Journal of Man-Machine Studies, 27(3), 221-234. [DOI:10.1016/S0020-7373(87)80053-6]
10. Raghunathan, T. E., Lepkowski, J. M., Van Hoewyk, J.,and Solenberger, P. (2001). A Multivariate Technique for Multiply Imputing Missing Values Using a Sequence of Regression Models. Survey Methodology, 27(1), 85-96.
11. Rubin, D. B. Multiple Imputation for Nonresponse in Surveys.Toronto, ON, Canada: John Wiley and Sons, Inc.; 2004.
12. Stekhoven, D. J., & Bühlmann, P. (2012). MissForest-non-parametric Missing Value Imputation for Mixed-type Data. Bioinformatics, 28(1), 112-118. [DOI:10.1093/bioinformatics/btr597] [PMID]
13. Tiwaskar, S., Rashid, M., and Gokhale, P. (2024). Impact of Machine Learning-based Imputation Techniques on Medical Datasets-a Comparative Analysis, {it Multimedia Tools and Applications}, DOI:10.1007/s11042-024-19103-0. [DOI:10.1007/s11042-024-19103-0]
14. Van Buuren, S. (2018). Flexible Imputation of Missing Data. CRC press. [DOI:10.1201/9780429492259]
15. Van Buuren, S., and Groothuis-Oudshoorn, K. (2011). mice: Multivariate Imputation by Chained Equations in R. Journal of Statistical Software, 45, 1-67. [DOI:10.18637/jss.v045.i03]
16. Van der Laan, M. J., Polley, E. C., & Hubbard, A. E. (2007). Super Learner, Statistical Applications in Genetics and Molecular Biology, 6(1), DOI:10.2202/1544-6115.1309. [DOI:10.2202/1544-6115.1309]
ارسال پیام به نویسنده مسئول

ارسال نظر درباره این مقاله
نام کاربری یا پست الکترونیک شما:

CAPTCHA



XML   English Abstract   Print



بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.
برگشت به فهرست مقالات برگشت به فهرست نسخه ها
مجله علوم آماری – نشریه علمی پژوهشی انجمن آمار ایران Journal of Statistical Sciences

Persian site map - English site map - Created in 0.05 seconds with 43 queries by YEKTAWEB 4700