زهرا احمدیان، فرزاد اسکندری،
جلد 28، شماره 1 - ( 6-1402 )
چکیده
امروزه تشخیص بیماریها با استفاده از هوش مصنوعی و الگوریتمهای یادگیری ماشین از اهمیت بسیار بالایی برخوردار است، چرا که با استفاده از دادههای موجود در زمینه مطالعاتی بیماری مورد نظر میتوان به اطلاعات و نتایج سودمندی دست یافت که از رخداد بسیاری از مرگ ومیرها میکاهد. از جمله این بیماریها میتوان به تشخیص بیماری دیابت که امروزه با توجه به رشد زندگی شهرنشینی و کاهش فعالیت افراد گسترش یافته است، اشاره کرد. پس تشخیص این موضوع که فرد به بیماری دیابت مبتلا میگردد یا خیر از اهمیت بسیار بالایی برخوردار است. در این مقاله از مجموعه داده مربوط به اطلاعات افرادی که آزمایش تشخیص دیابت را انجام دادهاند استفاده شده است. این اطلاعات مربوط به 520 نفر است،
عمل ردهبندی افراد به دو دسته که آیا نتیجه آزمایش دیابتشان مثبت است یا خیر صورت میگیرد و از روشهای ردهبند بیزی مانند ماشین بردار پشتیبان بیزی، بیز ساده، CN$ و روش ردهبند ترکیبی کتبوست استفاده شده است تا بتوان نتیجه گرفت که کدام یک از این روشها میتوانند توانمندی بهتری برای تحلیل دادهها داشته باشند و همچنین برای مقایسه این روشها از معیارهای دقت، صحت، وضوح، حساسیت و نمودار راک استفاده شده است.
حسین صمیمی حق گذار، آناهیتا نظری زاده،
جلد 28، شماره 1 - ( 6-1402 )
چکیده
ریسک به معنی شرایطی است که در آن امکان انحراف از یک نتیجه پیش بینی شده وجود دارد. بیمه یکی از روشهای مواجهه با ریسک است که منجر به انتقال تمام یا بخشی از ریسک از بیمه گذار به بیمه گر می شود. بیمه نامه ها معمولا به دو صورت بیمه زندگی و غیرزندگی دسته بندی می شوند. براساس این دسته بندی هر بیمه نامه ای که موضوع آن سلامت فرد یا افراد بیمه شده باشد، بیمه نامه اشخاص درغیر اینصورت بیمه نامه غیرزندگی خواهد بود. بسیاری از بیمه های موجود در صنعت بیمه، جزء بیمه های غیرزندگی طبقه بندی می شوند. بیمه های آتش سوزی، اتومبیل، مهندسی، باربری، نفت و انرژی از مصداقهای این بیمه هستند. تبیین و محاسبه سه موضوع در مدل های ریسک اهمیت زیادی دارد: احتمال ورشکستگی، زمان ورشکستگی و مقدار ورشکستگی.
در این مقاله نتایج اصلی و شناخته شده ای که تاکنون در زمینه بیمه های غیرزندگی به دست آمده است؛ با تاکید بر احتمال ورشکستگی ، همراه با مثالهای مختلف آورده می شود.
آناهیتا کمیجانی، ابراهیم ریحانی، زهرا رحیمی، احسان بهرامی سامانی،
جلد 28، شماره 1 - ( 6-1402 )
چکیده
اهمیت آمار و آموزش آن در دنیای کنونی که سرشار از اطلاعات و داده است، برکسی پوشیده نیست. تفکر آماری هستۀ اصلی درک صحیح مفاهیم آماری، تجزیه و تحلیل دادهها و تفسیر پدیدههاست. پژوهش حاضر با هدف دستیابی به تعریفی جامع از تفکر آماری و تعیین عناصر آن، پژوهشهای سی و سه سال اخیر را مورد مطالعه قرار داده است. این پژوهش توصیفی، به روش فراترکیب کیفی به انجام رسیده است تا بینشی عمیق و تفسیری جامع از کلیت پژوهشهای موجود ارائه کند. بر اساس معیارهای ورود تعداد 123 پژوهش در بازۀ سالهای 1990 تا 2022، شناسائی شد و در نهایت پس از غربالگری، تعداد 22 تحقیق برای بررسی و تحلیل دقیق انتخاب شد. با توجه به یافتههای فراترکیب حاضر، عناصر تفکر آماری عبارتند از: 1- داده محور بودن: توجه به دادهها، تشخیص نیاز به دادهها، جمع آوری و در نظر گرفتن داده ها، بازنماییهای مختلف دادهها و نیز روشهای تبدیل آنها به یکدیگر. 2- تغییر پذیری: در نظرداشتن تغییرات دائمی در همه پدیدهها. 3- استنباط آماری: توجه به انواع نمونهگیری، استدلال و استنباط با استفاده از مدلهای آماری شامل استفاده از نمودارهای آماری و تعمیم نتایج از نمونه به جامعه. 4- تحلیل زمینه آماری: تلفیق مسئلۀ آماری با زمینه.
نسرین آخوندی، غلامحسین مشیریان، سپیده حاتمی،
جلد 28، شماره 1 - ( 6-1402 )
چکیده
این پژوهش با هدف کاربرد نظریه رفتارهای برنامهریزیشده برتمایل بهکارآفرینی و تأثیر این تمایل بر توسعه فناوری اطلاعات درجوانان 18-30 ساله ایرانی در زمستان سال 1401 انجام شد. بخشی از افراد نمونه در این پژوهش براساس رده سنی درج شده در مشخصات اپراتورهای تلفن همراه(18-30 ساله) در استان تهران بودند که با استفاده از سیستم پیامک و ارسال آدرس پیوند در آن، به صورت تصادفی پرسشنامه را دریافت کردند (طبق روشهای تصادفی موجود در این اپراتورها برای ارسال پیامک به مشترکین) و نیز بخش دیگر دانشجویان18- 30ساله دانشگاه آزاد اسلامی واحد تهران جنوب بودند، که پرسشنامه پژوهش به صورت تصادفی در اختیار آنها قرار گرفت. روایی پرسشنامه توسط صاحب نظران حوزه فناوری اطلاعات و ارتباطات تأیید شد و پایایی آن براساس آزمون آلفای کرونباخ با ضریب آلفا حداقل 0/70 (مقدار ملاک) بهدست آمد. نتایج پژوهش نشان داد که براساس نظریه رفتارهای برنامهریزی شده، تمایل به کارآفرینی بر توسعه فناوری اطلاعات در جوانان 18-30 ساله ایرانی تأثیر دارد.
شهرستانی شهرام یعقوب زاده شهرستانی، امراله جعفری،
جلد 28، شماره 1 - ( 6-1402 )
چکیده
در این مقاله مدل صفبندی $M/M/1$ که در آن زمانهای بین دو ورود متوالی مشتریها دارای توزیع نمایی با پارامتر $lambda$ و زمانهای سرویس دارای توزیع نمایی با پارامتر $mu$ و مستقل از زمانهای بین ورودهای متوالی هستند، در نظر گرفته میشود. همچنین فرض میشود که سیستم تا زمان $T$ فعال است. سپس تحت این زمان توقف $(T)$، برآوردهای بیز، $E$-بیز و بیز سلسله مراتبی پارامتر شدت ترافیک این مدل صفبندی، تحت تابع زیان آنتروپی عمومی و با در نظر گرفتن توزیعهای پیشین گاما و ارلانگ به ترتیب برای پارامترهای $lambda$ و $mu$ به دست آورده میشود. سپس به کمک تحلیل عددی و بر اساس شاخصی جدید بر حسب احتمال پایایی و تابع هزینه، روشهای برآورد بیز، $E$-بیز و بیز سلسله مراتبی با هم مقایسه میشوند.
خانم پریا ترابی کهلان، خانم لیدا کلهری ندرآبادی،
جلد 28، شماره 1 - ( 6-1402 )
چکیده
استفاده از منابع اداری در اجرای سرشماریها، امکان کاهش هزینهها، بهبود کیفیت دادهها و تولید اطلاعات با توالی زمانی کوتاهتر را فراهم میکند. موارد ذکرشده میتواند علاوه بر نظارت سالانهی نماگرهای اهداف توسعهی پایدار، در تأمین نیازهای رو به گسترش نظام برنامهریزی و پژوهشی کشور نیز نقش بهسزائی داشته باشد، اما چالشهای زیادی نیز در این رابطه وجود دارد که یکی از مهمترین آنها ارزیابی کیفیت ثبتهای اداری است. ارزیابی کیفیت اصلیترین جنبهی بهکارگیری دادههای ثبتی و اداری در سرشماری و از ضروریات اجرای سرشماری ثبتیمبنا است که در آن نمیتوان از معیارهای سنتی ارزیابی کیفیت استفاده کرد. بهعبارت دیگر، علیرغم مزایای بهکارگیری دادههای ثبتی و اداری در سرشماری، بسیاری از مخاطرههای کلیدی کیفیت وجود دارند که باید قبل از استفاده از آنها در سرشماری بررسی و ارزیابی شوند. در این مقاله روشهایی که ادارههای آمار ملی چگونه میتوانند کیفیت دادههای بهدستآمده از ثبتها را با هدف تولید بروندادهای آماری باکیفیت ارزیابی کنند، مرور شده است. از اینرو، ابزارها و نماگرهای کلیدی مورد استفاده برای تعیین کمیت ارزیابی کیفیت در هر یک از چهار مرحلهی ارزیابی کیفیت شامل منبع، دادههای ورودی، فرایند و برون داد در فرایند سرشماری معرفی شده است.
دکتر رحیم محمودوند،
جلد 28، شماره 1 - ( 6-1402 )
چکیده
در پژوهشهای بیمسنجی، خسارتهای بیمهای را با توزیعهای احتمالی مناسب مدلبندی میکنند. از آنجا که خسارتها، پس از ارزیابی، با واحدهای پولی معین میشوند از توزیعهایی که مقادیر مثبت را اختیار میکنند برای مدلبندی آنها استفاده میشود. علاوه بر این، با توجه به قراردادهای بیمهای، خسارتها در یک محدوده کراندار قرار میگیرند که بایستی در مدلبندی لحاظ شوند. این ویژگیها در حالت یک متغیره دشواری و محدودیت چندانی ایجاد نمیکند. اما در حالت چند متغیره مساله قدری پیچیدهتر میشود. در چنین شرایطی مفصلها میتوانند مفید واقع شوند. با این وجود بررسی همبستگی بین متغیرها، به عنوان نخستین گام در تحلیل چندمتغیره، نقش مهمی ایفا میکند. بر این اساس بررسی تاثیر کراندار بودن خسارتها بر همبستگی بین آنها مسالهای است که در این مقاله مورد توجه قرار گرفته است.
در این راستا ضریب همبستگی پیرسون، به عنوان متداولترین شاخص برای بررسی رابطه بین متغیرها، مورد استفاده قرار گرفته است. ابتدا مساله بر پایه ضریب همبستگی بین دو متغیر تصادفی بررسی شده و در ادامه بررسیها بر روی برآورد گشتاوری ضریب همبستگی پیرسون انجام شده است. دادههای مربوط به خسارتهای مالی و جانی بیمهنامههای شخص ثالث در یکی از شرکتهای بیمه ایرانی به عنوان یک مطالعه موردی بررسی شده است.
کرانهای پائینی و بالایی برای پارامتر ضریب همبستگی پیرسون و برآورد گشتاوری آن به دست آمده است. کرانهای مربوط به پارامتر ضریب همبستگی با توجه به تابع مفصل به دست آمده است در حالی که برای برآورد ضریب همبستگی از آمارههای ترتیبی استفاده شده است. علاوه بر این با توجه به ماهیت دادهها، ضریب همبستگی بین خسارتهای مالی و جانی به دو صورت محاسبه و با یکدیگر مقایسه شدند.
مقایسه کرانهای به دست آمده نشان میدهد که کرانهای $+1$ و $-1$ برای ضریب همبستگی پیرسون در خسارتهای بیمهای در دسترس نیست و کرانهای باریکتری برای این ضریب قابل ترسیم است.
منیژه صانعی طبس، محمدحسین دهقان، فاطمه آشتاب،
جلد 28، شماره 1 - ( 6-1402 )
چکیده
واریانس و آنتروپی معیارهایی متمایز هستند که معمولاً برای اندازه گیری عدم قطعیت متغیرهای تصادفی استفاده میشوند. در حالی که واریانس نشان میدهد که چگونه یک متغیر تصادفی بیشتراز حد انتظارش گسترش مییابد، معیارآنتروپی عدم قطعیت یک رویکرد اطلاعاتی را اندازه گیری میکند به عبارت دیگر میانگین مقدار اطلاع یک متغیر تصادفی را اندازه گیری میکند.
برای دو توزیع یکنواخت و نرمال واریانس نسبتی از آنتروپی توانی است. یافتن یک چنین رابطه یکنوا بین واریانس و انتروپی برای یک کلاس بزرگتر از این دو توزیع اهمیت و کاربرد زیادی در پردازش سیگنال، یادگیری ماشین، تئوری اطلاعات و احتمال و آمار دارد
برای کم کردن خطاهای برآوردگرها مورد استفاده قرار میگیرد و یک راهبردی را انتخاب میکند که به طور متوسط بیشترین یا تقریباً بزرگترین کاهش در آنتروپی توزیع مکان هدف داشته باشد و اثربخشی این روش با استفاده از شبیهسازیها با مدلهای سنجش کاوی امتحان میشوند. در این مقاله کران بالای واریانس برای توزیع های تک مدی که دم آنها سنگین تر از دم توزیع نمایی است به کمک آنتروپی توانی ایجاد می گردد
عبدالسعید توماج،
جلد 28، شماره 1 - ( 6-1402 )
چکیده
این مقاله به بررسی برخی از ویژگیهای اکستروپی طول عمر سیستمهای منسجم میپردازد با این فرض که توزیع طول عمر مولفههای سیستم مستقل و به طور یکسان توزیع شدهاند. نتایج ارائه شده با استفاده از مفهوم اثر مشخصه به دست آمده است. بدین منظور، ابتدا عبارتی برای اکستروپی طول عمر سیستمهای منسجم بدست آورده شده است. سپس، مقایسههای تصادفی اکستروپی برای سیستمهای منسجم به شرطی که هر دو سیستم دارای اثر مشخصه یکسان باشند، مورد بحث قرار میگیرد. در مواردی که تعداد مولفههای سیستم زیاد یا سیستم دارای ساختار پیچیدهای باشد، بدست آوردن مقدار دقیق اکستروپی طول عمر سیستم سخت یا وقتگیر میباشد. بنابراین، کرانهایی نیز برای اکستروپی بدست آمده است. علاوه بر این، یک معیار جدید برای انتخاب یک سیستم ارجح بر اساس اکستروپی نسبی پیشنهاد شده است که نزدیکترین طول عمر سیستم دلخواه به سیستم موازی را در نظر میگیرد.
دکتر اکرم کهن سال، خانم عاطفه کرمی،
جلد 28، شماره 1 - ( 6-1402 )
چکیده
استنباط آماری پارامتر تنش-مقاومت چند مولفهای،
، در یک توزیع وایبول سه پارامتری بررسی میشود. مسئله در دو حالت مختلف مورد مطالعه قرار میگیرد. در حالت اول، با فرض اینکه متغیرهای تنش و مقاومت هر دو دارای پارامتر شکل و مکان مشترک و پارامترهای مقیاس غیرمشترک هستند و تمام این پارامترها نامعلومند، برآورد درستنمائی ماکسیمم و برآورد بیزی پارامتر
بررسی میشود. در این حالت، از آنجائیکه برآورد بیزی دارای فرم بسته نمیباشد، با دو روش لیندلی و
تقریب زده میشود. همچنین فواصل اطمینان مجانبی به دست آمده است. در حالت دوم، با فرض اینکه متغیرهای تنش و مقاومت دارای پارامتر شکل و مکان مشترک معلوم و پارامترهای مقیاس غیرمشترک و نامعلوم هستند، برآورد درستنمائی ماکسیمم، برآورد نااریب با واریانس به طور یکنواخت مینیمم، برآورد دقیق بیزی پارامتر
و نیز فاصله اطمینان مجانبی محاسبه میشود. در نهایت، با استفاده از شبیه سازی مونت کارلو، عملکرد برآوردگرهای مختلف با هم مقایسه شده اند.
دکتر ناهید سنجری فارسی پور، دکتر بهرام طارمی، خانم زهرا معمار کاشانی،
جلد 28، شماره 2 - ( 12-1402 )
چکیده
مارشال و اولکین خانواده ای از توزیع ها را معرفی کردند که با اضافه کردن یک پارامتر به توزیع های دیگر بدست می آید. سانتوز-نتو و همکاران مطالعه روی خانواده ی توزیع های تعمیم یافته وایبول را انجام دادند. در این مقاله دو توزیع ریلی و پارتو تعمیم یافته وایبول مورد مطالعه قرار گرفته, مطالب گوناگون مانند گشتاورها و آمار بیزی تحت تابع زیان های مختلفی از جمله مربع خطا, آنتروپی, لاینکس, مربع خطا در لگاریتم و لاینکس اصلاح شده را مورد بحث قرار داده ایم. همچنین روش زنجیره مارکف مونت کارلو(mcmc) برای این دو توزیع قرار گرفته اند.
دکتر فاطمه شاه سنایی، دکتر رحیم چینی پرداز،
جلد 28، شماره 2 - ( 12-1402 )
چکیده
در بعضی از پدیده های تجربی، پژوهشگران با داده هایی مواجه هستند که ذاتا ماهیت اقلیدسی ندارند. داده های دایره ای که برای اندازه گیری زاویه و یا جهت به کار می روند، از این نوع هستند. در بررسی های آماری ممکن است به جای نمونه های تصادفی با نمونه های وزنی مواجه شویم که در آنها مشاهدات متناظر با تابعی تحقق مییابند. در این مقاله به توزیع های وزنی در داده های دایره ای پرداخته می شود. با توجه به اینکه توزیع ون میزس کاربرد بسیار وسیعی در مدل بندی داده های دایره ای دارد، برآورد ماکسیمم درستنمایی پارامترهای توزیع دایره ای ون میزس وزنی مورد بررسی قرار می گیرد. از آنجا که ممکن است براوردگرها شناسا پذیر نباشند، به کمک توزیع پیشین مناسب ممکن است برآوردهایی منحصر به فرد به دست آورد. در یک کار شبیه سازی وزن های مختلف در توزیع دایره ای ون میزس مقایسه می شوند
خانم پریا ترابی کهلان، خانم لیدا کلهری ندرآبادی،
جلد 28، شماره 2 - ( 12-1402 )
چکیده
در طول دهههای گذشته، چالشهای زیادی برای سرشماری سنتی وجود داشته است. گردآوری اطلاعات از افراد یک کشور با استفاده از روشهای سنتی یک عملیات عظیم و پرهزینه و یک نگرانی کلیدی است. علاوه بر این، کاهش تمایل جامعه برای پاسخگویی به پرسشنامههای سرشماری و بحرانهای غیر منتظره مانند همهگیری کووید 19، تولید آمارهای قابل اعتماد با جزئیات جغرافیایی و محتوایی لازم را برای ادارههای آمار ملی دشوار کرده است. اما توسعهی فناوریهای جدید و رویکردهای گردآوری دادهها به این معنی است که فرصتهای نوظهوری نیز وجود دارد. تمایل روزافزون استفاده از منابع اداری در اجرای سرشماریها، امکان کاهش هزینهها، بهبود کیفیت دادهها و تولید اطلاعات مکرر را بهصورت سالانه فراهم آورده است. مطالعهی رویکردهای مختلف اتخاذشده توسط برخی از کشورهای منطقهی آسیا و اقیانوسیه نشان میدهد که در حال حاضر از دادههای اداری به روشهای مختلفی برای پشتیبانی از عملیات سرشماریها استفاده میشود. بررسی این رویکردها، برای یاری و راهنمایی کشورهایی که در حال تأمل در بهکارگیری یا توسعهی استفاده از دادههای اداری در سرشماری هستند، بسیار مفید خواهد بود. در این مقاله ضمن مرور تعریف ثبت و انواع ثبتهای اداری مورد استفاده در سرشماری ثبتیمبنا، اقدامات انجامشده در برخی کشورها در حرکت به سمت سرشماری ثبتیمبنا ارائه میشود.
دکتر ابوذر بازیاری،
جلد 28، شماره 2 - ( 12-1402 )
چکیده
شرکتهای بیمه به لحاظ ساختار تصادفی که دارند، با مدلهای ریاضی و آماری مدلبندی میشوند. در این مقاله، مدل مخاطره انفرادی شرکت بیمه با نرخهای بهره متفاوت در یک دوره زمانی در نظر گرفته شده و فرض میشود که نرخهای بهره دارای ماتریس احتمال انتقال با حالت متناهی و شمارا باشند. با استفاده از احتمال شرطی روی تابع چگالی اولین خسارت، احتمالات ورشکستگی زمان متناهی و نامتناهی محاسبه شدهاند. همچنین با استفاده از روش استقرای ریاضی کرانهای بالای احتمال ورشکستگی زمان نامتناهی برای توزیعهای دم سبک بهدست آمدهاند. در مثالهای عددی، احتمالات ورشکستگی برای توزیعهای دم سنگین با احتمالات داده شده در بازیاری (2022) برای مدل مخاطره انفرادی کلاسیک مقایسه شده و نیز احتمالات ورشکستگی زمان نامتناهی برای توزیعهای دم سبک با مقادیر کران لاندبرگ مقایسه میشوند. نتایج نشان میدهند که وجود نرخهای بهره دارای ماتریس احتمال انتقال با حالت متناهی باعث کاهش احتمالات ورشکستگی خواهند شد.
دکتر رضا زارعی، دکتر شهرام یعقوب زاده شهرستانی، دکتر امرالله جعفری،
جلد 28، شماره 2 - ( 12-1402 )
چکیده
تابع هزینه و احتمال پایایی سیستم دو معیار کلیدی در طراحی سیستم های صفبندی بهشمار میآیند. در این مقاله هدف طراحی یک سیستم صف بندی تک باجهای با ظرفیت نامتناهی است که در آن زمانهای سرویس در مدل اول و زمانهای بین ورود به سیستم در مدل دوم دارای توزیع ارلانگ میباشند. به این منظور، شاخصی جدید بر اساس تابع هزینه و احتمال پایایی سیستم معرفی میشود که بزرگتر بودن آن نشان دهنده بهینه بودن مدل میباشد. چند مثال عددی و یک مثال کاربردی برای تشریح جزئیات محاسباتی روش پیشنهادی ارائه شده است.
خانم پریا ترابی کهلان، آقا علیرضا زاهدیان،
جلد 28، شماره 2 - ( 12-1402 )
چکیده
بنگاههای کوچک و متوسط (SMEs) نقش بهسزایی در ایجاد فرصتهای شغلی، تولید ناخالص داخلی، افزایش تولید محصولات داخلی و صادرات ایفا میکنند و یکی از ارکان کلیدی دستیابی به رشد و توسعهی اقتصادی کشورها به شمار میآیند. هدف این مقاله، تبیین جایگاه SMEها و سهم آنها در اشتغال، اقتصاد، صادرات و دسترسی به منابع بانکی در برخی کشورهای منتخب و مقایسهی آنها با دادههای موجود در ایران است. برای این منظور، تعداد کل کارگاههای خرد و کوچک بخش خصوصی کشور (کمتر از ۵۰ نفر کارکن) و تعداد شاغلان آنها با استفاده از دادههای طرح آمارگیری نیروی کار مرکز آمار ایران طی دورهی 10 ساله براورد و مقادیر آنها با استفاده از روش هموارسازی نمایی دوگانه برای سال 1404 پیشبینی شده است. نتایج حاکی از آن است که تعداد کارگاههای کمتر از ۵۰ نفر کارکن بخش خصوصی طی دورهی مورد بررسی افزایشی بوده و تا سال 1404 تعداد آن به 4,596,855 میرسد بهطوریکه سهم شاغلان این کارگاهها در سال 1404 نیز 82.6 درصد پیشبینی شده است. با این وجود، شواهد نشان میدهد که سهم این بنگاهها از تسهیلات بانکی در سالهای اخیر، تنها 4.5 درصد بوده است که این رقم در مقایسه با سایر کشورها بسیار کم و ناچیز است. یافتههای این پژوهش در راستای برنامههای حمایتی دولت از SMEها یاریرسان است
دکتر مهدیه بیاتی،
جلد 28، شماره 2 - ( 12-1402 )
چکیده
ما در عصر اطلاعات زندگی می کنیم و همواره در حال درک و دریافت دادههای زیادی از دنیای اطراف خود هستیم که برای استفاده از این اطلاعات لازم است آنها را به کمک آمار و بهصورت ریاضی بیان کنیم. آمار در همهی زمینهها نقش موثری ایفا میکند. یکی از مواردی که جدیدا مورد توجه قرار گرفته و از فنون آماری کمک میگیرد، متن کاوی است. متن کاوی یک روش تحقیقی برای شناسایی الگوهای موجود در متون است که میتواند نوشتاری، گفتاری و یا تصویری باشد. متن کاوی بسیار گسترده است همانند طبقه بندی متون، خوشهبندی متون، وبکاوی و عقیده کاوی و .... تکنیکهای متن کاوی بهکار گرفته میشود تا مقادیر عددی را برای یک متن تعیین کند. از آنجا که اساس کار با داده، دارا بودن علم آمار است. پس با استفاده از ابزارهای آماری به تحلیل متن می پردازند همانند پیش بینی افزایش یا کاهش قیمت دلار یا سهام با استفاده از اطلاعات متنی امروز. بهکارگیری روشهای آماری می تواند حقایق موجود در متن را کشف، تائید و یا رد کند. امروزه این مبحث در یادگیری ماشین بسیار پر کاربرد است. در این مقاله سعی کردیم تا آشنایی ابتدایی با ابزارهای آماری در روش متن کاوی داشته باشیم و از این ابزار قدرتمند برای تحلیل وقایع استفاده کنیم.
یاسر هاشم زهی، دکتر سیدمهدی امیرجهانشاهی، دکتر محمدحسین دهقان،
جلد 28، شماره 2 - ( 12-1402 )
چکیده
در این مقاله آزمون واگرایی L2 را جهت سنجش نمایی بودن دادههای سانسور تصادفی معرفی میکنیم. سپس توان این آزمون در تشخیص نمایی بودن داده ها را به روش شبیهسازی مونت کارلو با سایر آزمونهای رقیب شامل آزمونهای کولموگروف-اسمیرنوف، اندرسون-دارلینگ و کرامر فون-میزس که مبتنی بر تابع توزیع تجربی و آزمونهای مبتنی بر معیار اطلاع مورد مقایسه قرار میدهیم. نتایج مطالعات شبیهسازی نشان میدهد که آزمون پیشنهادی عموما عملکرد بهتری نسبت به سایر آزمونهای رقیب دارد.
سمیه حوتی زاده، حبیب نادری، سید مرتضی محمدی،
جلد 28، شماره 2 - ( 12-1402 )
چکیده
خشکسالی از مفاهیم بسیار مهم در حوزه هیدرولوژی هستند که در سال های اخیر اهمیت بیشتری پیدا کرده است و نتایج حاصل از مدل سازی و تحلیل آن برای ارزیابی و مدیریت ریسک اهمیت دارد. این پژوهش، به بررسی خشکسالی در شهر زاهدان طی دوره آماری ۱۹۵۱ تا ۲۰۱۷ با استفاده از شاخص بارش استاندارد شده می پردازد و روش های مدل بندی داده های چندمتغیره با استفاده از توابع مفصل واین را توضیح می دهد. مدل های مختلف با استفاده از معیارهای نیکویی برازشمقایسه می شوند و بهترین مدل انتخاب می گردد. همچنین، دوره های بازگشت توأم محاسبه و تحلیل می شوند.
لادن فریدی، دکتر زهرا رضائی قهرودی،
جلد 28، شماره 2 - ( 12-1402 )
چکیده
یکی ﺍﺯ نگرانیﻫﺎی ﻋﻤﺪۀ ﺍﻗﺘﺼﺎﺩی ﺑﺴﯿﺎﺭی ﺍﺯ ﺷﺮکتﻫﺎ ﺍﺯ ﺟﻤﻠﻪ ﺑﺎنکﻫﺎ ریزش مشتری است ﻭ ﺑﺎنکﻫﺎ ﺗﻮﺟﻪ ﺧﻮﺩ ﺭﺍ ﺑﺮ ﺣﻔﻆ ﻣﺸﺘﺮی ﻣﺘﻤﺮکز کردهاند، ﺯیرﺍ ﻫﺰینهﻫﺎی ﺟﺬﺏ یک ﻣﺸﺘﺮی ﺟﺪید ﺑﺴﯿﺎﺭ ﺑﯿﺸﺘﺮ ﺍﺯ ﻫﺰینهﻫﺎی نگهداری یک مشتری ﺍﺳﺖ. بنابراین، پیشبینی و الگوپردازی ریزش مشتریان دو دغدغه اقتصادی مهم برای بسیاری از شرکتهاست. روشهای مختلف یادگیری ماشین، برای این اهداف پیشنهاد شدهاند، اما انتخاب بهترین مدل برای انجام این دو امر، به دلیل وابستگی زیاد به ویژگیهای ذاتی دادههای ریزش، کار سادهای نیست. ﺩﺭ ﺍین مقاله، چندین ﺭﻭﺵ یادگیری ﻣﺎﺷﯿﻦ ﺑﺎ رویکردهای مختلف ﺑﺎﺯﻧﻤﻮﻧﻪگیری ﺑﺮﺍی ﻣﺘﻌﺎﺩﻝﺳﺎﺯی ﺩﺍﺩﻩﻫﺎ، ﺭﻭی ﺩﺍﺩﻩﻫﺎی ﺑﺎنک پیادهﺳﺎﺯی ﺷﺪﻩ ﺍﺳﺖ. ارزیابیها که براساس معیار سطح زیر منحنی و ﻧﺮﺥ ﻣﺜﺒﺖ ﺩﺭﺳﺖ گزارش شدهاند، تأثیر روشهای متعادلسازی و عملکرد روشهای مختلف یادگیری ماشین را بررسی میکند. در این مطالعه، مناسبترین روشها در زمینه ریزش به همراه یک فرآیند مؤثر مبتنی بر رویکرد ترکیبی و خوشهبندی معرفی شده است. این روشها میتواند به خدمات بازاریابی یا منابع انسانی در درک الگوهای رفتاری مشتریان و احتمال ریزش آنها کمک کند.