41 نتیجه برای رگرسیون
رضا پورموسی، نرجس گیلانی،
جلد 11، شماره 2 - ( 12-1396 )
چکیده
در این مقاله ابتدا به معرفی مدلهای رگرسیون پواسون آمیخته پرداخته و در ادامه به معرفی یک مدل جدید به نام رگرسیون پواسون-بیرنبام ساندرز با هدف لحاظ کردن مسئله بیشپراکنش در مدلبندی دادههای شمارشی پرداخته میشود.
از آنجا که توزیع بیرنبام ساندرز آمیختهای از دو توزیع گاوسی وارون تعمیمیافته است، لذا میتوان مدل معرفی شده دو پارامتری را تعمیمی بر مدلهای قبلی دانست که علاوه بر داشتن یک پارامتر کمتر نسبت به مدل رگرسیون پواسون گاوسی وارون تعمیمیافته، دارای شکل بسته در تابع جرم احتمال حاشیهای و گشتاورهای مربوطه است.
برای برآورد پارامترهای این مدل از الگوریتم EM استفاده و در نهایت کارایی این مدل نسبت به مدلهای موجود با استفاده از مطالعه شبیهسازی شده و یک مثال واقعی نشان داده شده است.
افشین فلاح، رامین کاظمی، حسن خسروی،
جلد 11، شماره 2 - ( 12-1396 )
چکیده
تحلیل رگرسیونی بهطور سنتی با فرض همگن بودن جامعه و نرمال بودن توزیع متغیر پاسخ صورت میپذیرد. این در حالی است که در بسیاری از کاربردها، بهدلیل ناهمگنی مشاهدات، وجود نقاط دور افتاده، چولگی یا ترکیبی از آنها، مشاهدات ساختاری ناهمگن با زیرجوامعی چوله-متقارن را نشان میدهند. در چنین حالاتی، میتوان آمیختهای متناهی از توزیعهای چوله-متقارن را برای مدلبندی جامعه مورد استفاده قرار داد. در این مقاله رهیافت بیزی تحلیل رگرسیونی تحت فرض ناهمگن بودن جامعه و چوله-متقارن بودن توزیع زیرجوامع، با استفاده از آمیختهای متناهی از توزیعهای چولهنرمال مورد توجه قرار گرفته است. به منظور ارزیابی رهیافت پیشنهادی و مقایسه آن با مدل فراوانیگرا، از یک مطالعه شبیهسازی و یک مثال کاربردی استفاده شده است.
عبدالرحمن راسخ، بهزاد منصوری، نرگس هدایت پور،
جلد 13، شماره 1 - ( 6-1398 )
چکیده
در تحلیل رگرسیونی مطالعه مباحث تشخیصی شامل تعیین مشاهدات مؤثر و نقاط پرت از اهمیت ویژهای برخوردار است. حساسیت روش کمترین توانهای دوم نسبت به حضور مشاهدات مؤثر و دادههای پرت در مدل موجب شد که گامی در جهت توسعه مباحث تشخیصی به منظور ارائه معیارهایی برای اندازهگیری تأثیر و شدت وابستگی به این مشاهدات برداشته شود. تعیین مشاهدات مؤثر و نقاط پرت در دادهها، زمانی که متغیرهای مستقل همخطی داشته باشند، بسیار پیچیده و مشکل است و خصوصاً اینکه حضور همخطی میتواند برخی از دادههای غیرعادی را پوشش دهد. یکی از روشهای مورد توجه برای تعیین مشاهدات پرت، روش انتقال میانگین است. در این مقاله، روش انتقال میانگین را برای برآوردگر ریج تحت محدودیتهای خطی تصادفی؛ که به منظور کاهش اثر همخطی استفاده شده، تعمیم داده و برای این برآوردگر آماره آزمون جهت شناسایی مشاهدات پرت ارائه خواهد شد. در نهایت توانایی این روش را با استفاده از یک مثال کاربردی از دادههای واقعی نشان داده میشود.
میثم مقیم بیگی، موسی گلعلیزاده،
جلد 13، شماره 1 - ( 6-1398 )
چکیده
با توجه به تعریف کندال از شکل بهعنوان نقطهای در فضای اَبَر کره، در این مقاله مدلبندی رگرسیونی شکل در این فضا مورد مطالعه قرار میگیرد. همچنین به منظور سهولت در مدلبندی، روش مثلثبندی شکل با استفاده از دو نقطه شاخص خاص پیشنهاد میشود که عملکرد مناسبی در مقایسه با رویکردهای دیگر دارد. مثلثبندی نهتنها مدلبندی رگرسیونی شکل را آسان مینماید بلکه توانایی بازسازی ساختار هندسی اشیاء با استفاده از ابزارهای ساده محاسباتی را دارد. نوآوری روش پیشنهادی مقاله حاضر در استفاده از متغیر تبینی مبتنی بر شکل اشیاء است که تغییرات هندسی متغیر پاسخ را بهخوبی توصیف میکند. مقایسه و ارزیابی روش پیشنهادی با مدل انطباق پروکراستس کامل بر اساس معیار مجموع توان دوم خطا انجام و عملکرد دو مدل در تحلیل دادههای پیکربندی جمجمه موشهای آزمایشگاهی مورد بررسی قرار میگیرد.
اعظم راستین، محمدرضا فریدروحانی،
جلد 13، شماره 2 - ( 12-1398 )
چکیده
روششناسی کاهش بعد بسنده یک راهکار مؤثر برای تسهیل در تحلیل رگرسیونی با دادههای با بعد بالاست. هنگامی که پاسخها سانسور شده باشند، برآوردگرهای موجود را نمیتوان بهکار برد یا به شرایط محدودکنندهای نیاز است. در این مقاله، برای کاهش بعد دادههای رگرسیونی سانسور شده غیرخطی، اصلاحی از روش رگرسیون وارون ورقه شده نوع دو پیشنهاد شده است. روش پیشنهادی، اولاً به هیچ مدل از پیش تعیین شدهای نیاز ندارد، ثانیاً اطلاعات کامل رگرسیونی را حفظ کرده و مجموعه کوچکی از ترکیب پیشگوها را ارائه میدهد که فرمولبندی مدل و پیشبینی براساس این مجموعه انجام میگیرد. در انتها عملکرد این روش، علاوه بر دادههای شبیهسازی شده، برای مجموعه دادههای واقعی سیروز صفراوی اولیه کبد مورد بررسی قرار گرفته و نتایج روش معرفی شده با روش رگرسیون وارون ورقه شده نوع یک مقایسه شده است.
مهدی روزبه، مرتضی امینی،
جلد 13، شماره 2 - ( 12-1398 )
چکیده
در تجزیه و تحلیل مسائل رگرسیونی و بهویژه مدل بندی آماری بسیاری از دادهها مانند دادههای اقتصادی، روانشناسی، علوم اجتماعی، علوم پزشکی، مهندسی و غیره با مشکل همخطی در میان متغیرهای پیشگو و حضور نقاط دورافتاده در مجموعه دادهها مواجه میشویم. در چنین مواقعی برآوردگر کمترین توانهای دوم معمولی منجر به برآوردگرهای نادقیق میشود. برای غلبه بر مشکل مشاهدههای دورافتاده از روشهای استوار استفاده میشود. همچنین برای حل مشکل همخطی چندگانه استفاده از رگرسیون مرزبندی شده توصیه میشود. از طرف دیگر در شرایطی که واریانس خطاها ناهمگن بوده یا خطاها دارای خودهمبستگی باشند، از روش کمترین توانهای دوم تعمیمیافته استفاده میشود. در این مقاله ابتدا یک الگوریتم سریع برای محاسبه برآوردگر کمترین توانهای دوم تعمیمیافته پیراسته مرزبندی شده محتمل در مدل رگرسیون نیمهپارامتری پیشنهاد شده و سپس با استفاده از شبیهسازی به روش مونت کارلو و یک داده واقعی، کارایی برآوردگرهای پیشنهادی سنجیده میشود.
محمود افشاری، ابوذر بازیاری، یگانه مرادیان، حمید کرمی کبیر،
جلد 14، شماره 2 - ( 12-1399 )
چکیده
در این مقاله، برآوردگرهای موجک تابع رگرسیون ناپارامتری بر اساس آستانههای مختلف تحت توزیع پیشین آمیخته و تابع زیان توان دوم خطا در فضای بسوف محاسبه شده است. همچنین با استفاده از شبیهسازی، بهینگی برآوردگرهای مختلف آستانه موجک شامل میانگین پسین، میانه پسین، عامل بیز، آستانه عام و آستانه قطعی مورد بررسی قرار گرفته است. نتایج نشان میدهد که برآوردگر آستانه قطعی، میانگین توان دوم خطای کمتری نسبت به سایر برآوردگرهای بدست آمده دارد.
زهرا خادم بشیری، علی شادرخ، مسعود یارمحمدی،
جلد 15، شماره 1 - ( 6-1400 )
چکیده
یکی از بحثهای چالشی در مدلهای رگرسیونی انتخاب مدل بهینه است، بدین شکل که چگونه میتوان متغیرهای توضیحی مهم و متغیرهای قابل اغماض را مشخص کرده و رابطه بین متغیر پاسخ و متغیرهای توضیحی را بهطور سادهتر بیان نمود. با توجه به محدودیتهای مربوط به انتخاب متغیر به روش کلاسیک نظیر انتخاب گام به گام، میتوان از روشهای رگرسیون تاوانیده استفاده کرد. یکی از مدلهای رگرسیون تاوانیده، مدل رگرسیونی لاسو است که در آن فرض میشود خطاها از توزیع نرمال پیروی میکنند. در این مقاله، مدل رگرسیون لاسو بیزی با خطایی با توزیع نامتقارن و وجود متغیرهای توضیحی از بعد بالا معرفی میشود. سپس با شبیهسازی و تحلیل دادههای واقعی، عملکرد مدل پیشنهادی مورد بحث و بررسی قرار میگیرد.
مجتبی زینعلی، احسان بهرامی سامانی،
جلد 15، شماره 1 - ( 6-1400 )
چکیده
این مقاله با هدف مدلبندی توأم دادههای شمارشی طولی تعداد سلولهای CD4 و زمان تا رخداد مرگ در افراد مبتلا به HIV مبتنی بر مدل زمان شکست شتابیده پایه ریزی شده است. برای مدلبندی پاسخ شمارشی طولی، از مدل رگرسیون آمیخته خطی تعمیمیافته تحت خانواده توزیعهای سری توانی استفاده شده است و برای دادههای زمان تا رخداد پیشامد، مدل پارامتری زمان شکست شتابیده تحت توزیع وایبل در نظر گرفته شده است. این دو پاسخ از طریق اثرات تصادفی همبسته با توزیع نرمال به یکدیگر مرتبط میشوند. فرض میشود پاسخهای طولی و زمان تا رخداد به شرط اثرات تصادفی و متغیرهای کمکی مستقل هستند. در نظر گرفتن تعداد صفر زیاد برای دو پاسخ و مکانیسم سانسور از راست، مدل توأمی را تولید کرده است که تاکنون توسط محققان دیگر مورد بررسی قرار نگرفته است. پارامترهای مدل توأم نیز با روشهای مونت کارلوی زنجیر مارکوفی برآورد شدند.
جلال چاچی، علیرضا چاجی،
جلد 15، شماره 1 - ( 6-1400 )
چکیده
در این مقاله رویکرد جدیدی در برآورد پارامترهای مدل رگرسیون خطی کمترین قدرمطلق انحرافات معرفی میشود که مبتنی بر مسائل بهینهسازی بر مبنای الحاق وزنی قدرمطلق انحرافات مرتب شده است. الحاق وزنی قدرمطلق انحرافات برازش مرتب شده در مساله بهینهسازی در حالی که توابع نیکویی برازش مختلفی را بطور همزمان در مساله مدلسازی در نظر میگیرد، توانایی تحلیل دادهها به منظور شناسایی نقاط دورافتاده را نیز فراهم میکند. بر این اساس این رویکرد تحت تاثیر مشاهدات دورافتاده قرار نمیگیرد و در هر مساله متناسب با تعداد مشاهداتی که پتانسیل دورافتاده بودن را دارا هستند، به انتخاب بهترین برآوردگر مدل با بهینهترین مقدار نقطه شکست در بین مجموعهای از برآوردگرهای کاندید دیگر میپردازد. نیکویی برازش رویکرد پیشنهادی در مدلسازی دادههای شبیهسازی شده و دادههای واقعی در مهندسی آب با حضور مشاهدات دورافتاده تحلیل شده است. همچنین در انتها به تحلیل حساسیت برآوردگرها شامل بررسی معیارهای نااریبی و کارایی برآوردگرها پرداخته شده است.
زهرا رحیمیان آزاد، افشین فلاح،
جلد 15، شماره 1 - ( 6-1400 )
چکیده
این مقاله میانگینگیری بیزی مدلهای رگرسیونی گاوسی وارون را برای تحلیل رگرسیونی در شرایطی که مشاهدات پاسخ مثبت و چوله به راست هستند، مورد توجه قرار میدهد. چالشهای محاسباتی مربوط به کمیتهای لازم برای اجرای این روش و چگونگی غلبه بر آنها، مورد بحث قرار گرفته است. یک جنبه جالب روش پیشنهادی آن است که با در نظر گرفتن توزیعهای پیشین مناسب، نمایشهای بستهای برای کمیتهای پسینی مورد علاقه فراهم آورده شده است. روش پیشنهادی در قالب یک مطالعه شبیهسازی مورد ارزیابی قرار گرفته و چگونگی کاربست آن در مسائل کاربردی، بهوسیله یک مثال واقعی مربوط به مطالعات زلزلهشناسی، شرح داده شده است.
احد ملک زاده، اصغر اسمعیلی عیان، سید مهدی محمودی،
جلد 15، شماره 1 - ( 6-1400 )
چکیده
مدل داده پانلی در بسیاری از شاخههای علمی همانند اقتصاد، علوم اجتماعی، پزشکی و اپیدمیولوژی مورد استفاده قرار میگیرد. در دهههای گذشته، استنباط روی ضرایب رگرسیون در مدلهای داده پانلی توسعه یافته است. در این مقاله، به معرفی روشهایی به منظور انجام آزمون فرضیه برابری مدل پانلی در بین گروههای موجود در مجموعه دادههای پانلی پرداخته میشود. ابتدا یک کمیت تصادفی معرفی میشود که توزیع آن را به دو روش تقریب و بوت استرپ پارامتری برآورد خواهد شد. همچنین یک کمیت محوری برای انجام این آزمون فرضیه معرفی میشود. در یک مطالعه شبیهسازی، رویکردهای پیشنهادی با روش موجود بر اساس خطای نوع اول و توان آزمون مورد مقایسه قرار میگیرد. همچنین مجموعه دادههای پانل بنزینی با روش ارائه شده مورد تحلیل قرار میگیرد.
زهرا زندی، حسین بیورانی،
جلد 16، شماره 2 - ( 12-1401 )
چکیده
این مقاله برآوردگرهای انقباضی نوع-لیو را برای ضرایب مدل رگرسیونی خطی با حضور همخطی چندگانه تحت اﻃﻼﻋﺎت زیﺮﻓﻀﺎ پیشنهاد میدهد. عملکرد برآوردگرهای معرفی شده از نظر کارایی نسبی آنها از طریق شبیهسازی مونت کارلو و یک مجموعه داده واقعی با برآوردگر نوع-لیو مقایسه میشود. نتایج آشکار میکنند که برآوردگرهای معرفی شده نسبت به برآوردگر نوع-لیو عملکرد بهتری دارند.
میثم مقیم بیگی،
جلد 16، شماره 2 - ( 12-1401 )
چکیده
در این مقاله یک مدل رگرسیون لوژستیک چند جملهای نیمه پارامتری برای ردهبندی پیکربندیهای برچسبدار معرفی شده است. در مدل رگرسیونی متغیر تبینی تابع هستهای است که با استفاده از معیار توان-واگرایی بهدست آمده است. همچنین متغیر پاسخ بهصورت رستهای بوده و رده هر پیکربندی را نشان میدهد. این مدل رگرسیونی نیمه پارامتری بر اساس فواصل تعریف شده در فضای شکل معرفی شده و به همین دلیل میزان ردهبندی درست اشکال با استفاده از این روش در مقایسه با روشهای پیشین بهبود یافته است. عملکرد این مدل در قالب یک مطالعه شبیهسازی مورد بررسی قرار گرفته است. در انتها نیز کاربردی از این روش در ردهبندی دو مجموعه داده واقعی به نمایش گذاشته شد. همچنین روش ارائه شده در این مقاله با روشهای معرفی شده در نوشتگان مقایسه گردید که نشان از عملکرد مناسب این روش در ردهبندی پیکربندیها دارد.
آقای آرتا روحی، خانم فاطمه جهادی، دکتر مهدی روزبه، دکتر سعید زالزاده،
جلد 17، شماره 1 - ( 6-1402 )
چکیده
تحلیل دادههای با بعد بالا با استفاده از روشهای رگرسیون کلاسیک انجام پذیر نیست و ممکن است نتایج آن گمراه کننده باشد.
در این تحقیق سعی شده است با معرفی تکنیکهای جدید و قدرتمندی مانند رگرسیون بردار پشتیبان، رگرسیون تابعی، رگرسیون ستیغی و لاسو، به واکاوی اینگونه دادهها پرداخته شود. در این راستا، با تحلیل دو مجموعه داده بعد بالا (دادههای مربوط به تولید ریبوفلاوین و شبیهسازی شده) با روشهای معرفی شده، به ارزیابی کاراترین مدل با استفاده از سه معیار (مجذور همبستگی، میانگین توان دوم خطا و میانگین انحراف درصد خطای مطلق) با توجه به نوع دادهها پرداخته میشود.
ساره حدادی، جواد اطمینان،
جلد 17، شماره 2 - ( 12-1402 )
چکیده
مدلبندی و برآوردی کارا از تابع روند در برآورد تغییرنگار و پیشگویی دادههای فضایی از اهمیت بالایی برخوردار است. در این مقاله برای مدلبندی تابع روند از روش رگرسیون بردار پشتیبان استفاده شده است. سپس دادهها روندزدایی شده و برآورد تغییرنگار و پیشگویی انجام میشود. بر روی یک مجموعه داده واقعی، نتایج پیشگویی حاصل از روش پیشنهادی با روش پیشگویی اسپلاین و کریگیدن از طریق اعتبارسنجی متقابل مقایسه شده است. کمینه بودن ریشه دوم میانگین توانهای دوم خطا معیار انتخاب روش مناسب پیشگویی است. نتایج پیشگویی برای چند موقعیت با مقادیر معلوم که بنا به دلایلی از مجموعه دادهها کنار گذاشته شدهاند و برای موقعیتهای جدید بهدست آمدهاند. نتایج بیانگر دقت بالای پیشگویی با روش پیشنهادی نسبت به کریگیدن و اسپلاین است.
خانم فروزان جعفری، دکتر موسی گلعلی زاده،
جلد 17، شماره 2 - ( 12-1402 )
چکیده
مدل اثرهای آمیخته از جمله ابزارهای قوی آماری است که برای مدلبندی ارتباط بین متغیر پاسخ و متغیرهای تبیینی در تحلیل دادههایی با ساختار سلسله مراتبی بهکار میرود. زمانیکه توزیع خطاها غیر نرمال باشد، برآوردگرهای بهدست آمده در این مدلها با استفاده از هر یک از روشهای کمترین توان دوم خطاها و ماکسیمم درستنمایی از کارایی لازم برخوردار نیستند. در اینگونه مواقع میتوان از مدل رگرسیون چندکی آمیخته بهعنوان جایگزین استفاده کرد. بهعلاوه، زمانیکه تعداد متغیرهای مورد بررسی در این نوع مدلبندی افزایش مییابد، رگرسیون چندکی آمیخته تاوانیده یکی از بهترین روشها برای افزایش دقت پیشگویی و تفسیرپذیری مدل است. در این مقاله با در نظر گرفتن توزیع لاپلاس نامتقارن برای اثرهای تصادفی، یک مدل تاوانیده دوگانه به عنوان تابعی همزمان از اثرهای تصادفی و پارامترهای مدل پیشنهاد میشود. سپس، عملکرد روش پیشنهادی با استفاده از مطالعه شبیهسازی آماری مورد ارزیابی قرار گرفته و بحث راجع به نتایج حاصل به همراه مقایسه با برخی مدلهای رقیب ارائه میشود. بهعلاوه، کاربستی از آن در تحلیل یک مثال واقعی نمایش داده خواهد شد.
مریم مالکی، حمید رضا نیلی ثانی، محمد قاسم اکبری،
جلد 18، شماره 2 - ( 12-1403 )
چکیده
در این مقاله، موضوع طبقهبندی دادهها مدنظر قرار داده میشود که در آن متغیر پاسخ بهصورت دو یا چند ارزشی و متغیرهای پیشگو متغیرهای معمولی هستند اما، خطاها علاوه بر ماهیتی تصادفی، ماهیتی ابهامی نیز دارند. در این صورت متغیر پاسخ نیز متغیر تصادفی فازی است. بر این اساس مدلی بر پایه رگرسیون لوژستیک صورتبندی کرده و برآورد ضرایب با استفاده از روش کمترین توانهای دوم بدست آورده میشود. با یک مثال نتایج حاصله برای حالت یک متغیر مستقل تشریح میگردند. در پایان روابط بازگشتی برای محاسبه برآورد پارامترها ارائه میشوند. این روابط بازگشتی میتوانند در یادگیری ماشین و برای طبقهبندی دادههای بزرگ مورد استفاده قرار گیرند.
محمد مهدی صابر، محسن محمدزاده،
جلد 18، شماره 2 - ( 12-1403 )
چکیده
توزیع لاپلاس چندمتغیره یک مدل تصادفی مهم است که عدم تقارن و دمهای سنگینتر از توزیع گاوسی را به حساب میآورد. در این مقاله، مدل رگرسیون فضایی خودبازگشتی و میانگین متحرک مرتبه دو برای مدلبندی برآمدهای یک میدان تصادفی فضایی که از توزیع چوله-لاپلاس تعمیمیافته چندمتغیره پیروی میکنند ارائه خواهد شد. پارامترهای مدل با روشهای ماکسیمم درستنمایی و حداکثر فاصله و استفاده از معیار واگرایی کولبک-لایبلر برآورد میشوند. آنگاه براساس مدل ارائه شده پیشگوی فضایی بهینه ارایه خواهد شد. سپس یک مطالعه شبیهسازی برای اعتبارسنجی و ارزیابی عملکرد مدل پیشنهادی انجام میشود. آنگاه نحوه کاربست این مدل در تحلیل مجموعه دادههای واقعی زمینشناسی نشان داده میشود.
فرزانه هاشمی،
جلد 18، شماره 2 - ( 12-1403 )
چکیده
یکی از پرکاربردترین مباحث آماری، مسایل رگرسیونی است. در مسایل رگرسیونی فرض اساسی بر روی خطاها، نرمال بودن آنهاست که این فرض در برخی موارد به سبب وجود ویژگیهای عدم تقارن یا مکانهای شکست در دادهها برقرار نمیباشد. مدل رگرسیون تکهای یکی از راههای برون رفت در شرایط نرمال نبودن خطاهاست که بهطور گسترده در حوزههای مختلفی به کار گرفته شدهاند، که در آنها تشخیص نقطه شکست مهم است و مکانهای شکست در مدلهای رگرسیون تکهای برای دانستن زمان و چگونگی تغییر الگوی ساختار داده ضروری است. یکی از مشکلات عمده در این دادهها وجود دم سنگینی است که با استفاده از برخی توزیعها که به عنوان تعمیمی از توزیع نرمال هستند این مشکل برطرف شده است. در این مقاله بر اساس توزیع مخلوط مقیاسی نرمال، مدل رگرسیونی تکهای مورد بررسی قرار خواهد گرفت که میتوان به جای نرمال با به کار گیری تعمیمهایی از توزیع نرمال این مشکل را برطرف نمود. همچنین این مدل با مدل رگرسیون تکهای استاندارد که برگرفته از خطاهای نرمال است مورد مقایسه قرار خواهد گرفت.