|
|
|
 |
جستجو در مقالات منتشر شده |
 |
|
4 نتیجه برای رضائی قهرودی
زهرا رضائی قهرودی، حسن رنجی، علیرضا رضایی، جلد 15، شماره 1 - ( 6-1400 )
چکیده
در اکثر آمارگیریها، پرسش مشاغل و فعالیتها از طریق پرسشهای باز سوال میشود و کدگذاری این اطلاعات به هزاران رده به روش دستی صورت میگیرد که بسیار زمانبر و پرهزینه است. با توجه به ضروریات مدرنسازی نظام آماری کشورها، امروزه استفاده از روشهای یادگیری آماری در آمار رسمی برای دادههای اولیه و ثانویه ضروری است. همچنین، روشهای ردهبندی یادگیری آماری در فرایند تولید آمار رسمی بسیار کاربرد دارد. هدف این مقاله، کدگذاری برخی فرایندهای آمارگیریها با روشهای یادگیری آماری و آشنایی مدیران در مورد امکان استفاده از روشهای یادگیری آماری در تولید آمارهای رسمی است. دو کاربرد از روشهای یادگیری آماری ردهبندی شامل کدگذاری خودکار رشته فعالیتهای اقتصادی و کدگذاری پرسشهای باز پرسشنامههای مراکز آماری با چهار روش تکرار، روش ترکیبی ماشین بردار پشتیبان با ترکیب مدلها در سطوح مختلف تجمیع، ترکیب روش تکرار و ماشین بردار پشتیبان و روش نزدیکترین همسایه روی دادههای آمارگیری از کارگاههای صنعتی ایران انجام شده است.
زهرا رضائی قهرودی، ژینا آقامحمدی، جلد 16، شماره 1 - ( 6-1401 )
چکیده
با ظهور مِهدادهها در دو دهۀ گذشته، به منظور بهرهبرداری و استفاده از این نوع دادهها، نیاز به یکپارچهسازی پایگاهدادهها با هدف تصمیمگیری براساس شواهد و اطلاعات قویتر، بیش از پیش احساس میشود. لذا آشنایی با روششناسی اتصال رکوردی به عنوان یکی از روشهای یکپارچهسازی دادهها و همچنین استفاده از روشهای یادگیری ماشین برای سهولت فرآیند اتصال رکوردها ضروری است. در این مقاله، ضمن تشریح فرایند اتصال رکوردی و برخی روشهای مرتبط با آن، با استفاده از روشهای یادگیری ماشین، برای افزایش سرعت یکپارچهسازی پایگاهدادهها، کاهش هزینه و بهبود عملکرد اتصال رکوردی، دو پایگاهدادۀ چارچوب کارگاههای صنعتی مرکز آمار ایران و سازمان تامین اجتماعی به یکدیگر متصل شدهاند.
علیرضا موفقی اردستانی، دکتر زهرا رضائی قهرودی، جلد 17، شماره 1 - ( 6-1402 )
چکیده
امروزه با دسترسی روزافزون به پایگاههای دادۀ اداری و حجم بالای دادههای ثبتشده در سازمانها، روشهای سنتی گردآوری و تحلیل دادهها به دلیل بار پاسخگویی بالا کارایی لازم را ندارند. بر این اساس، گذار از روشهای گردآوری سنتی به روشهای مدرن گردآوری و تحلیل دادهها با رویکرد آمارهای ثبتیمبنا بیش از پیش مورد توجه تحلیلگران دادهها قرار گرفته است. در روشهای ثبتیمبنا، ایجاد یک پایگاه دادۀ یکپارچه از طریق اتصال رکوردهای پایگاههای دادۀ دستگاههای مختلف اهمیت ویژهای دارد. بسیاری از الگوریتمهای اتصال رکوردی بر پایهٔ مدل فلگی و سانتر توسعه یافته است. یکی از نقصهای مدل فلگی-سانتر این است که به درون اطلاعات موجود در مقادیر متغیرها نفوذ نمیکند و مقادیر متغیرهای رشتهای (رایج بودن یا نادر بودن مقدار ویژگی موردنظر) در آن اهمیت ندارد. در این مقاله به معرفی روشی پرداخته میشود که بتواند با اصلاح وزنهای جورسازی مدل فلگی-سانتر، این تفاوتها را در مقادیر یک متغیر رشتهای در مدل فلگی-سانتر القا کند. از طرف دیگر، مدلی که فلگی و سانتر پیشنهاد دادهاند و روشی که برای تعدیل وزنهای جورسازی در اتصال فراوانیمبنای رکوردها معرفی میشود، بر اساس فرض استقلال شرطی بنا شدهاند. در برخی مسائل اتصال رکوردی، در تطابق و عدم تطابق میان متغیرهای مشترک مورد استفاده در جورسازی، فرض استقلال شرطی برقرار نیست. یک راهکار مورد استفاده در چنین حالتی، استفاده از مدل لگ-خطی است که امکان وجود اثرات متقابل میان متغیرهای جورسازی در مدل را فراهم میکند.
در این مقاله به دو روش تعمیم مدل فلگی ‐سانتر، یکی با رویکرد اصلاح وزنهای جورسازی و دیگری با رویکرد مدل لگخطی با حضور اثرات متقابل میان متغیرهای اتصالدهنده در شرایطی که فرض استقلال شرطی برقرار نباشد، پرداخته میشود. روشهای معرفی شده برای اتصال رکوردی در این مقاله، روی مجموعهدادههای نیروی کار مرکز آمار ایران با استفاده از نرمافزار R پیادهسازی شدهاند.
مهرداد قادری، زهرا رضائی قهرودی، مینا گندمی، جلد 19، شماره 1 - ( 6-1404 )
چکیده
نحوه برخورد با دادههای گمشده یکی از مسائلی است که اغلب محققان با آن روبرو هستند. جانهی چندگانه با استفاده از معادلههای زنجیرهای یکی از رایجترین و انعطافپذیرترین روشها برای جانهی است. از دیدگاه تئوری، هر مدل جانهی میتواند برای پیشبینی مقادیر دادههای گمشده استفاده شود اما اگر مدلهای پیشگویی نادرست باشند میتواند منجر به برآوردهای اریب و استنباطهای نامعتبر شود. یکی از جدیدترین راهحلها برای برخورد با دادههای گمشده، روش ترکیبی یادگیری ماشین و ابریادگیرنده است. در این مقاله، چند شبیهسازی برای نشان دادن رویکرد بهتر این روش از نظر اریبی کمتر و همگرایی بهتر برآورد پارامتر نهایی نسبت به روشهای جانهی رایج ارائه شده است. همچنین، به پیادهسازی برخی روشهای یادگیری ماشین و یک الگوریتم ترکیبی از ابریادگیرنده، روی دادههای کارگاههای صنعتی پرداخته شده است که در آن جانهی متغیرهای مختلف در دادهها بهطور همزمان صورت میگیرد. همچنین به ارزیابی روشهای مختلف و معرفی روش دارای عملکرد برتر، پرداخته شده است.
|
|
|
|
|
|
|