دادهکاوی برای مشتریان معتبر کارت اینترنتی با استفاده از ابزارهای دادهکاوی می باشد
این محصول به صورت کامل شامل گزارش ورد و همچنین تمام کدهای مورد استفاده شده میباشد
تمام کدنویسی های موجود در این پژوهش با زبان برنامه نویسی R میباشد
در این پژوهش، از دادههای مشتریان کارت اعتباری یک بانک، برای پیشبینی معتبر و یا نامعتبر بودن مشتریان استفاده شد. با توجه به حجم زیاد دادهها از نظر ابعاد (مشخصهها) و مشاهدات، روشهای انتخاب متغیر رگرسیون لاسو، رگرسیون ریج، رگرسیون الاستیک نت و روش گام به گام مورد استفاده قرار گرفتند که روش رگرسیون الاستیک نت به دلیل خطای کمتر نسبت به سایر روشها برای انتخاب متغیرها مورد استفاده قرار گرفت.
همچنین برای شناسایی نقاط اهرم و تاثیرگذار به ترتیب از روشهای ماتریس کلاه و فاصله کوک استفاده شد، که نتایج نشان داد هیچ دادهی اهرم و تاثیرگذاری در مجموعه داده وجود ندارد. برای انجام پیشبینی نیز، طبقهبندهای درخت تصمیم، جنگل تصادفی، بیزی ساده، k-نزدیکترین همسایگی، ماشین بردار پشتیبان، شبکه عصبی مصنوعی و رگرسیون لجستیک برای داده کاوی کامورد استفاده قرار گرفتند که روش ماشین بردار پشتیبان نرخ صحت بیشتری نسبت به سایر روشها داشت.
شکل ۱، رگرسیون ریج
در این محصول، رویکردهای زیر مورد استفاده قرار گرفتهاند:
پیشپردازش مجموعه داده
معرفی مجموعه داده
دادههای گمشده
نرمالسازی
رگرسیون ریج
رگرسیون لاسو
رگرسیون الاستیک نت
شناسایی نقاط اهرم و تاثیرگذار
درخت تصمیم
جنگل تصادفی
k-نزدیکترین همسایگی
رگرسیون لجستیک
بیزی ساده
شبکه عصبی مصنوعی
ماشین بردار پشتیبان
ali farhadi
در تاریخ
بسیار عالی. خیلی ممنون از سایت خوب شما