چگونه و چرا باید زیر مجموعه ای از ویژگیها را در داده کاوی انتخاب کرد ؟

چگونه و چرا باید زیر مجموعه ای از ویژگیها را در داده کاوی انتخاب کرد ؟


  • 1,059 بازدید

انتخاب زیر مجموعه ای از ویژگی ها برای رسیدن به هدف کاهش ابعاد انجام می گیرد.
در این مفهوم بر این اعتقاد هستیم که کاهش ابعاد باعث تقویت مدل می شود.
به طور مثال ویژگی های زائد می تواند حذف گردد. تصور کنید، ویژگی قیمت یک محصول و میزان مالیات محصول دو ویژگی در یک مجموعه داده هستند در حالی که می توان یکی از این دو را حذف کرد و ویژگی مالیات محصول از طریق قیمت محصول محاسبه کرد و لزومی ندارد در دو ویژگی در مجموعه داده ذخیره گردد.
در کنار آن در برخی موارد ویژگی های نامرتبط و به درد نخود وجود دارد که می تواند حذف شود. به طور مثال برای محاسبه معدل دانشجویی نیازی به ویژگی شماره دانشجویی نیست.
روش های بسیاری برای انتخاب زیر مجموعه ای از ویژگی ها وجود دارد از جمله :
رویکردهای سخت گیرانه
تعبیه شده
فیلتر
همپوشانی
انتخاب زیر مجموعه ای از ویژگی ها برای ایجاد مدل طبقه بندی تاثیر بسیاری در رسیدن به مدل طبقه بندی قویتر دارد و یکی از مؤثرترین مراحل داده کاوی است.

کپی برداری بدون ذکر منبع، بر اساس قانون جرائم اینترنتی و مادۀ 12 فصل سوم قانون جرائم رایانه ای غیر قانونی بوده و مجازات جزای نقدی و حبس دارد و شرعا نیز حرام است! 
اگر در زمینه َداده کاوی در حال تحقیق یا پیاده سازی پروژه تجاری یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام، واتزآپ و تمامی پیام رسان های ایرانی(سروش، آی گپ، بله و ویسپی) با شماره 09120637751 حضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد. 


افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.