سیری در مفهوم مدل سازی در داده کاوی

سیری در مفهوم مدل سازی در داده کاوی


  • 1,934 بازدید

به طور معمول کلیه الگو های تولید شده توسط الگوریتم برای کاربر مفید نیست و تنها کسر کوچکی از این الگوها می‌توانند برای تحلیل گر و کاربرد جالب باشند و نظر آنها را جمع کنند.

مفهوم مدل سازی در داده کاوی

در این راستا سه سؤال اساسی مطرح می شود. چه چیزی باعث آن میشود که ما یک الگو را جالب  بدانیم ؟  آیا یک روش داده کاوی قادر به تولید تمام الگوهای جالب هست ؟ آیا یک الگوریتم داده کاوی می تواند فقط الگوهای بدردبخور و جالب را تولید کند ؟
معمولا ما الگوهایی را جالب می دانیم که :
- توسط انسان به راحتی قابل فهم باشند.
- درستی آن با درجه ای از قطعیت برای داده های جدید تضمین شده باشد.
- مفید و بدیع باشند.
- برای فرضیه های تعریف شده توسط کاربر معتبر باشند.

چه چیزی داده کاوی نیست؟ || داده کاوی چیست؟ ||  آموزش ابزارِ داده کاوی رپیدماینر

اما سؤال مهم این است که خصوصیاتی چون قابل فهم بودن یا سودمند و بدیع بودن الگو چگونه اندازه گیری می شود ؟ در هر یک از روش های داده کاوی معیارهایی معرفی می شوند تا این مفاهیم را بتوان محاسبه نمود و رتبه ای برای الگوهای به دست آمده متصور شد.
جهت پاسخ به سؤال دوم که آیا یک روش داده کاوی قادر به تولید تمام الگوها هست یا خیر ، باید گفت که این موضوع که یک سیستم داده کاوی تمام الگوهای ممکن را تولید کند، نه کار آمد است و نه واقع بینانه. در مقابل هر کاربر به معرفی محدودیت ها و معیارهایی می پردازد، تا الگوریتم به تولید برخی از آنها اکتفا کند. در بسیاری از موارد فضای جستجوی الگوها آنقدر وسیع است که تولید کلیه الگوها چنانچه امکان پذیر هم باشد، بصورت قابل توجهی زمانبر خواهد بود.
اما سؤال سوم که آیا الگوریتم می تواند فقط الگوهای جالب توجه کاربر را تولید کند، اگر چنین باشد که بسیار دلخواه و مطلوب است و در واقع هدف غایی کاربر این است که تنها تعداد محدود و خاصی از الگوها تحت عنوان الگوهای جالب در خروجی قرار گیرند. اما سیستم ها در رسیدن به این هدف با چالش های بسیار زیادی روبه رو هستند.

آموزش گام به گام داده کاوی با رپید ماینر، اسماعیلی

مقالات مفید فارسی در حوزه داده کاوی

اگر به پژوهش در حوزه داده کاوی علاقه مند هستید توصیه می شود حتما مجموعه بی نظیر پانصد مقاله فارسی در زمینه داده کاوی  و مجموعه های مشابه آن  و مقالات مرتبط با کاربرد داده کاوی در پیش بینی بیماری را تهیه بفرمایید.

اگر در زمینه متن کاوی در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام (https://t.me/dataacademyحضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد.  

افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.