در این سلسله مقالات به مفاهیم و کاربرد های دادهکاوی، متن کاوی و علوم مرتبط با علم داده پرداخته میشود. با توجه به حجم عظیم مقالات تولید شده در زبان فارسی در حوزه داده کاوی و علم داده، آکادمی داده تصمیم گرفت مقالات فارسی منتشر شده در این حوزه را خلاصه برداری کرده و در اختیار علاقه مندان قرار دهد. این مقالات ابتدا با معرفی موضوع و کارهای انجام شده آغاز می شود و سپس مجموعه داده یا دیتاست تحقیق ارائه می شود و سپس پیاده سازی انجام شده در رپیدماینر، وکا یا پایتون ارائه شده و نتایج تحلیل می شود.
در این رشته نوشته ها ابتدا خلاصه ای از مقاله ارائه شده و سپس نتیجه گیری مقاله عینا آورده می گردد و سپس فایل پی دی اف آن نیز برای دانلود در اختیار محققین و پژوهشگران عزیز قرار می گیرد.
آموزش ابزارِ داده کاوی رپیدماینر
معرفی منابع برای یادگیری داده کاوی
هیچ کدام از روش ها به تنهایی قادر به شناسایی تمامی انواع تقلب ها نیستند و هرکدام برای شناسایی نوع خاصی از تقلب مناسب هستند، به همین دلیل در بیشتر مراجع یاد شده از چندین روش و نیز ترکیب آن ها استفاده شده و تنها در شمار بسیار کمی ازآن ها از یک روش به تنهایی استفاده شده است. تقلب در کارت های اعتباری از جمله تقلب ورشکستگی، کارت گمشده / دزدی، تقلب درخواست، کنترل حساب، جعل کارت، تبانی فروشنده و تقلب های اینترنتی تشریح و سپس انواع روش های داده کاوی برای شناسایی تقلب در کارت های اعتباری مانند شبکه های عصبی ، برپایه قوانین، درخت تصمیم، شبکه های بیزین، خوشه ای، آماری، الگوریتم های ژنتیک، منطق فازی رگرسیون، جنگل تصادفی بررسی شده است.
برای افزایش دقت، ترکیبی از تکنیک های داده کاوی درخت های تصمیم گیری، شبکه های عصبی، شبکه های باور بیزی،K نزدیک ترین همسایه را به کار می گیریم. سپس از روش الگوریتم انجمنی استفاده نموده تا نتیجه ی آن را با داده های مشکوك بدست آمده مقایسه کنیم و آن هایی که در هر دو لیست وجود دارند را به عنوان داده های مشکوك معرفی میکنیم. دلیل استفاده از این روش ترکیبی به این خاطر بوده است که هر کدام از این روش ها در تمام زمینه ها به کار رفته است و نتیجه عملکرد آن ها نسبت به روش های دیگر بهتر است.
در بررسی انجام شده روش بیزین از نظر سرعت از روشهای دیگر بالاتر است و در رتبه های بعدی به ترتیب -kمیانگین، درخت تصمیم و شبکه عصبی قرار دارد. از نظر دقت در کشف تقلب روش بیزین در رتبه اول قرار دارد و سپس شبکه عصبی و درخت تصمیم قرار دارند.
از شبکه عصبی، درخت تصمیم، k نزدیکترین همسایه و خوشه ای و فازی زیاد استفاده شده است. الگوریتم جنگل تصادفی روش خوبی برای کشف تقلب است. پیاده سازی درخت تصمیم آسان است اما برای نمایش همه شاخه های ان ضعیف است. ترکیب شبکه عصبی با رگرسیون منطقی دقت را بالا می برد. وترکیب k- میانگین و منطق فازی دقت مدل بدست امده تا 99 درصد بهبود بخشید. سرعت و دقت شبکه بیزین از k-میانگین و شبکه عصبی و درخت تصمیم بیشتر است. برای کشف تقلب از ترکیب روش ها استفاده می کنیم ترکیب 3 الگوریتم ژنتیک، k نزدیکترین همسایه و شبکه بیزین باعث کاهش نرخ خطا و افزایش دقت می شود.
این مقاله از طریق لینک قابل دسترسی است و محققین علاقه مند می توانند آن را به صورت رایگان دریافت نمایند.
اگر به دنبال مجموعه مقالات فارسی در موضوعات مختلف هستید به لینک مراجعه بفرمایید. در این لینک مجموعه مقالات فارسی در حوزه های مختلف داده کاوی و متن کاوی ارائه شده است.
اگر به پژوهش در حوزه کشف تقلب در بانکداری علاقه مند هستید توصیه می شود حتما مجموعه جالب و بی همتای هفتاد مقاله فارسی در زمینه کشف تقلب در بانکداری و کشف تقلب مالی را تهیه بفرمایید.
اگر در زمینه کشف تقلب در بانکداری در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید. آکادمی داده در تلگرام (https://t.me/dataacademy) حضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد.
افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.