در این سلسله مقالات به مفاهیم و کاربرد های دادهکاوی، متن کاوی و علوم مرتبط با علم داده پرداخته میشود. با توجه به حجم عظیم مقالات تولید شده در زبان فارسی در حوزه داده کاوی و علم داده، آکادمی داده تصمیم گرفت مقالات فارسی منتشر شده در این حوزه را خلاصه برداری کرده و در اختیار علاقه مندان قرار دهد. این مقالات ابتدا با معرفی موضوع و کارهای انجام شده آغاز می شود و سپس مجموعه داده یا دیتاست تحقیق ارائه می شود و سپس پیاده سازی انجام شده در رپیدماینر، وکا یا پایتون ارائه شده و نتایج تحلیل می شود.
در این رشته نوشته ها ابتدا خلاصه ای از مقاله ارائه شده و سپس نتیجه گیری مقاله عینا آورده می گردد و سپس فایل پی دی اف آن نیز برای دانلود در اختیار محققین و پژوهشگران عزیز قرار می گیرد.
آموزش ابزارِ داده کاوی رپیدماینر
معرفی منابع برای یادگیری داده کاوی
مجموعه داده های آموزشی این تحقیق حاوی 22 نوع حمله متفاوت بوده است که تمامی این حملات در چهار دسته dos ،probe ، u2r و r2l قرار گرفته اند. این مجموعه داده در حدود 500 هزار رکورد ( 10 % مجموعه داده اصلی ) و 41 متغیر بوده است. ویژگی اصلی این مجموعه داده این است که تعداد رکوردهایی که از حمالت مختلف یا تعداد رکوردهای نرمال وجود دارند دارای فراوانی های مختلف می باشند که به همین علت مدلسازی بر روی این مجموعه داده ها را جذاب تر می نماید.
در این تحقیق دو هدف اصلی در مدلسازی مورد نظر بوده است. نكته اول این است که با توجه به تعداد زیاد متغیرها از روش کاهش بعد به منظور کاهش تعداد متغیرها استفاده گردید. از طرفی دیگر از روشهای خوشه بندی به منظور گروه بندی مجموعه داده ها استفاده گردید. هدف از خوشه بندی ابتدایی داده ها پیدا کردن رکوردهای نظیر یكدیگر بوده است تا بدین ترتیب تمایز بین مقادیر مربوط به متغیرهای هر رکورد را تا حد امكان کاهش داده تا بدین ترتیب روشهای رده بندی راحتتر بتوانند بر اساس این تمایزات داده ها را رده بندی نمایند. البته در این بین چرخه کاهش بعد و سپس خوشه بندی به منظور رسیدن به رکوردهای همسان تر دو بار تكرار گردید.
در نهایت با استفاده از 7 مدل پایه و جمعی بر روی داده های موجود در هر خوشه رده بندی صورت گرفت و مدل بوستینگ شبكه های عصبی در پیش بینی رده های موجود در مجموعه داده از سایر مدل ها دقت بسیار بیشتری را کسب نمود.
این مقاله از طریق لینک قابل دسترسی است و محققین علاقه مند می توانند آن را به صورت رایگان دریافت نمایند.
اگر به دنبال مجموعه مقالات فارسی در موضوعات مختلف هستید به لینک مراجعه بفرمایید. در این لینک مجموعه مقالات فارسی در حوزه های مختلف داده کاوی و متن کاوی ارائه شده است.
اگر به پژوهش در حوزه کشف تقلب در بانکداری علاقه مند هستید توصیه می شود حتما مجموعه جالب و بی همتای هفتاد مقاله فارسی در زمینه کشف تقلب در بانکداری و کشف تقلب مالی را تهیه بفرمایید.
اگر در زمینه کشف تقلب در بانکداری در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید. آکادمی داده در تلگرام (https://t.me/dataacademy) حضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد.
افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.