بررسی مقایسه ای تکنیک های داده کاوی در پیش بینی بیماری قلبی

بررسی مقایسه ای تکنیک های داده کاوی در پیش بینی بیماری قلبی


  • 893 بازدید

 آکادمی داده  که به زودی پنجمین سال فعالیت خود را جشن می گیرد سالهاست به دنبال ایجاد محتوای مفید برای علاقه مندان علوم داده‌کاوی، متن کاوی و علوم مرتبط با علم داده، مدیریت دانش، هوش تجاری و مباحث مرتبط است.  آکادمی داده  امیدوار است با این اقدامات بتواند اثری هر چند اندک در افزایش آگاهی علاقه مندان به این حوزه ها داشته باشد. در این سری مقالات  آکادمی داده  تلاش دارد مقالات جالب، جدید، پر محتوا و اثرگزار را در علوم داده‌کاوی، متن کاوی، مدیریت دانش، هوش تجاری و مباحث مرتبط ارایه نماید. در این سری مقالات ابتدا مقدمه و سپس نتیجه گیری مقالات ارایه شده است و سپس‌ فایل پی دی اف مقاله برای دانلود رایگان علاقه مندان توسط  آکادمی داده تهیه شده و قابل دانلود است.

چکیده
مهمترین زمینه های کاربرد داده کاوی در حیطه علم پزشکی است. با به کارگیری الگوریتم های داده کاوی می توان سیستم های هوشمندی ابداع کرد که به شکل خودکار و بدون نیاز به نظارت پزشک قادر به فهم و تفسیر ویژگی های پزشکی افراد باشند یا اطلاعات مفیدی را اکتشاف کنند که متخصصان را در قضاوت صحیح یاری رساند. در ادبیات داده کاوی در پزشکی تا کنون مجموعه بسیار متنوعی از روش ها ارائه شده است که هر یک دارای نقاط ضعف و قدرت به خصوصی بوده که عملکرد آن بسته به نوع داده و شرایط حاکم بر مساله متفاوت است. هدف از این مقاله گزارش یک پروژه تحقیقاتی به منظور جمع بندی چندین مقاله از سه مجموعه داده که از الگوریتم های مختلف داده کاوی استفاده کرده اند جهت انتخاب دقیق ترین مدل برای پیش بینی بیماری قلبی و در انتها بهترین الگوریتم انتخاب می شود. نتایج نشان می دهد در دو مجموعه داده کلیولند و قلب و عروق کلمبیا شبکه عصبی بالاترین دقت را داشته است و در مجموعه Andhra pradesh نیز الگوریتم ترکیبی ژنتیک و نزدیکترین همسایه بالاترین دقت اطمینان را داشته است. الگوریتم های درخت تصمیم گیری و بیز ساده نیز دقت قابل قبولی در پیش بینی بیماران قلبی داشته اند.

چه چیزی داده کاوی نیست؟

داده کاوی چیست؟

آموزش ابزارِ داده کاوی رپیدماینر

در مورد داده کاوی سلامت

نتیجه گیری
بررسی و مقایسه های انجام شده بر روی سه مجموعه داده و یافتن بهترین ، کاراترین و همچنین بدترین الگوریتم ها در پیش بینی بیماری قلبی، ما را به سوی این حقیقت سوق می دهد که هرگز نمی توان الگوریتمی را با توجه به ساختار آن ، همواره به عنوان الگوریتم بهینه معرفی کرد. زیرا عوامل متعددی چون انتخاب زیر مجموعه از ویژگی ها تنوع داده ها و تعداد نمونه ها در کارایی این الگوریتم ها موثرند. نتایج نشان می دهد در دو مجموعه داده کلیولند و قلب و عروق کلمبیا شبکه های عصبی بالاترین دقت اطمینان را داشته است و در مجموعه داده Andhra pradesh الگوریتم ترکیبی ژنتیک و نزدیکترین همسایه بالاترین دقت اطمینان را داشته است. نتایج نشان الگوریتم های ترکیبی به مراتب می توانند دقت بالاتری نسبت به الگوریتم های تکی داشته باشند. الگوریتم های درخت تصمیم ، بیز ساده ، ماشین بردار پشتیبان نزدیکترین همسایه و Smoothing تیز دقت بالا و قابل قبولی در پیش بینی بیماران قلبی در سه مجموعه داده داشته اند.

این مقاله توسط آکادمی داده تهیه شده است و از طریق لینک قابل دسترسی است. محققین علاقه مند می توانند آن را به صورت رایگان دریافت نمایند. 

اگر در حال پژوهش در حوزه داده کاوی هستید، سوالات و اشکالات خود را از طریق تلگرام با آکادمی داده در میان بگذارید. با عضو شدن در کانال تلگرام  آکادمی داده از مقالات جدید و دیتاست های منتشر شده مطلع شوید. 

مجموعه مقالات فارسی به صورت یکجا نیز از طریق لینک قابل دسترسی هستند. 

اگر در زمینه داده کاوی در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام (https://t.me/dataacademyحضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد.