مقایسه روش های مبتنی بر داده کاوی در تشخیص نوع سرطان سینه

مقایسه روش های مبتنی بر داده کاوی در تشخیص نوع سرطان سینه


  • 279 بازدید

 آکادمی داده  که به زودی پنجمین سال فعالیت خود را جشن می گیرد سالهاست به دنبال ایجاد محتوای مفید برای علاقه مندان علوم داده‌کاوی، متن کاوی و علوم مرتبط با علم داده، مدیریت دانش، هوش تجاری و مباحث مرتبط است.  آکادمی داده  امیدوار است با این اقدامات بتواند اثری هر چند اندک در افزایش آگاهی علاقه مندان به این حوزه ها داشته باشد. در این سری مقالات  آکادمی داده  تلاش دارد مقالات جالب، جدید، پر محتوا و اثرگزار را در علوم داده‌کاوی، متن کاوی، مدیریت دانش، هوش تجاری و مباحث مرتبط ارایه نماید. در این سری مقالات ابتدا مقدمه و سپس نتیجه گیری مقالات ارایه شده است و سپس‌ فایل پی دی اف مقاله برای دانلود رایگان علاقه مندان توسط  آکادمی داده تهیه شده و قابل دانلود است.

چکیده 
داده کاوی تکنیکی جهت کشف دانش جدید از پایگاههای داده می باشد. تشخیص بیماری های مختلف در علم پزشکی یکی از زمینه های پر کاربرد داه کاوی محسوب می شود. سرطان یکی از بیماری هایی است که در دهه های اخیر بسیار گسترش پیدا کرده است ، بدین منظور در این مقاله سعی شده است تا ضمن مقایسه روش های داده کاوی نظیر درخت تصمیم گیری و Sww ، مناسب ترین روش به منظور تشخیص نوع سرطان معرفی و پیشنهاد گردد. بدین منظور از نرم افزار داده کاوی clehtentine و پایگاه داده واقع در مخزن داده دانشگاه کلیفرنیا استفاده شده است. نتایج بدست آمده از دقت مدل های ایجاد شده بر روی داده های آزمایشی نشان می دهد که الگوریتم c5.0 دقت بالاتری نسبت به سایر الگوریتم ها دارد. با استفاده از الگوریتم c5. 0 می توان با دقت 70.59٪ نوع سرطان سینه را پیش بینی کرد.

نتیجه گیری 
از تکنیک های داده کاوی می توان در کشف قوانین و استخراج اطلاعات مفید در داده های پزشکی بهره گرفت. در این مقاله ما با بکار گیری داده کاوی بر روی داده های سرطان سینه برآن بودیم تا اطلاعاتی را کشف نماییم تا بتواند در تشخیص نوع سرطان (خوش خیم یا بدخیم) مورد استفاده پزشکان قراربگیرد. بر اساس داده هایی که در اختیار ما قرار داشت نتایج نشان دهنده آن بود که مهمترین فیلدهای تاثیر گذار در تشخیص نوع سرطان عبارتند از: روکش غده ها، درجه غده ، غده.
با توجه به اینکه هر چه میزان رکورد های در اختیار بیشتر باشد نتایج بهتری حاصل می گردد استفاده از مجموعه داده کاملتر در تحقیقات آینده سودمند می باشد. همچنین چنانچه داده های جمع آوری شده به صورت پیگیر در فاصله زمانی در اختیار داده کاوی باشد بدین معنا که داده های مربوط به افراد را در فواصل زمانی چندین بار جمع آوری کرده باشیم با دنبال کردن این اطلاعات و وارد کردن نقش زمان در آن ها می توان در آینده کاربردهای دیگر را مد نظر قرار داد.

این مقاله توسط آکادمی داده تهیه شده است و از طریق لینک قابل دسترسی است. محققین علاقه مند می توانند آن را به صورت رایگان دریافت نمایند. 

اگر در حال پژوهش در حوزه داده کاوی هستید، سوالات و اشکالات خود را از طریق تلگرام با آکادمی داده در میان بگذارید. با عضو شدن در کانال تلگرام  آکادمی داده از مقالات جدید و دیتاست های منتشر شده مطلع شوید. 

مجموعه مقالات فارسی به صورت یکجا نیز از طریق لینک قابل دسترسی هستند. 

اگر در زمینه داده کاوی در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام (https://t.me/dataacademyحضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد.