استفاده از الگوریتم جستجوی تصادفی تقلید نیروی گرانشی بر پایه رفتار کیاتیک برای خوشه بندی داده ها

استفاده از الگوریتم جستجوی تصادفی تقلید نیروی گرانشی بر پایه رفتار کیاتیک برای خوشه بندی داده ها


  • 270 بازدید

 آکادمی داده  که به زودی پنجمین سال فعالیت خود را جشن می گیرد سالهاست به دنبال ایجاد محتوای مفید برای علاقه مندان علوم داده‌کاوی، متن کاوی و علوم مرتبط با علم داده، مدیریت دانش، هوش تجاری و مباحث مرتبط است.  آکادمی داده  امیدوار است با این اقدامات بتواند اثری هر چند اندک در افزایش آگاهی علاقه مندان به این حوزه ها داشته باشد. در این سری مقالات  آکادمی داده  تلاش دارد مقالات جالب، جدید، پر محتوا و اثرگزار را در علوم داده‌کاوی، متن کاوی، مدیریت دانش، هوش تجاری و مباحث مرتبط ارایه نماید. در این سری مقالات ابتدا مقدمه و سپس نتیجه گیری مقالات ارایه شده است و سپس‌ فایل پی دی اف مقاله برای دانلود رایگان علاقه مندان توسط  آکادمی داده تهیه شده و قابل دانلود است.

چكیده 
خوشه بندی یکی از بخش های مهم در حیطه دانش داده کاوی است که با توجه به کاربردهای فراوانی که در حل مسایل دنیای واقعی دارد، همواره مورد توجه محققان و متخصصان داده کاوی بوده است. مهم ترین و پرکاربردترین الگوریتمی که در بحث خوشه بندی وجود دارد، الگوریتم means-K است که جزو روش های افرازبندی بوده و بدلیل سادگی و اجرای سریع در دسته بندی مجموعه داده تست بزرگ شناخته شده است . means-K دو نقطه ضعف دارد: وابستگی به مقدار دهی های اولیه و اینکه بهینگی های محلی و راه حل های جهانی را نمی توان با حجم معقولی از محاسبات به دست آورد. برای غلبه بر مشکل بهینه سازی محلای مطالعات زیادی در زمینه ی خوشه بندی انجام شده است . در این مقاله روش هیوریستیک جدیدی به نام الگوریتم جستجوی تصادفی تقلید نیروی گرانشی بر پایه رفتار کیاتیک برای حل مساله خوشه بندی پیشنهاد شده است. این الگوریتم بر پایه مفاهیم جستجوی تصادفی، دو تا از چهار پارامتر اصلی سرعت و نیاروی گرانشی در فیزیک و همچنین با جایگزینی اعداد کیاتیکی بجای اعداد تصادفی استفاده می نماید. الگوریتم پیشنهادی را CEGELS  نامیده و هدف آن بهبود در سرعت همگرایی می باشد. برای تصادی ، الگوریتم را پیاده سازی نموده و با الگوریتم های HBMO ،GA ،PSO ،ACO ،SA ،TS و means-K بر روی مجموعه داده های استاندارد از مخازن داده UCI مقایسه نموده ایم. نتایج تجربی نشان میدهد الگوریتم پیشنهادی از کارایی بالایی نسبت به دیگر الگوریتم های هیوریستیک برخوردار است.

نتیجه گیری  
در این مقاله یک الگوریتم هیوریستیک جدید برای پیدا کردن راه حل های بهینه یا نزدیک به بهینه برای مسائل خوشه بندی با اختصاص دادن n شی به k خوشه پیشنهاد شده است. الگوریتم پیشنهادی بر اساس الگوریتم جساتجوی تصادفی تقلید نیروی گرانشی بر پایه رفتار کیاتیک معرفی شده و قابلیتهای جایگزین کردن رفتار کیاتیک با رفتار تصادفی نشان داده شده است. این الگوریتم را بروی چندین مجموعه داده های واقعی مشهور آزمایش شده است. نتایج تجربی نشان می دهد که الگوریتم بهینه پیشنهادی با دیگر الگوریتم ها، حداقل در پارامترهای تابع ارزیابی و انحراف معیار قابل مقایسه است . نتایج بیانگر آن است که الگوریتم پیشنهادی می تواند به عنوان یک هیوریستیک مناسب با کاریی بالایی نسبت به روش های دیگر در نظر گرفته شود. برای کارهای آینده می توان این الگوریتم را با دیگر الگوریتم های هیوریستیکی ترکیب نموده تا یک الگوریتم ترکیبی بوجود آید.

این مقاله توسط آکادمی داده تهیه شده است و از طریق لینک قابل دسترسی است. محققین علاقه مند می توانند آن را به صورت رایگان دریافت نمایند. 

اگر در حال پژوهش در حوزه داده کاوی هستید، سوالات و اشکالات خود را از طریق تلگرام با آکادمی داده در میان بگذارید. با عضو شدن در کانال تلگرام  آکادمی داده از مقالات جدید و دیتاست های منتشر شده مطلع شوید. 

مجموعه مقالات فارسی به صورت یکجا نیز از طریق لینک قابل دسترسی هستند. 

اگر در زمینه داده کاوی در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام (https://t.me/dataacademyحضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد.