خوشه بندی داده ها به روش الگوریتم فاخته

خوشه بندی داده ها به روش الگوریتم فاخته


  • 295 بازدید

 آکادمی داده  که به زودی پنجمین سال فعالیت خود را جشن می گیرد سالهاست به دنبال ایجاد محتوای مفید برای علاقه مندان علوم داده‌کاوی، متن کاوی و علوم مرتبط با علم داده، مدیریت دانش، هوش تجاری و مباحث مرتبط است.  آکادمی داده  امیدوار است با این اقدامات بتواند اثری هر چند اندک در افزایش آگاهی علاقه مندان به این حوزه ها داشته باشد. در این سری مقالات  آکادمی داده  تلاش دارد مقالات جالب، جدید، پر محتوا و اثرگزار را در علوم داده‌کاوی، متن کاوی، مدیریت دانش، هوش تجاری و مباحث مرتبط ارایه نماید. در این سری مقالات ابتدا مقدمه و سپس نتیجه گیری مقالات ارایه شده است و سپس‌ فایل پی دی اف مقاله برای دانلود رایگان علاقه مندان توسط  آکادمی داده تهیه شده و قابل دانلود است.

چکیده 
خوشه بندی از جمله روش های پرکاربرد در تجزیه و تحلیل داده ها است که بدون هیچ دانش قبلی، داده ها را به گروههای معنی داری تقسیم می کند که یکی از موضوعات اساسی در داده کاوی است. در این مقاله یک الگوریتم خوشه بندی جدید بر اساس سبک خاص زندگی جمعی یک دسته پرنده بنام فاخته ارائه شده است. الگوریتم فاخته که یکی از روش های جدید بهینه سازی تکاملی می باشد که با الهام گرفتن از روش تخم گذاری فاخته ها، پرورش تخمها، تلاش برای زنده ماندن در میان دیگر فاخته ها و مهاجرت به سمت محیط بهتر برای مساله خوشه بندی داده ها استفاده شده است، الگوریتم معروف خوشه بندی k - mecans به مقداردهی اولیه بسیار حساس است و به راحتی در بهینه های محلی گیر می افتد در صورتی که الگوریتم پیشنهاد شده به خوشه های با اندازه و ابعاد متفاوت حساس نیست، برای مجموعه داده های چند بعدی مناسب است و همچنین سرعت بسیار خوبی در همگرایی به نقطه بهینه سراسری و دقت بالا در حل مسائل از خود نشان داده است، کارایی الگوریتم پیشنهادی بر روی مجموعه های دادهای پایگاه UCI مورد ارزیابی قرار گرفته شده است. نتایج بدست آمده از آزمایشات نشان دهنده بهبود عملکرد این الگوریتم در مقایسه با الگوریتم های معروف خوشه بندی همچون k- means و PSO است.

نتیجه گیری
در این مقاله یک الگوریتم جدید، مبتنی بر سبک خاص زندگی پرندگان فاخته جهت خوشه بندی داده ها ارائه شد. در این الگوریتم از روش تخم گذاری و مهاجرت فاخته ها برای خوشه بندی داده ها الهام گرفته شد. خوشه بندی داده ها در واقع پیدا کردن بهینه ترین مرکز خوشه ها می باشد که این کار بوسیله ی بهینه کردن تابع برازش انجام می شود. یکی از مزایای این الگوریتم این است که به راحتی از گیرافتان در بهینه های محلی اجتناب می کند و همچنین سرعت اجرای الگوریتم نسبت به الگوریتم های خوشه بندی PSO و k- means مقایسه شد. نتایج شبیه سازی های انجام شده بر روی مجموعه های دادهای مختلف نشان از بهبود کارایی و عملکرد CCA در مقایسه با الگوریتم های خوشه بندی k- mans و PSO است.

این مقاله توسط آکادمی داده تهیه شده است و از طریق لینک قابل دسترسی است. محققین علاقه مند می توانند آن را به صورت رایگان دریافت نمایند. 

اگر در حال پژوهش در حوزه داده کاوی هستید، سوالات و اشکالات خود را از طریق تلگرام با آکادمی داده در میان بگذارید. با عضو شدن در کانال تلگرام  آکادمی داده از مقالات جدید و دیتاست های منتشر شده مطلع شوید. 

مجموعه مقالات فارسی به صورت یکجا نیز از طریق لینک قابل دسترسی هستند. 

اگر در زمینه داده کاوی در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام (https://t.me/dataacademyحضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد.