روش های ایجاد پراکندگی واستفاده از خصیصه های متعدد درخوشه بندی ترکیبی

روش های ایجاد پراکندگی واستفاده از خصیصه های متعدد درخوشه بندی ترکیبی


  • 237 بازدید

 آکادمی داده  که به زودی پنجمین سال فعالیت خود را جشن می گیرد سالهاست به دنبال ایجاد محتوای مفید برای علاقه مندان علوم داده‌کاوی، متن کاوی و علوم مرتبط با علم داده، مدیریت دانش، هوش تجاری و مباحث مرتبط است.  آکادمی داده  امیدوار است با این اقدامات بتواند اثری هر چند اندک در افزایش آگاهی علاقه مندان به این حوزه ها داشته باشد. در این سری مقالات  آکادمی داده  تلاش دارد مقالات جالب، جدید، پر محتوا و اثرگزار را در علوم داده‌کاوی، متن کاوی، مدیریت دانش، هوش تجاری و مباحث مرتبط ارایه نماید. در این سری مقالات ابتدا مقدمه و سپس نتیجه گیری مقالات ارایه شده است و سپس‌ فایل پی دی اف مقاله برای دانلود رایگان علاقه مندان توسط  آکادمی داده تهیه شده و قابل دانلود است.

چکیده 
خوشه بندی یکی از تکنیک های داده کاوی می باشد و به عنوان مهم ترین مسأله در یادگیری بدون نظارت در نظر گرفته می شود. با ترکیب خوشه ها می توان به خوشه بندی ترکیبی برای دست یافتن به نتیجه ای، پایدار وقدرتمند دست یافت و با انتخاب یک روش ایجاد پراکندگی مناسب به خوشه بندی اصولی دست یافت.

نتیجه گیری 
در خوشه بندی ترکیبی و ایجاد پراکندگی در خوشه ها برای داشتن یک خوشه بندی ترکیبی مؤثرتر مطالعات و نتایج بسیاری می تواند انجام پذیرد. مثلا مطالعاتی در زمینه بهبود انتخاب هوشمندانه مقادیر اولیه الگوریتم ها و همچنین انتخاب زیر مجموعه ای بهینه و کامل از داده ها و ویژگی ها برای ایجاد تنوع و پراکندگی مفید می باشد. و بكارگيري الگوهاي تك خصیصه اي و نیز متد هاي تطابق عدم تشابه الساده در الگوریتم های خوشه بندي سنتي براي خصیصه هاي گروهي ، مي تواند به نتایج خوشه بندي غير دقيق منجر شود. در [17] مفهوم جديد الگوهاي خوشه p-mode فازي تعريف شده است که شامل چندین برچسب در سطح خصيصه گروهي مي باشد، که همگرايي اين الگوریتم جدید( CFCM) به اثبات رسیده است. بررسي ها روي مجموعه اشیاء واقعي نشان داده است که مقادیر p در الگوهاي p- mode فازي و ضرایب فازي سازي در کارایی الگوریتم FCM موثرند و در صورت بکارگیری متد تطابق عدم تشابه ساده براي مقادیر گروهي ، ضرایب فازي سازي كوچك ، مثل (1,1) روي اشيائي با خصیصه هاي گروهي منجر به خوشه بندي بهتري مي شوند. همچنین اگر  p=maxاختیار شود ، نتایج بهتري نسبت به ( 1= p  (حاصل خواهد شد، البته این امر در همه موارد صادق نیست.

این مقاله توسط آکادمی داده تهیه شده است و از طریق لینک قابل دسترسی است. محققین علاقه مند می توانند آن را به صورت رایگان دریافت نمایند. 

اگر در حال پژوهش در حوزه داده کاوی هستید، سوالات و اشکالات خود را از طریق تلگرام با آکادمی داده در میان بگذارید. با عضو شدن در کانال تلگرام  آکادمی داده از مقالات جدید و دیتاست های منتشر شده مطلع شوید. 

مجموعه مقالات فارسی به صورت یکجا نیز از طریق لینک قابل دسترسی هستند. 

اگر در زمینه داده کاوی در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام (https://t.me/dataacademyحضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد.