درباره ​طبقه بندی در داده کاوی

درباره ​طبقه بندی در داده کاوی


  • 2,756 بازدید

الگوریتمهای داده کاوی سه رویکرد یادگیری مختلف را دنبال میکنند: بانظارت، بدون نظارت و نیمه نظارتی. در یادگیری با نظارت الگوریتم با مجموعهای از مثال ها که برچسب کلاس شان مشخص است کار می کند. برچسب ها میتوانند ارزش اسمی در حالت طبقه بندی و ارزش عددی در حالت رگرسیون داشته باشند. در مقابل، در یادگیری بدون نظارت برچسبهای نمونه ها در مجموعه داده ها نامشخص است و الگوریتم تلاش میکند که نمونه ها را براساس شباهت ارزشهای ویژگیشان گروه بندی کند. در نهایت، یادگیری نیمه نظارتی زمانی استفاده می شود که زیر مجموعه ی کوچکی از نمونه های برچسبشدهبا تعداد زیادی از نمونه های  بدون برچسب موجود باشد.

طبقه بندی  را میتوان به عنوان یک روش بانظارت که در آن هر نمونه متعلق به یک کلاس با ویژگی خاص میباشد، دانست. هر نمونه شامل دوقسمت است: مجموعه مقادیر ویژگی پیشبینی کننده و مقدار ویژگی هدف. اولین مورد برای پیشبینی ارزش بعدی استفاده میشود. ویژگیهای پیشبینی کننده باید برای پیشبینی کلاس یک مورد مناسب باشد. در طبقه بندی  مجموعه نمونه های  استخراج شده به دو مجموعه ی انحصاری متقابل و جامع که مجموعه ی آموزش و آزمایش گفته میشوند، تقسیم می شود. دانش کشف شده بوسیله ی الگوریتم طبقه بندی را میتوان از طریق راههای مختلف بیان کرد که شامل تعداد بسیار زیادی از الگوریتم ها و روش ها می شود.

بهبود دقت الگوریتم ماشین بردار پشتیبان با تکنیک انتخاب ویژگی، افشاری

اگر به پژوهش در حوزه داده کاوی علاقه مند هستید توصیه می شود حتما مجموعه بی نظیر پانصد مقاله فارسی در زمینه داده کاوی  و مجموعه های مشابه آن  و مقالات مرتبط با کاربرد داده کاوی در پیش بینی بیماری را تهیه بفرمایید.

اگر در زمینه متن کاوی در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام (https://t.me/dataacademyحضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد.  

افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.