مقایسه میزان دقت تکنیک های داده کاوی در کاوش داده های آموزشی

مقایسه میزان دقت تکنیک های داده کاوی در کاوش داده های آموزشی


  • 452 بازدید

در این سلسله مقالات به مفاهیم و کاربرد های داده‌کاوی، متن کاوی و علوم مرتبط با علم داده پرداخته می‌شود. با توجه به حجم عظیم مقالات تولید شده در زبان فارسی در حوزه داده کاوی و علم داده، آکادمی داده تصمیم گرفت مقالات فارسی منتشر شده در این حوزه را خلاصه برداری کرده و در اختیار علاقه مندان قرار دهد. این مقالات ابتدا با معرفی موضوع و کارهای انجام شده آغاز می شود و سپس مجموعه داده یا دیتاست تحقیق ارائه می شود و سپس پیاده سازی انجام شده در رپیدماینر، وکا یا پایتون ارائه شده و نتایج تحلیل می شود.

در این رشته نوشته ها ابتدا خلاصه ای از مقاله ارائه شده و سپس نتیجه گیری مقاله عینا آورده می گردد و سپس فایل پی دی اف آن نیز برای دانلود در اختیار محققین و پژوهشگران عزیز قرار می گیرد. 


در این مقاله تلاش کردیم که اهداف، تکنیک ها و دلایل استفاده از داده کاوی آموزشی را بیان کنیم. بعضی از تحقیقاتی را که روی موضوع داده کاوی آموزشی انجام شده بود را مورد بررسی قرار دادیم و در نهایت یک مطالعه موردی برروی داده های بدست آمده از دانشجویان دانشگاه صنعتی اصفهان انجام دادیم. در اکثر تحقیقات انجام شده در زمینه داده کاوی آموزشی میزان کارایی دانشجویان و پیش بینی نمرات آن ها از روش های خوشه بندی مانند K میانگین و روش طبقه بندی مانند درخت تصمیم R&C محاسبه شده و بهبود داده شده است. ما در این مقاله به مقایسه تکنیک های داه کاوی پرداختیم و نشان دادیم که شبکه های عصبی با وجود داشتن سرعت نسبی پایین تر ، میزان دقتشان برای خوشه بندی و طبقه بندی بیشتر است . یکی از دلایل این موضوع می تواند تولید واحدهای مخفی و ساخت انواع خصوصیت جدیدتری باشد که برای بکار گیری کلاس های خاص و تفکیک شده، بررسی حالات بیشتر و یادگیری خصوصیات مهم از داده ها در شبکه های عصبی باشد. ما در این بررسی با استفاده از تکنیک های شبکه عصبی، کوهونن، خوشه بندی K میانگین، درخت تصمیم R&C و درخت تصمیم CHAID نمره نهایی دانشجویان را پیش بینی کردیم و میزان دقت این پنج روش را مقایسه نمودیم. در این ارزیابی که با استفاده از معیار اعتبار سنجی ۵ فولد به پیش بینی نمره نهایی دانشجویان پرداخته بود، میزان دقت را در هر روش محاسبه نمودیم و با استفاده از آزمون student-t صحت ارزیابی خود را اثبات نمودیم. در این ارزیابی دقت روش شبکه عصبی NN از همه بیشتر و دقت روش درخت تصمیم CHAID از همه کمتر بود.

 

 

این مقاله از طریق لینک قابل دسترسی است و محققین علاقه مند می توانند آن را به صورت رایگان دریافت نمایند. 


کپی برداری بدون ذکر منبع، بر اساس قانون جرائم اینترنتی و مادۀ 12 فصل سوم قانون جرائم رایانه ای غیر قانونی بوده و مجازات جزای نقدی و حبس دارد و شرعا نیز حرام است! 

اگر در حال پژوهش در حوزه داده کاوی هستید، سوالات و اشکالات خود را از طریق تلگرام با آکادمی داده در میان بگذارید. با عضو شدن در کانال تلگرام  آکادمی داده از مقالات جدید و دیتاست های منتشر شده مطلع شوید. 

مجموعه مقالات فارسی به صورت یکجا نیز از طریق لینک قابل دسترسی هستند. 

اگر در زمینه داده کاوی در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام (https://t.me/dataacademyحضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد. 


افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.