کاربرد داده کاوی بر روی داده های آموزش عالی دانشجویان دانشکده دندانپزشکی شهر رشت با استفاده از تکنیکهای طبقه بندی و خوشه بندی

کاربرد داده کاوی بر روی داده های آموزش عالی دانشجویان دانشکده دندانپزشکی شهر رشت با استفاده از تکنیکهای طبقه بندی و خوشه بندی


  • 247 بازدید

 آکادمی داده  که به زودی پنجمین سال فعالیت خود را جشن می گیرد سالهاست به دنبال ایجاد محتوای مفید برای علاقه مندان علوم داده‌کاوی، متن کاوی و علوم مرتبط با علم داده، مدیریت دانش، هوش تجاری و مباحث مرتبط است.  آکادمی داده  امیدوار است با این اقدامات بتواند اثری هر چند اندک در افزایش آگاهی علاقه مندان به این حوزه ها داشته باشد. در این سری مقالات  آکادمی داده  تلاش دارد مقالات جالب، جدید، پر محتوا و اثرگزار را در علوم داده‌کاوی، متن کاوی، مدیریت دانش، هوش تجاری و مباحث مرتبط ارایه نماید. در این سری مقالات ابتدا مقدمه و سپس نتیجه گیری مقالات ارایه شده است و سپس‌ فایل پی دی اف مقاله برای دانلود رایگان علاقه مندان توسط  آکادمی داده تهیه شده و قابل دانلود است.

چکیده 
هدف بررسی اطلاعات آموزشی دانش آموختگان رشته دندانپزشکی بین سالهای ۱۳۷۵ تا ۱۳۹۰ و بدست آوردن مدلی جهت پیش بینی دانشجویان ممتاز (قوی) و دانشجویان تحت ریسک مشروطی (ضعیف) و عوامل مؤثر بر نمرات و رفتار آموزشی آنها است. 
داده کاوی داده ها با استفاده از از یک فرآیند چند مرحله ای بنام CRIPS صورت گرفت در این تحقیق از مدل CHAID برای پیش بینی از طریق طبقه بندی و مدل های Two- Step و K - Means برای خوشه بندی استفاده گردید. 
نتایج این مطالعه نشان داد فیلدهای جنس، سن، سهمیه، معدل كل، تعداد ترم مشروطی و فیلد pass در خوشه بندی بعنوان فیلدهای با اهمیت بدست آمدند. مدل Two - Step بهتر از K - Means شناخته شد و چهار خوشه شامل: خوشه ۱۱ بهداشتکاران)، خوشه ۲ (دانشجویان متوسط با ۱۰۰٪ جمعیت مرد)، خوشه ۱۳ دانشجویان ضعيف ) و خوشه ۱۴ دانشجویان قوی ) تولید نمود. هر دو مدل در رابطه با خوشه بندی دانشجویان متوسط، ضعیف عمل نمودند. مدل CHAID در تکنیک طبقه بندی برای پیش بینی دانشجویان قوی (ممتاز)، دانشجویان متوسط و دانشجویان ضعیف قوانینی با درصد صحت بالا تولید نمود. 
داده کاوی آموزشی نشان داد که از مدل CHAID در تکنیک طبقه بندی، جهت پیش بینی دانشجویان ضعیف و قوی و دانشجویانی که در خطر مشروطی هستند و از مدل Two - Step می توان در تکنیک خوشه بندی جهت بررسی داده ها و رفتار دانشجویان، برای بهبود کیفیت و برنامه ریزی استراتژیک آموزشی استفاده نمود.

نتیجه گیری 
در مدل Two - Step خ، 4 خوشه بوجود آمد، خوشه ۱ مربوط به دانشجویان بهداشت کار می باشد که با توجه به تعداد آنها و نوع رفتار آموزشی آنها یک خوشه به آنها اختصاص یافت و در سایر خوشه ها دیده نشدند. و در بررسی داده های آموزشی، خوشه ۲ بعنوان خوشه دانشجویان متوسط تام گرفت با توجه به اینکه ٪۱۰۰ جمعیت آن مرد بودند دانشجویان زن متوسط در خوشه های ۳ و ۴ قرار گرفتند و این از نقاط ضعف این مدل می باشد خوشه ۳، خوشه دانشجویان ضعیف نام گرفت، و خوشه ۴، خوشه دانشجویان قوی که تعداد ترم مشروطی آنها صفر و 92/91 % آنها زن بودند. که نشان دهنده تلاش و پشتکار و اهمیت دادن به درس خواندن در نزد خانم ها می باشد.
اطلاعات دیگری که از خوشه بندی جهت تحلیل رفتار دانشجویان حاصل شد، شامل:
-افزایش درصد پذیرفته شدگان زن نسبت به مرد از سال ۸۸ به بعد
-بالا بودن میانگین معدل کل خانم ها در تمامی ورودیها نسبت به آقایان که تایید کننده بالا بودن تعداد زن ها در دانشجویان قوی نسبت به مردها می باشد.
-با توجه به وجود دانشجویان با تعداد ترم مشروطی ۳، ۴ و ، فقط در خوشه ۳ با صحت بیشتری می توان این خوشه را بعنوان خوشه دانشجویان ضعیف نامگذاری کرد.
با توجه به مشاهده شدن دانشجویان با تعداد ترم مشروطی ۳، ۴ و ۵ در سهمیه های شاهد، رزمندگان و فرزندان هیئت علمی، نیاز به بازنگری آموزشی در این سه گروه می باشد، توصیه می شود نقاط ضعف آموزشی این دانشجویان شناسایی و مسئولین جهت بهبود آنها برنامه ریزی نمایند.
-دانشجویان ورودی ۷۸ و ۸۴ دارای کمترین تعداد مشروطی در بین ورودیها بوده اند(ورودی ۷۸ یک نفر و ورودی ۸۴ دو نفر) که نسبت به دانشجویان ورودی سالهای دیگر دارای راندمان آموزشی خوبی بودند.
-با توجه به بالا بودن میانگین معدل خانم ها نسبت به آقایان و قرار گرفتن اکثریت خانم ها در خوشه دانشجویان قوی می توان ، جنسیت را جزء عوامل موثر بر نمرات دانشجویان برشمرد.
-با وجود قرار گرفتن تمامی سهمیه ها در خوشه دانشجویان ضعیف و متوسط می توان گفت متغیرسن تاثیری در این دو گروه ندارد، ولی با قرار گرفتن دانشجویان سهمیه مناطق در خوشه قوی و داشتن میانگین سنی زیر ۲۰ سال در این سهمیه ، می توان گفت متغیر سن در کسب نمرات بهتر در این خوشه تأثیر گذار است.
-نتایج حاصل از تحقیق نشان می دهد نوع سهیمه ورودی دانشجویان نیز بر نمرات کسب شده توسط دانشجویان مؤثر است، بطوریکه دانشجویان سهیمه های شاهد، رزمنده و فرزند هیئت علمی دارای نمرات پایین تری بودند و نیاز به توجه آموزشی دارند.
در مدل CHAID تکنیک طبقه بندی معدل ترم ۴ جزء پراهمیت ترین فیلد در درخت تصمیم می باشد. قوانین برگرفته از آن دارای ضریب اطمینان ۷۵ تا ۱۰۰ درصد بود، قوانین بدست آمده از نظر پیش بینی دانشجویان تحت ریسک و ممتاز بسیار ارزشمند بوده و می توان از آنها بعنوان قوانینی در تحلیل رفتار دانشجویان استفاده نمود.

این مقاله توسط آکادمی داده تهیه شده است و از طریق لینک قابل دسترسی است. محققین علاقه مند می توانند آن را به صورت رایگان دریافت نمایند. 

اگر در حال پژوهش در حوزه داده کاوی هستید، سوالات و اشکالات خود را از طریق تلگرام با آکادمی داده در میان بگذارید. با عضو شدن در کانال تلگرام  آکادمی داده از مقالات جدید و دیتاست های منتشر شده مطلع شوید. 

مجموعه مقالات فارسی به صورت یکجا نیز از طریق لینک قابل دسترسی هستند. 

اگر در زمینه داده کاوی در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام (https://t.me/dataacademyحضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد.