خلاصه سازی متون با تكنیكهای مبتنی بر یادگیری ماشین

خلاصه سازی متون با تكنیكهای مبتنی بر یادگیری ماشین


  • 473 بازدید

در این سلسله مقالات به مفاهیم و کاربرد های داده‌کاوی، متن کاوی و علوم مرتبط با علم داده پرداخته می‌شود. با توجه به حجم عظیم مقالات تولید شده در زبان فارسی در حوزه داده کاوی و علم داده، آکادمی داده تصمیم گرفت مقالات فارسی منتشر شده در این حوزه را خلاصه برداری کرده و در اختیار علاقه مندان قرار دهد. این مقالات ابتدا با معرفی موضوع و کارهای انجام شده آغاز می شود و سپس مجموعه داده یا دیتاست تحقیق ارائه می شود و سپس پیاده سازی انجام شده در رپیدماینر، وکا یا پایتون ارائه شده و نتایج تحلیل می شود.

در این رشته نوشته ها ابتدا خلاصه ای از مقاله ارائه شده و سپس نتیجه گیری مقاله عینا آورده می گردد و سپس فایل پی دی اف آن نیز برای دانلود در اختیار محققین و پژوهشگران عزیز قرار می گیرد. 

 

همانگونه كه قبلا اشاره شد برای مقایسه كارایی الگوریتمهای بیز، درخت تصمیم و شبكه عصبی DistAl ،از پایگاه داده patent استفاده كردیم و با اجرای سه الگوریتم فوق بر روی مجموعه متون موجود در این پایگاه داده، خلاصه مجموعه متون این دادگان را به دست آورده ایم. Recall و Precision به عنوان معیارهای متداول در خلاصه سازی مطرح شده است. Recall برابر است با تقسیم تعداد جملاتی كه توسط سیستم درست تشخیص داده شده است بر تعداد جملاتی كه توسط انسان درست تشخیص داده شده اند و Precision برابر است با تقسیم تعداد جملاتی كه توسط سیستم درست تشخیص داده اند شده بر تعداد كل جملاتی كه توسط سیستم برای خلاصه ایجاد شده اند. سپس ما در این آزمایش با استفاده از معیار اندازه گیری F ، كارایی خلاصه سازهای فوق را ارزیابی نموده ایم. معادله )٣ (نحوه محاسبه معیار اندازه گیری F را نشان می دهد . F = Recall*Precision / (Recall+Precision) (٣) 
نتایج بیانگر این است كه با توجه به معیارهای سنجش ارزیابی مانند Precision ،Recall و Accuracy عملكرد خلاصه ساز بر اساس یادگیری ماشین، بهتر از الگوریتم های فاقد یادگیری است. بخصوص دسته بندی كننده بیز و شبكه عصبی DistAl دارای بالاترین عملكرد میباشد . نتایج این مقایسه در جدول (١)آمده است.

 

این مقاله از طریق لینک قابل دسترسی است و محققین علاقه مند می توانند آن را به صورت رایگان دریافت نمایند. 


کپی برداری بدون ذکر منبع، بر اساس قانون جرائم اینترنتی و مادۀ 12 فصل سوم قانون جرائم رایانه ای غیر قانونی بوده و مجازات جزای نقدی و حبس دارد و شرعا نیز حرام است! 
اگر در زمینه داده کاوی در حال تحقیق یا پیاده سازی پروژه تجاری یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام، واتزآپ و تمامی پیام رسان های ایرانی(سروش، آی گپ، بله و ویسپی) با شماره 09120637751 حضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد. 


افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.