ارائه روشی برای آنالیز احساسات در متن نظرات

ارائه روشی برای آنالیز احساسات در متن نظرات


  • 400 بازدید

در این سلسله مقالات به مفاهیم و کاربرد های داده‌کاوی، متن کاوی و علوم مرتبط با علم داده پرداخته می‌شود. با توجه به حجم عظیم مقالات تولید شده در زبان فارسی در حوزه داده کاوی و علم داده، آکادمی داده تصمیم گرفت مقالات فارسی منتشر شده در این حوزه را خلاصه برداری کرده و در اختیار علاقه مندان قرار دهد. این مقالات ابتدا با معرفی موضوع و کارهای انجام شده آغاز می شود و سپس مجموعه داده یا دیتاست تحقیق ارائه می شود و سپس پیاده سازی انجام شده در رپیدماینر، وکا یا پایتون ارائه شده و نتایج تحلیل می شود.

در این رشته نوشته ها ابتدا خلاصه ای از مقاله ارائه شده و سپس نتیجه گیری مقاله عینا آورده می گردد و سپس فایل پی دی اف آن نیز برای دانلود در اختیار محققین و پژوهشگران عزیز قرار می گیرد. 

 

نتایج موجود در روش پیشنهادی نشان میدهد صحت روش در پیش بینی برچسبهای خنثی و منفی بیشتر است که با توجه به فراوانی برچسبها دور از انتظار نیست. مقایسه روش ارائه شده و مقادیر منتج با روش بدون در نظر گرفتن موضوع، بهبود صحت تشخیص برچسب در بیشتر خبرگزاری ها را نشان میدهد. 
در روش پیشنهادی بهبودی در تشخیص نظرات بی ربط، به دلیل اهمیت به وجود مشترکات دیده میشود. همچنین نتیجه بهتری در تشخیص نظرات منفی )مخالف( مشهود است. این بدین معناست تشخیص موضوع بحث به روش گفته شده در تعیین دیدگاههای مخالف موثرتر است. صحت تشخیص 52 درصدی برای مجموعه داده مربوط به خبرگزاری "باشگاه خبرنگاران جوان و 51 درصد برای مجموعه داده مربوط به خبر آنلاین نیز به همین دلیل است. این مجموعه ها بیشترین نسبت برچسب های خنثی را دارا میباشد. 
هم سو بودن نتایج برگرفته از قسمت های مختلف مجموعه داده با آمار منتج از کل مجموعه، می تواند نقطه مثبتی برای تایید روند برچسب زنی توسط انسان باشد. بدین معنا که یکپارچگی نسبی در برچسبهای اعالم شده وجود دارد که مقادیر بدست آمده از روش پیشنهادی را قابل توجیه مینماید. 
در این پژوهش، موضوع بحث با بررسی اسامی و ارتباط معنایی با بررسی اشتراک اسامی در متون انجام گرفت. بررسی اشتراکات معنایی با استفاده از آنتولوژی و کشف ساختار دستوری و محورهای مباحث با به کارگیری تجزیه کننده های دستوری در زبان فارسی، دقت بیشتر و نتایج مطلوب تر را در پی خواهد داشت. 
با توجه به اینکه مجموعه داده جمع آوری شده مربوط به حوزه خاصی از اخبار است، بالا بودن فراوانی بعضی اصطلاحات و عبارات دور از انتظار نیست. یافتن این ویژگیها در متون و بررسی آنها در برچسبهای مختلف با استفاده از تکنیک های کاوش متن، میتواند به افزایش صحت تشخیص یبانجامد.
 

این مقاله از طریق لینک قابل دسترسی است و محققین علاقه مند می توانند آن را به صورت رایگان دریافت نمایند. 


کپی برداری بدون ذکر منبع، بر اساس قانون جرائم اینترنتی و مادۀ 12 فصل سوم قانون جرائم رایانه ای غیر قانونی بوده و مجازات جزای نقدی و حبس دارد و شرعا نیز حرام است! 
اگر در زمینه داده کاوی در حال تحقیق یا پیاده سازی پروژه تجاری یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام، واتزآپ و تمامی پیام رسان های ایرانی(سروش، آی گپ، بله و ویسپی) با شماره 09120637751 حضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد. 


افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.