در این سلسله مقالات به مفاهیم و کاربرد های دادهکاوی، متن کاوی و علوم مرتبط با علم داده پرداخته میشود. با توجه به حجم عظیم مقالات تولید شده در زبان فارسی در حوزه داده کاوی و علم داده، آکادمی داده تصمیم گرفت مقالات فارسی منتشر شده در این حوزه را خلاصه برداری کرده و در اختیار علاقه مندان قرار دهد. این مقالات ابتدا با معرفی موضوع و کارهای انجام شده آغاز می شود و سپس مجموعه داده یا دیتاست تحقیق ارائه می شود و سپس پیاده سازی انجام شده در رپیدماینر، وکا یا پایتون ارائه شده و نتایج تحلیل می شود.
در این رشته نوشته ها ابتدا خلاصه ای از مقاله ارائه شده و سپس نتیجه گیری مقاله عینا آورده می گردد و سپس فایل پی دی اف آن نیز برای دانلود در اختیار محققین و پژوهشگران عزیز قرار می گیرد.
در این تحقیق ما ادعا میکنیم که مجموعه ای از کلمات به همراه احساس اولیه و خام آنها، برای شناسایی اتوماتیک احساس جملات کافی نیستند. نوع و طبیعت متن نیز در این شناسایی بسیار قابل توجه است. بنابراین ادعا، ما روش احساس نرمال را معرفی نمودیم که یک روش ترکیبی بوده که هم دیکشنری پایه است ( به دلیل استفاده از لکسیکون های گوناگون ) و هم از رویکرد ماشینی بهره می برد ( به دلیل استفاده از سرویس AlchemyAPI .( برای پیاده سازی این روش، ما قطبیت احساس بیش از 4000 توییت که نشان دهنده احساس مشتریان نسبت به دو برند "آیفون" و "گلکسی" بود را تحلیل نمودیم. با اینکه یک توییت تنها به 140 کاراکتر محدود میشود، اما به هر حال میلیون ها توییتی که روزانه در شبکه های اجتماعی توسط مشتریان سازمان ها پست میشود، میتواند اطلاعاتی نا اریب از احساس مشتریان در خصوص برندهای مختلف در اختیار ما قرار دهد. با تمام محدودیت های موجود از قبیل کوتاه بودن طول توییت ها، استفاده از ایموتیکون های نا مفهوم توسط کاربران، فیلترینگ شبکه های اجتماعی، سرعت بسیار کند شبکه جهانی وب و غیره، ما اعتقاد داریم که این مطالعه میتواند کمک شایانی در ادبیات نو ظهور آنالیز احساس متنی - پیوندی باشد، که سازمان ها با استفاده از آن بتوانند به صورت رایگان و سریع و با دقت بالا، از احساسات و ایده های مشتریان خود مطلع شوند. اولا این روش فاصله اطمینان دقیقی را برای میانگین احساس کلمه خاصی، با استفاده از درجه همراهی با دیگر کلمات و احساس اولیه و خام آن کلمه محاسبه میکند، ثانیا میتواند درصد مشتریانی را که برند مخصوصی را میپسندند یا ناراضی اند را به دست آورد، ثالثا تشخیص می دهد که آیا احساس مشتریان نسبت به یک برند خاص، متمرکز و یا پراکنده است، و در آخر توانستیم با استفاده از سایت میکروبلاگینگ توییتر، به نتایج کیفی و کمی واضحی در خصوص احساس مشتریان سازمان ها دست یابیم. همچنین نشان دادیم که روشمان در دقت و مقیاس F ، از خط مبنا و سایر روش های مشابه پیشی گرفته و قوی تر عمل می نماید.
همچنین برای آینده نیز در نظر داریم تا روش پیشنهادیمان، برای محاسبه امتیاز احساس متنی - پیوندی کلمات را گسترش داده تا در سطح جمله یا توییت کاربرد داشته باشد. یعنی بتواند با استفاده از امتیاز جملات، امتیاز احساس یک متن را تحلیل نماید و بدین ترتیب، بار احساسی متن قابل تشخیص خواهد بود. به علاوه قصد داریم تا توییت های بی بار یا خنثی را بررسی نموده که مشابه این عمل و بررسی فواید آن در سال 2013 توسط سیف و همکاران صورت گرفت. زیرا این نوع توییت ها، منبعی غنی از حوزه های مشابه، با رویکردی متفاوت می باشند.
این مقاله از طریق لینک قابل دسترسی است و محققین علاقه مند می توانند آن را به صورت رایگان دریافت نمایند.
اگر به پژوهش در حوزه متن کاوی علاقه مند هستید توصیه می شود حتما مجموعه بی نظیر هفتاد و چهار مقاله فارسی در زمینه متن کاوی و مجموعه های مشابه آن را تهیه بفرمایید.
اگر در زمینه متن کاوی در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید. آکادمی داده در تلگرام (https://t.me/dataacademy) حضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد.
افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.