در این سلسله مقالات آکادمی داده به دنبال ارائه مطالبی است که محققین و علاقهمندان دانش علم داده با کاربردهای گسترده و عظیم این علم آشنا کند.
علم داده با ظهور شبکه های اجتماعی رشد بسیار زیادی کرد زیرا داده های منتشر شده روز به روز گستردهتر شد به همین دلیل کارها و تحقیقات انجام شده در این حوزه مطالعاتی نیز رشد چشمگیری کرد.
بدین ترتیب در این مقالات کارهای انجام شده بر روی داده های شبکه های اجتماعی با استفاده از روش های داده کاوی و یادگیری ماشین ارائه خواهد شد. امید است مطالعه این مقالات برای اشخاصی که به دنبال تحقیق و پژوهش در حوزه کشف دانش از شبکه های اجتماعی با بهره گیری از داده کاوی و یادگیری ماشین هستند مفید و سودمند باشد.
توییتر یکی از نادرترین شبکه اجتماعی است که در هنگام ثبت نام از شما جنسیت سوال نمی کند در حالی که در شبکه اجتماعی فیس بوک این طور نیست، این تحقیق توسط توماس به دنبال روشی برای شناسایی جنسیت کاربران شبکه اجتماعی توییتر است. این تحقیق توسط توماس به دنبال روشی برای شناسایی جنسیت کاربران شبکه اجتماعی توییتر است.
شناسایی جنسیت در بسیاری از موارد پركاربرد و از اهمیت بالایی برخوردار میباشد از مواردی كه میتوان به اهمیت این مسئله اشاره نمود در سیستمهای توصیه گر در حوزههای مختلف مانند فروش اینترنتی ، پیشنهاد فیلم ، کاربردهای پزشكی ، رژیمهای غذایی ، توصیههای ورزشی و ... میباشد بهعنوانمثال در یك سیستم فروش اینترنتی این سیستمها با حدس زدن شیوه تفکر کاربر به وی مناسبترین و نزدیکترین کالا به سلیقه او را شناسایی و پیشنهاد میکند حال اگر این پیشنهاد در راستای جنسیت كاربر هدفگذاری شود میتواند كمك بسیاری به این سیستم نماید و یا این سیستم میتواند موجب افزایش آگاهی کاربر درزمینهٔ موردعلاقه وی میشود مثلاً در حین ارائه توصیه به کاربر با توجه به جنسیت كاربر موجب میشود تا وی با اقلام و اشیاء جدیدی را که قبلاً آنها را نمیشناخته، آشنا شود.
مجموعه داده این تحقیق شامل سی هزار توییت می باشد این مجموعه داده شامل نام کاربری، نام نمایش داده شده و محتویات توییت های کاربر هستند. از الگوریتم معروف ماشین بردار پشتیبان برای ایجاد مدل طبقه بندی استفاده شده است. بنابرادعای نویسنده می توان با بهره گیری از اسم کاربر با دقت 95 درصد جنسیت او را به درستی شناسایی کرد. نویسندگام مجموعه داده اسامی و جنیست را از آژانس اجتماعی ایالت متحده آمریکا دریافت کرده اند. بدین ترتیب با استفاده از آن مدلی با دقت 95 درصد ارائه نموده اند. این مدل بر مدل های دیگر که مثلا از تصویر پروفایل جنسیت را شناسایی می کرده است بهتر کار می کند.
کپی برداری بدون ذکر منبع، بر اساس قانون جرائم اینترنتی و مادۀ 12 فصل سوم قانون جرائم رایانه ای غیر قانونی بوده و مجازات جزای نقدی و حبس دارد و شرعا نیز حرام است!
اگر در زمینه علم داده و داده کاوی در حال تحقیق یا پیاده سازی پروژه تجاری یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید. آکادمی داده در تلگرام، واتزآپ و تمامی پیام رسان های ایرانی(سروش، آی گپ، بله و ویسپی) با شماره 09120637751 حضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد.
افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.