شناسایی جنسیت کاربران توییتر بر اساس نام کاربر

شناسایی جنسیت کاربران توییتر بر اساس نام کاربر


  • 95 بازدید

در این سلسله مقالات آکادمی داده به دنبال ارائه مطالبی است که محققین و علاقه‌مندان دانش علم داده با کاربردهای گسترده و عظیم این علم آشنا کند.
 علم داده با ظهور شبکه های اجتماعی رشد بسیار زیادی کرد زیرا داده های منتشر شده روز به روز گسترده‌تر شد به همین دلیل کارها و تحقیقات انجام شده در این حوزه مطالعاتی نیز رشد چشمگیری کرد.
بدین ترتیب در این مقالات کارهای انجام شده بر روی داده های شبکه های اجتماعی با استفاده از روش های داده کاوی و یادگیری ماشین ارائه خواهد شد. امید است مطالعه این مقالات برای اشخاصی که به دنبال تحقیق و پژوهش در حوزه کشف دانش از شبکه های اجتماعی با بهره گیری از داده کاوی و یادگیری ماشین هستند مفید و سودمند باشد.

توییتر یکی از نادرترین شبکه اجتماعی است که در هنگام ثبت نام از شما جنسیت سوال نمی کند در حالی که در شبکه اجتماعی فیس بوک این طور نیست، این تحقیق توسط توماس به دنبال روشی برای شناسایی جنسیت کاربران شبکه اجتماعی توییتر است. این تحقیق توسط توماس به دنبال روشی برای شناسایی جنسیت کاربران شبکه اجتماعی توییتر است. 

شناسایی جنسیت در بسیاری از موارد پركاربرد و از اهمیت بالایی برخوردار می‌باشد از مواردی كه می‌توان به اهمیت این مسئله اشاره نمود در سیستم‌های توصیه گر در حوزه‌های مختلف مانند فروش اینترنتی ، پیشنهاد فیلم ، کاربردهای پزشكی ، رژیم‌های غذایی ، توصیه‌های ورزشی و ... می‌باشد به‌عنوان‌مثال در یك سیستم فروش اینترنتی این سیستم‌ها با حدس زدن شیوه تفکر کاربر به وی مناسب‌ترین و نزدیک‌ترین کالا به سلیقه او را شناسایی و پیشنهاد می‌کند حال اگر این پیشنهاد در راستای جنسیت كاربر هدف‌گذاری شود می‌تواند كمك بسیاری به این سیستم نماید و یا این سیستم می‌تواند موجب افزایش آگاهی کاربر درزمینهٔ موردعلاقه وی می‌شود مثلاً در حین ارائه توصیه به کاربر با توجه به جنسیت كاربر موجب می‌شود تا وی با اقلام و اشیاء جدیدی را که قبلاً آن‌ها را نمی‌شناخته، آشنا شود.

مجموعه داده این تحقیق شامل سی هزار توییت می باشد این مجموعه داده شامل نام کاربری، نام نمایش داده شده و محتویات توییت های کاربر هستند. از الگوریتم معروف ماشین بردار پشتیبان برای ایجاد مدل طبقه بندی استفاده شده است. بنابرادعای نویسنده می توان با بهره گیری از اسم کاربر با دقت 95 درصد جنسیت او را به درستی شناسایی کرد. نویسندگام مجموعه داده اسامی و جنیست را از آژانس اجتماعی ایالت متحده آمریکا دریافت کرده اند. بدین ترتیب با استفاده از آن مدلی با دقت 95 درصد ارائه نموده اند. این مدل بر مدل های دیگر که مثلا از تصویر پروفایل جنسیت را شناسایی می کرده است بهتر کار می کند. 

کپی برداری بدون ذکر منبع، بر اساس قانون جرائم اینترنتی و مادۀ 12 فصل سوم قانون جرائم رایانه ای غیر قانونی بوده و مجازات جزای نقدی و حبس دارد و شرعا نیز حرام است! 

اگر در زمینه علم داده و داده کاوی در حال تحقیق یا پیاده سازی پروژه تجاری یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام، واتزآپ و تمامی پیام رسان های ایرانی(سروش، آی گپ، بله و ویسپی) با شماره 09120637751 حضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد. 


افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.