در این سلسله مقالات آکادمی داده به دنبال ارائه مطالبی است که محققین و علاقهمندان دانش علم داده با کاربردهای گسترده و عظیم این علم آشنا کند.
علم داده با ظهور شبکه های اجتماعی رشد بسیار زیادی کرد زیرا داده های منتشر شده روز به روز گستردهتر شد به همین دلیل کارها و تحقیقات انجام شده در این حوزه مطالعاتی نیز رشد چشمگیری کرد.
بدین ترتیب در این مقالات کارهای انجام شده بر روی داده های شبکه های اجتماعی با استفاده از روش های داده کاوی و یادگیری ماشین ارائه خواهد شد. امید است مطالعه این مقالات برای اشخاصی که به دنبال تحقیق و پژوهش در حوزه کشف دانش از شبکه های اجتماعی با بهره گیری از داده کاوی و یادگیری ماشین هستند مفید و سودمند باشد.
بردفورد در سال ۲۰۱۰ به دنبال شناسایی و جداسازی جنسیتی و کاربران شبکه اجتماعی در توییتر بوده است.
شناسایی جنسیت در بسیاری از موارد پركاربرد و از اهمیت بالایی برخوردار میباشد از مواردی كه میتوان به اهمیت این مسئله اشاره نمود در سیستمهای توصیه گر در حوزههای مختلف مانند فروش اینترنتی ، پیشنهاد فیلم ، کاربردهای پزشكی ، رژیمهای غذایی ، توصیههای ورزشی و ... میباشد بهعنوانمثال در یك سیستم فروش اینترنتی این سیستمها با حدس زدن شیوه تفکر کاربر به وی مناسبترین و نزدیکترین کالا به سلیقه او را شناسایی و پیشنهاد میکند حال اگر این پیشنهاد در راستای جنسیت كاربر هدفگذاری شود میتواند كمك بسیاری به این سیستم نماید و یا این سیستم میتواند موجب افزایش آگاهی کاربر درزمینهٔ موردعلاقه وی میشود مثلاً در حین ارائه توصیه به کاربر با توجه به جنسیت كاربر موجب میشود تا وی با اقلام و اشیاء جدیدی را که قبلاً آنها را نمیشناخته، آشنا شود.
در روشی که مستقل از زبان است سعی کرده با استفاده از اطلاعات پروفایل کاربر جنسیت کاربر را شناسایی کند.
این تحقیق از مجموعه داده شامل 146925 کاربر برای آموزش و 18000 کاربر برای تست استفاده شده است برای ایجاد مدل طبقهبندی از ۵ گروه ویژگی بهره گرفته شده است. نام، نام حساب، مکان، آدرس وب و توضیحات به عنوان ۵ ویژگی الگوریتم های ماشین بردار پشتیبان، نایو بیز برای ایجاد مدل ارسال شده است.
بنابراین دعای نویسنده دقت ۹۲ درصدی حاصل شده بدین ترتیب میتوان به این نتیجه رسید شناسایی جنسیت کاربران شبکه های اجتماعی به راحتی توسط اطلاعاتی که آنها در پروفایلشان منتشر میکنند قابل انجام است.
کپی برداری بدون ذکر منبع، بر اساس قانون جرائم اینترنتی و مادۀ 12 فصل سوم قانون جرائم رایانه ای غیر قانونی بوده و مجازات جزای نقدی و حبس دارد و شرعا نیز حرام است!
اگر در زمینه علم داده و داده کاوی در حال تحقیق یا پیاده سازی پروژه تجاری یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید. آکادمی داده در تلگرام، واتزآپ و تمامی پیام رسان های ایرانی(سروش، آی گپ، بله و ویسپی) با شماره 09120637751 حضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد.
افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.