کاربرد یادگیری عمیق در تشخیص ترافیک شبکه های کامپیوتری

کاربرد یادگیری عمیق در تشخیص ترافیک شبکه های کامپیوتری


  • 1,072 بازدید

 آکادمی داده  که به زودی پنجمین سال فعالیت خود را جشن می گیرد سالهاست به دنبال ایجاد محتوای مفید برای علاقه مندان علوم داده‌کاوی، متن کاوی و علوم مرتبط با علم داده، مدیریت دانش، هوش تجاری و مباحث مرتبط است.  آکادمی داده  امیدوار است با این اقدامات بتواند اثری هر چند اندک در افزایش آگاهی علاقه مندان به این حوزه ها داشته باشد. در این سری مقالات  آکادمی داده  تلاش دارد مقالات جالب، جدید، پر محتوا و اثرگزار را در علوم داده‌کاوی، متن کاوی، مدیریت دانش، هوش تجاری و مباحث مرتبط ارایه نماید. در این سری مقالات ابتدا مقدمه و سپس نتیجه گیری مقالات ارایه شده است و سپس‌ فایل پی دی اف مقاله برای دانلود رایگان علاقه مندان توسط  آکادمی داده تهیه شده و قابل دانلود است.

چکیده 
به طور کلی، اغلب سیستمهای تحلیل ترافیک شبکه های کامپیوتری مبتنی بر ویژگی هستند که این ویژگی ها شامل مواردی همچون شماره درگاه، نمادهای ثابت و ویژگی های آماری می باشند. مشکل اصلی تحلیل ترافیک به منظور تشخیص ترافیک  و یا کشف ناهنجاری، یافتن ویژگی های مناسب در ترافیک است. فرآیند یافتن ویژگی های مناسب، عموما امری زمان بر است. همچنین این روش برای انواع ناشناخته ترافیک و ناهنجاری پاسخگو نیست. برای حل این مشکل، ما روشی مبتنی بر یادگیری عمیق و شبکه های عصبی مصنوعی ارائه می کنیم. نتایج شبیه سازی های این روش نشان می دهند که این روش در کاربردهایی همچون یادگیری ویژگی، تشخیص ترافیک و کشف ناهنجاری مفید واقع می شود.

نتیجه گیری 
با توجه به نتایج به دست آمده که معیار خوبی برای قیاس روش های مبتنی بر یادگیری عمیق با سایر روش ها هستند، می بینیم که استفاده از این روش مفید واقع شده است. با علم به آنکه هر ساله بر حجم ترافیک جاری در شبکه های کامپیوتری افزایش می شود و به فراخور آن کابرد های جدید نیز اضافه می شوند، ازین رو شناسایی ترافیک به منظور مدیریت پهنای باند و تشخیص ترافیک های مخرب دارای اهمیت ویژه ای شده است. همانگونه که پیش تر نیز ذکر شد، به منظور شناسایی هر پروتکل جدید، نیازمند استخراج ویژگی ها مناسب برای آن پروتکل جدید هستیم. این فرآیند وابسته به آن است که ویژگی های مناسبی برای شناسایی پروتکل جدید توسط فرد خبره استخراج شود. بدیهی است در این رویه امکان خطا انسانی وجود دارد، که منجر به عدم عملکرد صحیح در دسته بندی انواع ترافیک می شود.
استخراج ویژگی توسط روش ارائه شده در این مقاله نسبت سایر روش های ارائه شده از جمله روش های مبتنی بر معیارهای آماری بسیار سریعتر است. علت این امر این است که محاسبات این روش عمدتا مبتی بر محاسبات برداری و ماتریسی است. این خود سبب می شود که سرعت بالایی در استخراج ویژگی نسبت به روش های احتمالاتی داشته باشیم. زیرا روش های آماری در دادگان بالا به خوبی روش ارائه شده توسط ما نیستند.
از طرف دیگر مشکل مدل های یادگیری عمیق، نیاز آنها به حجم زیادی از دادگان به منظور آموزش است. به علت آنکه این مدل ها متشکل از چندین لایه پنهان هستند اگر تعداد دادگان آموزش کم باشد، تنظیم بهینه وزن ها هم به صورت صحیح و کامل انجام نمی شود. همچنین نقطه آغازین برای شروع تنظیم وزن ها بسیار مهم است. اگر تنظیمات آغازین شبکه به اندازه کافی مناسب نباشند، ممکن است بهینه سازی وزن ها در یک بهینه محلی متوقف شود. چراکه تابع هزینه ای  که سعی به کمینه کردن آن داریم، یک تابع غیر محدب است.
مشکل دیگری که در پیاده سازی شبکه های عصبی عمیق وجود دارد، این است که با افزایش عمق شبکه نیاز به قدرت محاسباتی افزایش می یابد و دیگر CPU های معمول قادر به انجام محاسبات در زمان معقول نیستند. لذا برای انجام محاسبات باید به سراغ منابع پردازشی توانمندتری همچون GPU ها رفت، که خود پیچیدگی های پیاده سازی خاص خود را دارد.
با توجه به پتانسل شبکه های عمیق در استخراج ویژگی های دادگان بدون نیاز به برچسب گذاری و به شکل خودکار، در برنامه کاری آینده ما است که دسته بندی ترافیک رمز شده، دسته بندی ترافیک حاصل از شبکه های نظیر به نظیر و یا تشخیص ناهنجاری ها با استفاده از ویژگی های استخراج شده از شبکه عصبی مصنوعی عمیق انجام دهیم. همچنین با توجه به این مطلب که در شبکه های کامپیوتری نوعی وابستگی زمانی و مکانی بین دادگان وجود دارد، به نظر می رسد مدل سازی به کمک مدل هایی که این وابستگی ها را به شکلی دنبال می کنند، مانند مدل شبکه های عصبی کانولوشنال یا مدل شبکه های عصبی بازگشتی و یا مدل های گرافیکی مانند ماشین بولتزمان مقید شده ،روش های مناسب تری برای تشخیص ترافیک شبکه باشند. ارائه روشی مبتنی بر این مدل ها نیز جزء برنامه های آینده ماست.

این مقاله توسط آکادمی داده تهیه شده است و از طریق لینک قابل دسترسی است. محققین علاقه مند می توانند آن را به صورت رایگان دریافت نمایند. 

اگر در حال پژوهش در حوزه داده کاوی هستید، سوالات و اشکالات خود را از طریق تلگرام با آکادمی داده در میان بگذارید. با عضو شدن در کانال تلگرام  آکادمی داده از مقالات جدید و دیتاست های منتشر شده مطلع شوید. 

مجموعه مقالات فارسی در مورد یادگیری عمیق که شامل 50 مقاله فارسی در مورد الگوریتم ها و روش های یادگیری عمیق است به صورت یکجا نیز از طریق لینک قابل دسترسی هستند. 

اگر در زمینه داده کاوی در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام (https://t.me/dataacademyحضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد.