اندر حکایات داده کاوی

اندر حکایات داده کاوی


  • 604 بازدید

داده كاوی فرآیند اكتشاف اطلاعات  و روندهای نهفته از درون حجم بسیار زیاد داده هایی است كه در قالب پایگاه های ای، انباره داده دادهای یا هرنوع انباره اطلاعاتی ذخیره می شود. داده كاوی اطلاعات  موجود در انبار دادهها را استخراج و دادهها را به دانشی حیاتی و مهم در ارتباط با كسب و كار تبدیل مینماید. این ابزار سایر سیستمهای پشتیبانی تصمیمگیری را كامل نموده و گاهی جایگزین آنها می گردد. از طریق داده كاوی  و دانش جدیدی كه در اختیار قرار می دهد، افراد میتوانند از داده ها بعنوان اهرمی جهت خلق فرصتها یا ارزشهای جدید در سازمان خود استفاده كنند. داده كاوی می تواند هم برای مسائل طبقه بندی و هم برای رگرسیون بكار گرفته شود. در مسائل طبقه بندی، دستهای از اشیا كه در داخل یک طبقه ای قرار دارند پیش بینی میشوند و در مسائل رگرسیون، یكسری از اعداد، پیش بینی میشوند.

داده كاوی تركیبی از فناوریهای یادگیری ماشین ، تشخیص الگو، آمار، تئوری پایگاه داده و خلاصه كردن و ارتباط بین مفاهیم و الگوهای جالب بصورت خودكار از پایگاههای داده شركتهای بزرگ است. هدف اصلی داده كاوی  كمک به فرآیند تصمیمگیری از طریق استخراج دانش از دادههاست.

دو كاربرد اصلی داده كاوی  عبارتند از: پیشبینی، كه شامل پیدا كردن روابط و الگوهای ناشناخته از مقادیر شناخته شده است. توصیفات، كه شرح یک پایگاه داده بزرگ را ارائه میكند.

فرآیند داده كاوی  بطور كلی شامل مراحل زیر است:

پاكسازی داده ها: در این مرحله دادههای نامعتبر از مجموعه دادههای آموزشی خارج میشوند. دادههای دارای نویز اطلاعات  ناقص و مواردی از این دست، نمونههایی از دادههایی هستند كه باید پاكسازی شوند.

یكپارچه سازی دادهها: در این مرحله، منابع چندگانه دادهای باهم تركیب میشوند.

انتخاب داده ها: دادههای مرتبط به فرآیند داده كاوی  از سایر دادهها جدا میشوند. این مبحث را میتوان بخشی از فرآیند كاهش اطلاعات نیز دانست.

تبدیل دادهها: دادهها به ساختاری قابل استفاده برای داده كاوی  در میآیند. از اعمالی كه در این مرحله صورت میگیرد میتوان به خالصهسازی یا محاسبه مقادیر تجمعی اشاره كرد.

داده كاوی : بخش اصلی فرآیند كه در آن با استفاده از روشها و تكنیکهای خاص، استخراج الگوهای دانش صورت میگیرد.

ارزیابی الگوها: تشخیص الگوهای صحیح موردنظر از سایر الگوها در این مرحله انجام میشود. صحت الگوها براساس یک سری معیارهای جذابیت سنجیده می شود.

بازنمایی دانش: در این بخش به منظور ارائه دانش استخراج شده به كاربر، از یک سری ابزارهای بصریسازی به منظور افزایش درک استفاده می شود.

منبع:  داده کاوی و کاربرد آن در صنعت گردشگری، سوده برزمینی

کپی برداری بدون ذکر منبع، براساس قانون جرایم اینترتی و مادۀ 12 فصل سوم قانون جرایم رایانه ای غیر قانونی بوده و مجازات جزای نقدی و حبس دارد و شرعا نیز حرام است!

 

اگر به پژوهش در حوزه داده کاوی علاقه مند هستید توصیه می شود حتما مجموعه بی نظیر پانصد مقاله فارسی در زمینه داده کاوی  و مجموعه های مشابه آن  و مقالات مرتبط با کاربرد داده کاوی در پیش بینی بیماری را تهیه بفرمایید.

اگر در زمینه متن کاوی در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام (https://t.me/dataacademyحضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد.