استخراج اتوماتیک داده از وب برای کاربرد سیستمهای هوشمندی تجاری

استخراج اتوماتیک داده از وب برای کاربرد سیستمهای هوشمندی تجاری


  • 45 بازدید

 آکادمی داده  که به زودی پنجمین سال فعالیت خود را جشن می گیرد سالهاست به دنبال ایجاد محتوای مفید برای علاقه مندان علوم داده‌کاوی، متن کاوی و علوم مرتبط با علم داده، مدیریت دانش، هوش تجاری و مباحث مرتبط است.  آکادمی داده  امیدوار است با این اقدامات بتواند اثری هر چند اندک در افزایش آگاهی علاقه مندان به این حوزه ها داشته باشد. در این سری مقالات  آکادمی داده  تلاش دارد مقالات جالب، جدید، پر محتوا و اثرگزار را در علوم داده‌کاوی، متن کاوی، مدیریت دانش، هوش تجاری و مباحث مرتبط ارایه نماید. در این سری مقالات ابتدا مقدمه و سپس نتیجه گیری مقالات ارایه شده است و سپس‌ فایل پی دی اف مقاله برای دانلود رایگان علاقه مندان توسط  آکادمی داده تهیه شده و قابل دانلود است.

چکیده: 
دسترسی به اطلاعات بازار، رقباء و مشتریان از طریق موتورهای جستجوگر و مرور دستی تقریبا ناکارآمد و خمیر بهینه است هدف از این تحقیق ارایه یک روش کار آمد و الگوی موفق برای استخراج اتوماتیک داده از وب و مجتمع سازی آنها با اطلاعات انباره داده سازمانی برای کاربرد سیستم های هوشمندی تجاری است. در این روش با استفاده از یک نرم افزار تجاری و تکنولوژی رابر یک معماری موثر و قوی برای فرآیندهای استخراج، ساختاردهی مجدد و بارگذاری داده ها به سیستم هوشمندی تجاری ایجاد شده است. نتایج بدست آمده نشان می دهد که تکنولوژی رایر برای استخراج داده های خارجی و مجتمع سازی آنها با داده های انباره داده سازمانی بسیار مناسب و کارآمد می باشد.

نتیجه گیری 
در این مقاله چگونگی استخراج اتوماتیک داده های شبه ساخت یافته از وب برای کسب اطلاعات بازار و رقباء و پشتیبانی از تصمیم بیان گردید. همچنین قابلیتهای نرم افزار LixTo در مورد تولید را پر و پردازشهای موثر روی داده های وب توضیح داده شدند. نتیجه این پردازشها یک فایل XML ساختیافته است که براحتی میتواند بوسیله سیستم های هوشمندی تجاری باهر پایگاه داده با رابط استاندارد مورد استفاده قرار گیرد. همچنین روش ایجاد ناحیه میانجی و بارگذاری داده ها به انباره داده اوراکل با استفاده از رابط JDBC توضیح داده شدند. مجتمع سازی داده های خارجی با سیستم های هوشمندی تجاری دارای مزیتهای متفاوتی است که در زیر خلاصه میشوند:
 1- مجتمع سازی سریع داده ها برای پشتیبانی از واکنش سریع سازمان به نیازها و تغییرات بازار
 ۲- فعال سازی مکانیزم های هشدار توسط عامل های گزارش دهی سیستم هوشمندی تجاری
 ٣- کسب تصویر واقعی تر از بازار
 ۴- کاهش هزینه های آموزش بعلت داشتن رابط گرافیکی
5- کاهش زمان و هزینه تلاش افراد برای بازیابی اطلاعات
 ۶- کاهش خطاهای جمع آوری و تجمیع داده ها
 ۷- دسترسی به منابع داده بیشتر با دانه بندی دلخواه
 ۸- بهبود نمایان سازی و افزایش کیفیت داده
بدین ترتیب دانشگران و تحلیل گران داده قادر به کسب اطلاعات در مورد وضعیت های بازار، رقباء، قیمت محصولات و مواد و ارزیابی رفتار بازار به صورت بلادرنگ خواهند بود. آگاهی سریع درمورد این امر منجر به اخذ تصمیمات درست و به موقع و افزایش توان رقابتی سازمان می گردد. همچنین تکنولوژی راپر برای استخراج داده های خارجی سازمان و مجتمع سازی با داده های انباره داده بسیار مناسب و کارآمد می باشد.

این مقاله توسط آکادمی داده تهیه شده است و از طریق لینک قابل دسترسی است. محققین علاقه مند می توانند آن را به صورت رایگان دریافت نمایند. 

مجموعه مقالات فارسی در مورد هوش تجاری یا هوشمندی کسب و کار  که شامل چهار صد 400 مقاله فارسی در مورد هوش تجاری یا هوشمندی کسب و کار است به صورت یکجا نیز از طریق لینک قابل دسترسی هستند. 

 

اگر در حال پژوهش در حوزه داده کاوی هستید، سوالات و اشکالات خود را از طریق تلگرام با آکادمی داده در میان بگذارید. با عضو شدن در کانال تلگرام  آکادمی داده از مقالات جدید و دیتاست های منتشر شده مطلع شوید. 

اگر در زمینه داده کاوی در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام (https://t.me/dataacademyحضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد.