آموزش عملگرهای رپیدماینر، عملگر (Read Database)

آموزش عملگرهای رپیدماینر، عملگر (Read Database)


  • 642 بازدید

داده کاوی علمی است که به دنبال پیدا کردن الگوی نهفته از داده های خام است. ولی این الگوی نهفته چگونه و با چه ابزاری باید از داده خام استخراج شود؟ 

چه چیزی داده کاوی نیست؟

داده کاوی چیست؟

نرم افزار رپیدماینر بسیار محبوب است زیرا توانسته برای پیاده سازی مسائل مختلف داده کاوی راه حل های مفیدی ارائه دهد. هزاران مقاله در زمینه داده کاوی با استفاده از رپیدماینر پیاده سازی شده اند که در وب سایت دیتاهارت دهها مقاله فارسی در مورد داده کاوی که با رپیدماینر پیاده سازی شده اند به صورت رایگان در اختیار علاقه مندان داده کاوی قرار داده است که می توانید آن ها را دانلود کنید. خواندن این مقالات به شما این امکان را می دهد که با قابلیت های نرم افزار رپیدماینر بیشتر آشنا شوید. 

انجام پایان نامه در حوزه متن کاوی

در این سلسله مقالات ابزار داده کاوی رپیدماینر به عنوان قویترین ابزار پیاده سازی آموزش داده می شود. مانند دیگر ابزارهای، ابزار داده کاویِ رپیدماینر نیز از عملگرها تشکیل شده است بدین ترتیب که با استفاده از اتصال عملگرها، مدلهای داده کاوی ایجاد شده و مورد استفاده قرار می گیرد. بدین ترتیب در ادامه مخاطب با عملگرهای رپیدماینر آشنا می گردد. لازم به ذکر است که این توضیحات از کتاب داده کاوی کاربردی صنیعی آباده برداشته شده است که البته ترجمه کلمه به کلمه از توضیحات داخل خود نرم افزار رپیدماینر است. 

شرح عملگر این عملگر یک مجموعه داده را از پایگاه داده SQL می خواند. پرس وجوی SQL می تواند به صورت خودکار ایجاد شده و با در اختیار قرار دادن یک نام جدول از طریق یک پارامتر به RapidMiner منتقل شود و یا در مورد عبارت های طولانی SQL، در یک فایل جداگانه قرار گیرد. روش مورد نظر را می توان با استفاده از پارامتر define query تعیین نمود. توجه داشته باشید که نام ستون ها اغلب نسبت به بزرگی و کوچکی حروف حساس بوده و ممکن است نیاز به قرار دادن در علامت نقل قول داشته باشد. احتمالا پایگاه داده های مختلف در این حالات، به صورت متفاوتی رفتار کنند. پیش از ارسال یک عبارت به پایگاه داده، نیاز به ایجاد اتصال به پایگاه داده دارید. امکان استفاده از مدیریت اتصالات پایگاه داده از منوی ابزار (Tool) در پنجره اصلی وجود دارد. همچنین می توان از پارامتر Connection این عملگر استفاده نمود. در این صورت یک واسط گرافیکی برای تنظیم جزئیات مختلف مانند Database System ,Port، Host ، نام کاربری و گذرواژه عبور نمایش داده خواهد شد. دکمه Test امکان آزمودن اتصال ایجادشده را فراهم می کند. پس از ذخیره اتصال جدید، از منوی آبشاری، پارامتر Connection انتخاب می شود. زمانی که عملگر اجرا شد، جدول به دست آمده با استفاده از پرس و جو در حافظه کامپیوتر شما کپی خواهد شد.
این کار دستیابی سریع به داده ها را برای عملگرهای بعدی فراهم می کند. حتی برنامه های یادگیری مانند SVM با تعداد بالای دست یابی های تصادفی، نیز با این راهکار به سرعت اجرا خواهند شد. اگر جدول برای حافظه اصلی بسیار بزرگ باشد، می توان از عملگر Stream Database استفاده نمود که تنها قسمتی از جدول را در حافظه نگاه می دارد. زیرا جداول دارای مقادیر با حجم های متفاوت هستند، اما سرعت دستیابی نرم افزار در صورتی که رکورد مورد نظر قبلا در حافظه ذخیره نشده باشد، کمتر خواهد بود.

 آکادمی داده در تلگرام (https://t.me/dataacademyحضور دارد برای ارتباط از طریق ایمیل، آدرس جیمیل: dataacademyir@gmail.com می باشد.  

افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.