مراحل خلاصه سازی مبتنی بر یادگیری ماشین - نمایش جملات بر اساس ویژگی

مراحل خلاصه سازی مبتنی بر یادگیری ماشین - نمایش جملات بر اساس ویژگی


  • 561 بازدید

امروزه با رشد سریع اطلاعات و ها، داده یافتن اطلاعات مناسب و كارا از اهمیت خاصی برخوردار است. هدف از خلاصه سازی  متن، فراهم كردن ای خلاصه از محتویات مطابق با اطلاعات مورد نیاز كاربر است. بنابراین كاربران میتوانند با سرعت بیشتری به اطلاعات موجود در متن دسترسی پیدا كنند. خلاصه سازی  در اصل فرآیند فشرده سازی  یك منبع است، به كه طوری نتیجه كار شامل اطلاعات مهم آن منبع باشد. به عبارت دیگر استخراج قسمتهای مهم از یك یا چند متن را خلاصه سازی  گویند.

 

متن کاوی چیست؟

منظور از طبقه بندی متون چیست؟

انجام پایان نامه در حوزه متن کاوی

سختی و پیچیدگی زبان فارسی در حوزه متن کاوی

در گام سوم هر یك از جملات به وسیله مجموعهای از ویژگیها بیان می شود. همانطور كه قبلا نیز اشاره شد، دو نوع ویژگی وجود دارد. نوع اول ویژگیهای غیرساختاری مانند تعداد تكرار كلمات و موقعیت جمله میباشد و نوع دوم ویژگیهای ساخت یافته مانند كلمات متضاد و كلمات بیان كننده علت هستند كه این نوع ویژگی مرتبط با مفهوم متن می باشد. به عنوان مثال جملات پیچیده میتوانند به چندین بخش مجزا تقسیم شوند. بخش اصلی یك جمله را هسته و بخشهای دیگر را تابع می نامند كه توسط یك رابطه معنایی مانند كلمات اما، اگر، زیرا به هم مرتبط شده اند. در صورت مشاهده این كلمات ارتباطی باید توجه داشت جمله هسته از اهمیت بیشتری برخوردار است و در نتیجه از شانس بیشتری برای حضور در خلاصه برخوردار می باشد. بر این اساس جملات موجود در متن را با استفاده از الگوریتمهای موجود به چندین سطح تقسیم بندی نموده و هسته و تابع آن را مشخص نموده و بر این اساس به هر جمله درجه اهمیت خاصی اختصاص می دهیم. در نهایت با در نظر گرفتن هر دو نوع ویژگی و مقادیر مربوطه آنها یك بردار ویژگی برای هر جمله از متن در نظر می گیریم. البته در این تحقیق تنها ویژگیهای غیر ساخت یافته مورد استفاده قرار گرفته اند كه شامل شماره پاراگراف، آفست جمله در پاراگراف، تعداد كلمات ریشه، تعداد كلمات عنوان و متوسط تكرار كلمات در هر جمله می باشد.

خلاصه سازی متون با تكنیكهای مبتنی بر یادگیری ماشین، شهرآئینی

اگر به پژوهش در حوزه متن کاوی علاقه مند هستید توصیه می شود حتما مجموعه بی نظیر هفتاد و چهار مقاله فارسی در زمینه متن کاوی  و مجموعه های مشابه آن را تهیه بفرمایید.

اگر در زمینه متن کاوی در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام (https://t.me/dataacademyحضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد.

افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.