به نظر میرسد پیشبینی ورشكســتگي مشــهورترين عنوان براي كاربرد روشهای دادهکاوی دردادههاي مالي اســت ورشكســتگي شرکتها باعث خســارات اقتصادي فراواني براي مديريت، سرمایهگذاران، اعتباردهندگان کارمندان شــده و هزینههای اجتماعي بسياري نيز در بر خواهد داشت. رويكردهاي آماري مانند تحليل تشخيصي و تحليل لاجيت و پروبيت و همچنین رويكرد فنون هوشــمند محاسباتي شامل سیستمهای خبره ، شبکههای عصبي مصنوعي و در فرآيند پیشبینی ورشكستگي شرکتها قابلاستفاده میباشند. اغلب تحقيقات پیشبینی ورشكستگى، عملکرد هریک روشهای فوق را مقايسه میکنند، اما بهطور قطعى نمیتوان اظهار داشت كه کدامیک از اين روشها، از دقت كلى بيشترى در مقايسه با سایر روشها برخوردار است. پیشبینی ورشكستگي بهوسیله دادههای صورتهای مالي نخستين بار از آثار آلتمن (1968) سرچشمه گرفته است آلتمن استدلال میکند ورشكستگي فرآيندي بلندمدت است، ازاینرو صورتهای مالي،میتواند حاوي هشدارهايي از رخداد يك ورشكستگي قریبالوقوع باشد. وي با بهکارگیری تحليل تشخيصي چندگانه مدلي را براي پیشبینی ورشكستگي شرکتها ایجاد کرد. در همین حال بسياري از محققان نیز مدلهای جايگزين را با استفاده از فنون آماري گسترش میدادند.
آموزش ابزارِ داده کاوی رپیدماینر
معرفی منابع برای یادگیری داده کاوی
لين و مك لين(2001)تلاش كردند تا با استفاده از 4 روش متفاوت، ورشكستگي شرکتها را پیشبینی نمايند 2 مورد از اين روشها،روشهای آماري (تحليل تشخيصی ور گرسيون لجستيك و دو مورد ديگر نيز از فنون يادگيري ماشــين (درختان تصمیمگیری و شبکههای عصبي) بودهاند همچنين آنها بر اساس روشهای پیشگفته، الگوریتمى تركيبي را نيز پيشنهاد كردند نمونه مورداستفاده شامل 1133 شركت تجاري انگليسي بوده است 690 شركت موفق و 106 شركت ناموفق بهعنوان مجموعه آموزشي و 289 شركت ناموفق و 48 شركت موفق بهعنوان مجموعه آزمايشي استفاده شدند تلاشي براي تطبيق کمپانیهای موفق و ناموفق صورت نگرفت37 مورد از نسبتهای مالي، برگرفته از ترازنامه و صورت ســود و زيان بهعنوان متغيرهاي ورودي انتخاب شد دو روش انتخــاب ويژگى بكار رفته، متغيرهاي ورودي را با اعمال قضاوت انســان به 4 و با اعمال تحليل واريانس به 15 مورد کاهش داده اســت نتايج حاصل از روشهای شبکههای عصبى مصنوعي و درختان تصميم براي هردو انتخاب ويژگى مبتني بر قضاوت انسان و تحليل واريانس، قابلقبولتر از ديگر روشها بوده اســت سرانجام نويسندگان مقاله، الگوريتمي تركيبي را پيشنهاد میکنند كه رأیگیری وزندار طبقهبندی کنندههای مختلف را به كار میبرد. تانگ و همكاران (2004)يك روش تركيبي را با یکپارچه سازی شبکههای عصبي مصنوعي و سیستم های فازي بهکاربردهاند اين مدل كه شبكه عصبي فازي خود سازمانده عمومي ناميده میشود، يك سيستم مبتني بر قاعده است كــه مبتنى بر قانون فازى (اگر آنگاه ) بــوده كه نهایتاً منجر به خود تعديلي(اصلاح) پارامترهاي قوانين فازي با استفاده از الگوریتمهای يادگيري میگردد اين الگوریتمها از الگوي شبكه عصبي به دست میآیند مزيت اصلي شبکههای ِ عصبي فازي، توانايي در مدلسازی مسئلهای خاص با استفاده از یک مدل زباني سطح بالاي قابلفهم، برخلاف عبارات رياضي پيچيده هست اين مدل بهمنظور پیشبینی ورشكســتگي بانك بهکاررفته اســت متغيرهاي ورودي شامل 9 متغيرمالي بودهاند كه در بررسیهای قبلي اهميت آنها محرز شده است. نمونه مورداستفاده شامل دادههایی در خصوص 25555 بانك موفق و 548 بانك ناموفق بودهاند. 20 درصد از این دادهها بهعنوان مجموعه آموزشي ، و 80 درصد مابقی بهعنوان مجموعه آزمايش انتخاب شدند. همچنين براي كاهش خطاي نوع اول نمونه نسبت به تعداد بانکهای موفق و ناموفق، به ميزان مساوي تعديل گرديد. نويسندگان هنگام اســتخراج دادهها از آخرين صورتهای مالي، عملكرد مدل را 93 درصد، هنگامیکه اين دادهها از صورتهای مالي ســال قبل به دست آمد. ميزان عملکرد را 85 درصد و با دريافت دادهها از صورتهای مالي دو ســال قبل عملكرد را 75 درصد،گزارش نمودند مدل موردنظر،در حدود 50 قاعده فازي اگر آنگاه، توليد كرد كه تعاملات بين 9 متغير ورودي منتخب و اثرشان بر سلامت مالي بانکهای موردبررسي را، تشريح نموده است . شين و لى (2002)نیز مدلی مبتني بر الگوریتم ژنتيك پيشنهاد دادند آنها براين واقعيت تأکید كردند كه برخلاف شبکههای عصبي مصنوعي، الگوریتمهای ژنتيك میتوانند قوانيني قابلفهم ایجاد کنند در اين مورد، الگوریتمهای ژنتيك بهمنظور يافتن آستانه های يك يا چند متغير در بالا يا پايين ســطحي به كار رفتند كه موقعيت يك واحد تجاري را بحراني میسازد. اين مدل از ساختارى قاعدهمند بهره میبرد كه داراى 5 شرط است كه هركدام به يك متغير خارج از 9 نسبت ، تركيب خواهند شد. مجموعه دادهها مركب مالي، اشاره دارد اين شرايط با عملکرد عطف منطقي از 264 شركت موفق و 264 شركت ناموفق بوده و 9 نسبت مالي بهعنوان متغيرهاي ورودي انتخاب گرديدند درصد نمونه بهعنوان مجموعه آموزشی و 10 درصد نيز بهمنظور اعتبار سنجی به كار رفتهاند دقت كلى روش مزبور در حدود 80 درصد گزارش شد . ديميتراس وهمكاران (1998)به بررسى پیشبینی ورشكستگي با استفاده از نظريه مجموعه اوليه پرداختند. مجموعه آموزشــي مورداستفاده متشكل از 40 شركت ناموفق و 40 شركت موفق از ميان واحدهاي تجاري يوناني در يك دوره 5 ساله و مجموعه آزمايش نيز از 19 شركت ناموفق و 19 شركت موفق تشکیلشده بود 12 نسبت مالي بر اساس نظر مدير اعتباري بانكى يوناني بهمنظور ورود به جدول اطلاعات انتخاب گرديد. سرانجام قواعد تصميم تحليل تشخيصي و تحلیل لاجيت مقايسه وبرتري این روش نسبت به ساير روشها مشخص گرديد. پارك وهان نیز در سال 2002 در يك تحقيق بر اساس روش استدلال مبتني بر مورد، مدلي براي پیشبینی ورشكستگي بانکها طراحي كردند.
این مقاله از منبع " فناوری داده کاوی رویکردی نوین در حوزه مالی . نگارندگان دستگیر و شفیعی سردشت " استفاده کرده است.
کپی برداری بدون ذکر منبع، براساس قانون جرایم اینترتی و مادۀ 12 فصل سوم قانون جرایم رایانه ای غیر قانونی بوده و مجازات جزای نقدی و حبس دارد و شرعا نیز حرام است!
افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.