پرسش و پاسخ های تلگرامی در حوزه علم داده 9

پرسش و پاسخ های تلگرامی در حوزه علم داده 9


  • 296 بازدید

در این بخش پرسش و پاسخ های که در گروه های تلگرامی در حوزه علم داده رد و بدل می شود ارائه خواهد شد. بد نیست این مقدمه خوانده شود.
جامعه‌مان به شدت دارد کوتاه‌مدت می‌شود. چیزی شبیه مفهوم «جامعه کلنگی» کاتوزیان. کاتوزیان در مقاله‌ای که بعدها به‌صورت کتاب در آمد، جامعه ایران را کلنگی می‌نامد؛ بدین معنا که هر حکومت و هر مسئولی که آمد، هر آنچه حکومت و مسئولین پیش از وی ساخته‌ بودند را از بیخ و بن ویران، و خود از نو شروع به ساختن می‌کند. قاجارها یادگارهای صفوی را ویران کردند؛ پهلوی‌ها دستاوردهای قاجاریان را و جمهوری اسلامی، دستاوردهای پهلوی را. به همین ترتیب، هر رئیس‌جمهورمان در جمهوری اسلامی نیز، دستاوردهای رؤسای جمهور‌ پیشین ‌را از بیخ و بن ریشه‌کن کرد تا خود طرحی نو در اندازد؛ بی‌آنکه بداند رئیس‌جمهور بعدی، همین‌ بلا را سر خود او خواهد آورد.
به همین شیوه، همین که فیس‌بوک با استقبال ایرانیان روبرو می‌شود، فیلتر می‌گردد؛ تلگرام هم همین طور. در بسیاری از این شبکه‌ها، سرمایه‌ی اجتماعی‌ای شکل می‌گیرد که این روزها ایران به شدت به آن نیاز دارد. صدها استاد دانشگاه، روزنامه‌نگار، روحانی، شبکه‌ی خبری داخلی و… در تلگرام توانسته‌اند اعتماد مردم را جلب کرده و سرمایه‌ی اجتماعی ایرانیان را از دل همین کانالها شکل یا افزایش بدهند. با فیلتر شدن تلگرام، نه تنها ده‌ها هزار کسب و کار تلگرامی از بین خواهد رفت، بلکه این سرمایه‌ی اجتماعی که اهمیتش از آن کسب و کارها به مراتب بیشتر است نیز ویران خواهد شد. تا شبکه اجتماعی دیگری بین مردم جا بیفتد و سرمایه‌ی اجتماعی دوباره‌ای جان بگیرد، بخش زیادی از این سرمایه‌ها برای همیشه از ایران رخت بر خواهد بست. جامعه‌شناس فرانسوی، بوردیو، از امکان تبدیل سرمایه‌ها به یکدیگر سخن می‌گوید. یعنی شما می‌توانی از سرمایه اقتصادی‌ات برای توسعه سرمایه اجتماعی سود ببری یا بالعکس. از میان برداشتن سرمایه‌های اجتماعی در تلگرام، زیانی برابر یا حتی بیشتر از نابودی سرمایه‌های اقتصادی دارد. مانند این است که مسئولین بگویند همه دارندگان حساب در فلان‌ بانک،‌ حساب‌شان که‌ طی این‌ چند سال و‌ با تلاش و کوشش پس‌انداز کرده‌اند، مسدود و نابود شده و ‌می‌توانند از ابتدا در بهمان ‌بانک ‌حساب باز کرده ‌و دوباره از اول شروع به پس‌انداز کنند.
 بی‌گمان سرمایه‌ی اجتماعی‌ای که در آینده و شبکه اجتماعی دیگری شکل بگیرد نیز، همچون همین فیس‌بوک و تلگرام، هیچ تضمینی بر ماندگاری‌اش نیست. بدین شیوه، صدها سال است در چرخه‌ای از ساختن و ویران کردن دچار شده‌ایم و پیشرفت بر پایه داشته‌ها و انباشته‌های پیشین‌ را، تنها در کشورهای همسایه‌ای می‌بینیم که روز به روز از ما بیشتر فاصله می‌گیرند.
منبع : https://t.me/moghaddames

با توجه به فیلتر تلگرام و عدم دسترسی افراد علاقه مند به حوزه علم داده در مدت های آتی، آکادمی داده تصمیم گرفت سوال ها و جواب های مفید که ممکن است مورد سوال دهها تن باشد را در مقالاتی ارائه دهد. البته باید در نظر داشت که تضمینی بر درستی پاسخ ها وجود ندارد ولی قطعا می تواند در راه رسیدن به پاسخ صحیح تر راهگشا باشد. با توجه به ازدیاد این سوالات و پاسخ ها امکان منبع نویسی برای آن ها و اینکه سوال کننده و پاسخ دهنده چه کسانی بودند میسر نیست به همین دلیل به گروههای که این مباحث در آن ها مطرح شده است بسنده خواهد شد. با امید به این که برای علاقه مندان علم داده، داده کاوی، متن کاوی و علوم مرتبط مفید باشد.

افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است. 

 


من یک پروژه برای ارائه میخوام راجع به وب کاوی ترجیحا یکی از این 3 موضوع باشه. 
وب کاوی در پزشکی
وب کاوی در تجارت الکترونیک
وب کاوی در ردیابی چشم.
اگر کسی میتونه کمکم کنه ممنون.
یکی از روش های ردیابی چشم روش های مبتنی بر Mininig Click Stream هست که می توانید جستجو کنید. کاربردهای فراوانی در وب کاوی در حوزه تجارت الکترونیک وجود دارد که باید دقیقا فیلد خودتان رو مشخص کنید.


افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است. 


سلام دوستان کسی میدونه الگوریتمی برای تبدیل دیتاها ( لینک های صفحات وب که خودشان دارای زیر مجموعه هستند) به گراف وجود دارد؟
شما ابتدا باید با روش های crawling تمام لینک های موجود در صفحات سایت ها رو کرال کنید و سپس با ابزارهای تحلیل شبکه اجتماعی گراف رو رسم کنید.
توی cousera.org یه کلاس هست mmds، توی فصل اول کلاس راجع به الگوریتم پیج رنک صحبت کرده، الگوریتم های دیگه هم راحع به این چیزا توضیح میده

افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است. 


سلام بر دوستان در مورد مدیریت ریسک کارهای اعتباری بر اساس داده کاوی اگه مقاله انگلیسی  جدید دارین برام لطف میفرمایید.
سرچ بزنید پیدا میشه،
البته حوزه ی دقیقش کاریتون رو نمیدونم چی هست، ولی این فکر کنم به درد بخوره:
http://ieeexplore.ieee.org/xpl/articleDetails.jsp?tp=&arnumber=5713481&url=http%3A%2F%2Fie
eexplore.ieee.org%2Fxpls%2Fabs_all.jsp%3Farnumber%3D5713481

افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است. 

سلام دوستان ✋️
کسی درسی تو دوره هایی چون coursera یا جاهای دیگه در رابطه با نظر کاوی یا آنالیز احساسات سراغ نداره؟ یا دوره ای که مسائل حایز اهمیت این فیلد رو بیان کنه؟
سلام. این کتاب رو مطالعه کنید. اورویو از بیش از 400 مقاله در این زمینه است. کلیه مباحث، تعاریف، سطوح نظرکاوی شامل سطح داکیومنت، سطح فیچر و سطح جمله و دسته بندی روش ها رو داره. ساده هم هست متنش:
Sentiment Analysis and
Opinion Mining
April 22, 2012
Bing Liu

افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است. 


سلام دوستان در مورد کاربردهای web mining اگر مقاله,کتاب ویا منبع دیگری رو میشناسین ممنون میشم راهنماییم کنین.
سپاسگزارم
Data Mining the Web: Uncovering Patterns in Web Content, Structure, and Usage

 

افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است. 

سلام بچه ها . توی وب کاوی بغیر از قوانین انجمنی ، الگوهای ترتیبی و خوشه بندی ، از چه تکنیک هایی میتونیم برای کشف الگو و فیلتر کردن استفاده کنیم ؟
سایر متدها و الگوریتم هایی چون شناسایی داده های پرت،  تحلیل شبکه اجتماعی و...  رو هم می توانید در وب کاوی استفاده کنید.

افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است. 


سلام. کتابخانه stanford nlp pos tagger مدل زبان فارسی رو نداره، برای عربی اما داره، کسی میدونه مدل هاشو چطور آموزش داده؟ من میخوام برای فارسی یه مدل تهیه کنم
برای پیاده سازی یک Pos Tagger شما اول نیاز به یک پیکره لیبل خورده جهت Train مدل دارید که در صورتی چنین پیکره ای نداشته باشید پیاده سازی آن کمی وقت گیر خواهد شد!  ماژول Pos tagger کتابخانه هضم پایتون عملکرد خوبی دارد و می توانید از آن استفاده کنید

افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است. 


سلام دوستان 
من میخوام در زمینه دیتا استریم ماینینگ کار کنم خوشحال میشم اگه کسی در این زمینه اطلاعاتی داره بهم کمک کنه
از مقاله گرفته تا هرچیز دیگه ای ممنونم
فصل 9 این کتاب به شکل عملی توضیح داده:   http://it-ebooks.info/book/4484/

افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است. 


باسلام خدمت مدیرگروه ودوستان لطفا بنده راراهنمایی کنیدمیخام پایان نامه کار کنم به نظرتان چه موضوعی راکارکنم هم مطلب زیادباشه راجبش وهم به روزباشه / رشته ام نرم افزارکامپیوتره
سلا م  گام اول در مسیر انتخاب موضوع:  صادق بودن با خود و تصمیم جدی برای انجام دادن درست کار.  صادق بودن با خود یعنی اینکه ، بدون اینکه با خودتون تعارف داشته باشید مشخص کنید که به چه حوزه ای از علوم کامپیوتر علاقمند هستید. علاقمندی به زمینه ی کاری یکی از مواردی هست که میزان خستگی و کلافه گی در مسیر تحقیق رو تعدیل میکنه.