مدرسه تابستانه مقدماتی علم داده ١۴۰١

حامد فکور

مدیرفنی تیم زاناپرداز و متخصص تحلیل داده در پژوهشگاه خواجه نصیر

صفحه شخصی

زمانبندی

تاریخ	شروع	پایان
1401-06-19	09:30	11:00
1401-06-19	11:30	13:00
1401-06-19	14:30	16:00
1401-06-19	16:30	18:00

هدف از برگزاری درس:

با توجه به رشد روز افزون داده‌ها در فضای مجازی، نیاز به تحلیل داده‌های موجود برای استخراج اطلاعات، امری اجتناب‌ناپذیر است. همانطور که می‌دانیم یکی از انواع داده‌ها، متن می‌باشد که بیشترین حجم را نسبت به سایر قالب‌های داده‌ای شامل می‌شود. روش‌ها و ابزارهای پردازش متن با هدف دستیابی هوشمند به اطلاعات این قالب داده‌ای استفاده می‌شوند. ما با بهره‌گیری از روش‌ها و ابزار پردازش متن در پایتون به دنبال پیاده‌سازی شیوه‌های استخراج اطلاعات متنی و بکارگیری آن در یک نیاز واقعی خواهیم بود.

دستاوردهای مخاطبین از این کلاس:

مخاطبین این کلاس قادر خواهند بود که با استفاده از کتابخانه‌های موجود در پایتون فرایند پیش‌پردازش متن از قبیل نرمال‌سازی، تشخیص زبان متن، تصحیح خطاهای املایی، برچسب‌زنی اجزای کلام و ... را انجام دهند.
شیوه عملکرد و نحوه پیاده‌سازی مدل‌های مختلف تبدیل متن به بردار ویژگی‌ها از جمله TF-IDF، Word2Vec و FastText را آموزش خواهند دید.
با استفاده از روش‌های یادگیری ماشین و کتابخانه‌های موجود، می‌توانند عملیات دسته‌بندی متون را پیاده‌سازی ‌نمایند.

حامد فکور

مدیرفنی تیم زاناپرداز و متخصص تحلیل داده در پژوهشگاه خواجه نصیر

پردازش متن کاربردی کلاس

زمانبندی