معرفی محصول
امروزه در بسیاری از مواقع با حجم کلانی از داده ها مواجه هستیم. پیشرفت سریع تکنولوژی در قرن اخیر ما را با حجم عظیمی از اطلاعات مواجه کرده است. تحلیل این داده ها با توجه به متغیرهای کمکی فراوانی که معمولا در اختیار است، بسیار چالش برانگیز است. بعد بالای متغیرها و تاثیرات متفاوت آنها به همراه اثر متقابل متغیرها، موجب شده نحوه مدل بندی و تحلیل این گونه داده ها متفاوت از داده های معمول باشد. در این زمینه می توان به روش های داده کاوی برای تسهیل فرایند تحلیل داده ها مراجعه کرد. یکی از راه کارها برای مدل بندی و تحلیل این مجموعه داده ها استفاده از الگوریتم هایی با قابلیت محاسباتی بالاتر از قبیل جنگل تصادفی است.
جنگلهای تصادفی یا جنگلهای تصمیم تصادفی یک روش یادگیری ترکیبی برای دستهبندی و رگرسیون میباشد، که بر اساس ساختاری متشکل از شمار بسیاری درخت تصمیم، بر روی زمان آموزش و خروجی کلاسها (کلاسبندی) یا برای پیش بینیهای هر درخت به شکل مجزا، عمل میکنند.
ویژگی های محصول
- مدرس: ابوالفضل بامری
- تخصص: نقشه برداری رقومی خاک و ارزیابی تناسب اراضی
- موضوع: آموزش الگوریتم جنگل تصادفی (Random Forest) در نرم افزار R و RStudio
- نرم افزار: R و RStudio
- مخاطب: علاقه مندان به علم داده کاوی و برنامه نویسی و کاربران علوم مکانی
- نوع آموزش: ویدیویی
- پاورپوینت: دارد
- داده های تمرینی: دارد
- کدهای آموزش: دارد
- پیش نیاز: دارد ( مقدمه ای بر برنامه نویسی نرم افزار R و تحلیل مقدماتی داده های مکانی در نرم افزار R و RStudio)
معرفی مدرس
- ابوالفضل بامری
- عضو هیئت علمی دانشگاه زابل
- متخصص نقشه برداری رقومی خاک و ارزیابی تناسب اراضی
- مدرس برنامه نویسی R
در این مجموعه سعی شده است به صورت پروژه محور الگوریتم جنگل تصادفی برای دستهبندی و رگرسیون آموزش داده شود
عناوین آموزشی
- آشنایی با دیتاست Iris
- بررسی آمار توصیفی داده ها
- محاسبه چولگی و کشیدگی داده ها
- بررسی نرمال بودن توزیع داده ها
- ترسیم نمودار چندک چندک (Q-Q plot) و هیستوگرام
- بررسی همبستگی داده ها
- ورود داده از Excel
- بررسی تعداد داده های گمشده (NA Data)
- تقسیم داده های ورودی به دو بخش آموزش و آزمون
- ایجاد مدل رگرسیون خطی و مدل رگرسیون جنگل تصادفی و مقایسه دقت مدل ها
- یافتن مطلوب ترین تعداد داده های ورودی در مدل جنگل تصادفی (Optimal mtry)
- یافتن مطلوب ترین تعداد درخت در مدل جنگل تصادفی (Optimal ntree)
- پیش بینی مقادیر داده جدید با استفاده از مدل جنگل تصادفی و ارزیابی آن
- مصورسازی اهمیت پارامترهای پیش بینی جنگل تصادفی
- ساخت شیپ فایل نقطه ای از داده های چهارچوب دار و فایل Excel
- ساخت فایل رستری از داده های چهارچوب دار و مصور سازی
- استخراج مقادیر سلول ها از فایل های رستری با استفاده از شیپ فایل نقطه ای
- تبدیل فایل رستری به فرمت kml و مصورسازی در نرم افزار Google earth
- محاسبه معیارهای ارزیابی مدل رگرسیون جنگل تصادفی شامل Bias, MSE,RMSE & R2
- محاسبه معیارهای ارزیابی مدل طبقه بندی جنگل تصادفی شامل Kappa & Accuracy
- آشنایی با بسته های ارزیابی مدل از قبیل ithir, ModelMetrics, caret
- آشنایی با بسته های psych, GGally, e1071, nortest
- مصور سازی دادهای آزمایشگاهی و دادهای مکانی با بسته های ggplot2,tmap, spplot
- ذخیره سازی داده های پیش بینی و طبقه بندی مدل به فرمت Excel 2007
معرفی نرم افزار
معرفی الگوریتم جنگل تصادفی
«هوش مصنوعی» (Artificial Intelligence)، «یادگیری ماشین» (Machine Learning)، «علم داده» (Data Scientist) و «دادهکاوی» (Data Mining) از جمله موضوعات داغ روز هستند. این روزها، کمتر صنعتی مشاهده میشود که در آن به طور مستقیم یا غیرمستقیم از یادگیری ماشین استفاده نشود.
روشهای یادگیری ماشین (Machine Learning)، سیستمهای مختلف را قادر میکنند که یاد بگیرند، بررسی کنند و به ما پیشنهادهای کاربردی ارائه دهند. این سیستمها به مرور زمان که با دادهها، شبکهها و افراد تعامل دارند، باهوشتر میشوند. با استفاده از رویکردهای یادگیری ماشین و هوش مصنوعی، این سیستمها قادر هستند ما را در حل مسائل مهم، کاربردی و روزمره یاری دهند. غالبا این کار با استفاده از دادههایی انجام میشود که به دلیل حجم زیاد و یا ماهیت نامفهوم، برای ما انسانها چندان قابل استفاده نیست. تاکنون کاربردهای بسیار زیادی از هوش مصنوعی و یادگیری ماشین را در زندگی روزمره تجربه کردهایم. سرویسهای ایمیل برای تشخیص اسپم از الگوریتمهای یادگیری ماشین استفاده میکنند. سیستمهای پیشنهادگر، مرتبسازی نتایج موتورهای جستجو، تشخیص چهره خندان برای عکاسی خودکار، همگی نمونههای دیگری از کاربردهای یادگیری ماشین هستند.
ابزارها و روشهای مبتنی بر یادگیری ماشین، بر خلاف سایر ابداعات و اختراعات بشر، برای رفع محدودیتها و نیازهای فیزیکی نیستند، بلکه هدف آنها ساختن سیستمهایی است که به جای انسان بیاندیشند، یاد بگیرند و یاد بدهند.
در طی یک دهه آینده، به نظر میرسد که ما شاهد استفاده هر چه بیشتر یادگیری ماشین در طراحی سیستمهای دارای تعامل با انسان خواهیم بود.
داده ها
در این مجموعه سعی شده است به صورت پروژه محور الگوریتم جنگل تصادفی برای دستهبندی و رگرسیون آموزش داده شود که موارد آموزشی شامل موارد ذیل می باشد:
الف) داده های آزمایشگاهی
طبقه بندی گونه های مختلف گل زنبق از سری دیتاست Iris
پیش بینی میزان جذب سرب فاضلاب شهری توسط فیلتر تراشه های لاستیکی
ب) داده های مکانی (دارای مختصات جغرافیایی)
پیش بینی میزان کربن آلی خاک بر اساس پارامترهای آزمایشگاهی در سطح دشت سیستان و تهیه نقشه پراکنش آن
طبقه بندی کلاس بافت خاک با استفاده از مشتقات DEM و تهیه نقشه بافت خاک شهرستان گرگان
منطقه مورد مطالعه
این محصول آموزشی به هیچ مکانی محدود نبوده و برای تمامی نقاط جهان قابل استفاده است.
کاربرد این محصول
روش جنگل تصادفی یکی از روشهای فراگیر یادگیری ماشین می باشد که کاربرد پیشگویانه رقابتی در زمینه های مختلف ازجمله علوم بیولوژی، علوم زمین، مالی، مهندسی شیمی و غیره دارد. جنگل تصادفی را می توان یک الگوریتم یادگیری ماشین قابل انعطاف ، آسان برای استفاده مختلف پیش بینی و طبفه بندی معرفی کرد که حتی بدون تنظیم پارامترهای بیش از حد ، نتیجه بسیار خوبی را در اکثر اوقات تولید می کند. این روش جدید و قدرتمند، پیشــرفتهــاي قابــل ملاحظــهاي را در تکنولــوژي دادهکاوي ارائه داده است. همچنین یکی از الگوریتم های پرکاربرد است ، زیرا به دلیل سادگی و تنوع آن می توان از آن برای انجام کارهای طبقه بندی و رگرسیون استفاده کرد.
تکنیک جنگل تصادفی مدل توسعه یافتهای از روش طبقه بندی و رگرسیون درختی CART می باشد. در روش جنگل تصادفی به جای رشد یک درخت صدها یا هزارن درخت طبقهبندی تولید می شود. در واقع این روش نوین یادگیری ماشین یک نوع مدرن و تحت نظارت از درخت- پایه هستند که شامل انبوهی از درخت های کلاس بندی و رگرسیونی می باشند که کاربرد اصلی آن در داده کاوی است و در حال حاضر یکی از بهترین الگوریتم های یادگیری است.
برای بهبود بخشیدن کارایی روش جنگل تصادفی می توان بر روی محور دقت و سرعت آن کار کرد. در زمینه بهبود دقت، با استفاده از ارزیابی ویژگیهای مختلف و ترکیب کردن توابع آن کار را جلو می برند. همچنین روش جنگل تصادفی دارای خواص موازی سازی است و می تواند به راحتی در جهت گسترش پذیری و بهبود کارایی موازی سازی شود.
مخاطب این محصول
این آموزش برای افرادی مفید است که می خواهند داده های جغرافیایی را با نرم افزار متن باز R تجزیه و تحلیل ، مصور و مدل سازی کنند. به ویژه افرادی که مهارت های تجزیه و تحلیل مکانی را با استفاده از یک سیستم اطلاعات جغرافیایی (GIS) مانند QGIS ، ArcMap ، GRASS یا SAGA آموخته اند.
همچنین هر کسی که دوست دارد زبان برنامه نویسی R را در علوم زمین یاد بگیرید می تواند این آموزش را تهیه کند.
سوال دارید؟
در این صفحه سعی شده تا تمامی مطالب مورد نیاز کاربران پیش از فرایند خرید عرضه شود. با این حال در صورتی که از مدرس سوال دارید می توانید از بخش نظرات در بخش بالای صفحه استفاده کنید. بخش نظرات برای پرسش و پاسخ با مدرس طراحی شده است. هم چنین در صورتی که نسبت به محتوای محصول انتقاد و یا پیشنهاداتی دارید از طریق بخش نظرات آن را مطرح کرده و سپس نسبت به این محصول امتیاز دهید. هرچه امتیاز دهی شما دقیق تر باشد، سایر کاربران به شکل بهتری در استفاده از این محصول و کیفیت مدرس آگاهی پیدا خواهند کرد.
رضا
در تاریخ
سلام و تشکر نسبت به تولید آموزش کاربردی تون
این آموزش شامل تخفیفات دوره ای تون نمیشه؟
احمد نجفی
در تاریخ
سلام
بله تخفیفات دوره ای نیز خواهیم داشت که از طریق ایمیل و کانال تلگرام اطلاع رسانی میشه
Modrs
در تاریخ
سلام
دوره رو خریدم اما فیلم اولش خرابه پخش نمیشه.
احمد نجفی
در تاریخ
سلام و وقت بخیر
اگر مشکلتان رفع نشد لطفا به ایمیل زیر پیام دهید:
ahmad.najafy@gmail.com