پاورپوينت يادگيري تقويتي
پاورپوينت يادگيري تقويتي |
![]() |
دسته بندي | پاورپوينت |
فرمت فايل | ppt |
حجم فايل | 61 كيلو بايت |
تعداد صفحات فايل | 23 |
پاورپوينت يادگيري تقويتي
lدر يك مسئله يادگيري تقويتي با عاملي روبرو هستيم كه از طريق سعي و خطا با محيط تعامل كرده و ياد ميگيرد تا عملي بهينه را براي رسيدن به هدف انتخاب نمايد.
lيادگيري تقويتي از اينرو مورد توجه است كه راهي براي آموزش عاملها براي انجام يك عمل از طريق دادن پاداش و تنبيه است
بدون اينكه لازم باشد نحوه انجام عمل را براي عامل مشخص نمائيم. lدو استراتژي اصلي براي اينكار وجود دارد:
.1يكي استفاده از الگوريتم هاي ژنتيكي .2و ديگري استفاده از روشهاي آماري و dynamic programming lدر RL روش دوم مد نظر است.
- سه شنبه ۲۸ اردیبهشت ۹۵ | ۲۲:۲۸
- ۲۳ بازديد
- ۰ نظر