-
شماره رکورد
157
-
عنوان
سعيد مجيدي: يادگيري تقويتي Reinforcement Learning
-
نام نرم افزارها
سعيد مجيدي: يادگيري تقويتي Reinforcement Learning
-
نام سازمان
خانه رياضيات اصفهان
-
وضعيت نشر
خانه رياضيات اصفهان
-
موضوع
يادگيري تقويتي ,Reinforcement Learning
-
چکيده
يادگيري تحت سرپرستي ، يك روش عمومي در يادگيري ماشين است كه در آن به يك سيستم ، مجموعه جفت هاي ورودي - خروجي ارائه شده و سيستم تلاش مي كند تا تابعي از ورودي به خروجي را فرا گيرد. يادگيري تحت سرپرستي نيازمند تعدادي داده ورودي به منظور آموزش سيستم است . با اين حال رده اي از مسائل وجود دارند كه خروجي مناسب كه يك سيستم يادگيري تحت سرپرستي نيازمند آن است ، براي آنها موجود نيست . اين نوع از مسائل چندان قابل جوابگويي با استفاده از يادگيري تحت سرپرستي نيستند. يادگيري تقويتي مدلي براي مسائلي از اين قبيل فراهم مي آورد . در يادگيري تقويتي (tnemecrofnier gninrael) سيستم تلاش مي كند تا تقابلات خود با يك محيط پويا را از طريق خطا و آزمايش بهينه نمايد . يادگيري تقويتي مسئله اي است كه يك عامل كه مي بايست رفتار خود را از طريق تعاملات آزمايش و خطا با يك محيط پويا فرا گيرد، با آن مواجه است . در يادگيري تقويتي هيچ نوع زوج ورودي - خروجي ارائه نميشود . به جاي آن پس از اتخاذ يك عمل ، حالت بعدي و پاداش بلافصل به عامل ارائه مي شود . هدف اوليه برنامه ريزي عامل ها با استعاده از تنبيه و تشويق است بدون آنكه ذكري از چگونگي انجام وظيفه آنها شود . در اين سمينار ابتدا مسئله يادگيري تقويتي معرفي شده و سپس الگوريتم هاي مختلف مطرح در آن بيان مي شوند .
-
تاريخ نمايه سازي
27/06/1386
-
شماره راهنما
ل289
-
لينک به اين مدرک :