سعيد مجيدي: يادگيري تقويتي Reinforcement Learning

نام نرم افزارها

نام سازمان

خانه رياضيات اصفهان

وضعيت نشر

خانه رياضيات اصفهان

موضوع

يادگيري تقويتي ,Reinforcement Learning

چکيده

يادگيري تحت سرپرستي ، يك روش عمومي در يادگيري ماشين است كه در آن به يك سيستم ، مجموعه جفت هاي ورودي - خروجي ارائه شده و سيستم تلاش مي كند تا تابعي از ورودي به خروجي را فرا گيرد. يادگيري تحت سرپرستي نيازمند تعدادي داده ورودي به منظور آموزش سيستم است . با اين حال رده اي از مسائل وجود دارند كه خروجي مناسب كه يك سيستم يادگيري تحت سرپرستي نيازمند آن است ، براي آنها موجود نيست . اين نوع از مسائل چندان قابل جوابگويي با استفاده از يادگيري تحت سرپرستي نيستند. يادگيري تقويتي مدلي براي مسائلي از اين قبيل فراهم مي آورد . در يادگيري تقويتي (tnemecrofnier gninrael) سيستم تلاش مي كند تا تقابلات خود با يك محيط پويا را از طريق خطا و آزمايش بهينه نمايد . يادگيري تقويتي مسئله اي است كه يك عامل كه مي بايست رفتار خود را از طريق تعاملات آزمايش و خطا با يك محيط پويا فرا گيرد، با آن مواجه است . در يادگيري تقويتي هيچ نوع زوج ورودي - خروجي ارائه نميشود . به جاي آن پس از اتخاذ يك عمل ، حالت بعدي و پاداش بلافصل به عامل ارائه مي شود . هدف اوليه برنامه ريزي عامل ها با استعاده از تنبيه و تشويق است بدون آنكه ذكري از چگونگي انجام وظيفه آنها شود . در اين سمينار ابتدا مسئله يادگيري تقويتي معرفي شده و سپس الگوريتم هاي مختلف مطرح در آن بيان مي شوند .

تاريخ نمايه سازي

27/06/1386

شماره راهنما

ل289

لينک به اين مدرک :

http://math.iranlibs.ir/dL/search/default.aspx?Term=157&Field=0&DTC=3