جلسه 08 درس یادگیری تقویتی (Reinforcement Learning) دکتر نیلی، استاد گروه کنترل دانشکده برق و کامپیوتر دانشگاه تهران
توضیحات بیشتر »07 – یادگیری تقویتی | Learning Comparison Measures
جلسه 07 درس یادگیری تقویتی (Reinforcement Learning) دکتر نیلی، استاد گروه کنترل دانشکده برق و کامپیوتر دانشگاه تهران
توضیحات بیشتر »06 – یادگیری تقویتی | Upper confidence bound method
جلسه 06 درس یادگیری تقویتی (Reinforcement Learning) دکتر نیلی، استاد گروه کنترل دانشکده برق و کامپیوتر دانشگاه تهران
توضیحات بیشتر »05 – یادگیری تقویتی | N-armed bandit Thompson method
جلسه 05 درس یادگیری تقویتی (Reinforcement Learning) دکتر نیلی، استاد گروه کنترل دانشکده برق و کامپیوتر دانشگاه تهران
توضیحات بیشتر »04 – یادگیری تقویتی | Gradient Bandit method
جلسه 04 درس یادگیری تقویتی (Reinforcement Learning) دکتر نیلی، استاد گروه کنترل دانشکده برق و کامپیوتر دانشگاه تهران
توضیحات بیشتر »03 – یادگیری تقویتی | Bandit point estimation-based learning
جلسه 03 درس یادگیری تقویتی (Reinforcement Learning) دکتر نیلی، استاد گروه کنترل دانشکده برق و کامپیوتر دانشگاه تهران
توضیحات بیشتر »02 – یادگیری تقویتی | Single state Bayesian value estimation
جلسه 02 درس یادگیری تقویتی (Reinforcement Learning) دکتر نیلی، از دانشکده برق و کامپیوتر دانشگاه تهران، که چگونگی تخمین مقدار بیزین را شرح میدهند.
توضیحات بیشتر »01 – یادگیری تقویتی | From ambiguity to information
جلسه 01 درس یادگیری تقویتی (Reinforcement Learning) دکتر نیلی، از دانشکده برق و کامپیوتر دانشگاه تهران، که مفهوم ابهام و چگونگی رسیدن از ابهام به اطلاعات را شرح میدهند.
توضیحات بیشتر »