یادگیری تقویتی

08 – یادگیری تقویتی | MDP-Part 1

مهر ۲, ۱۴۰۲ هوش مصنوعی, یادگیری تقویتی ۰

جلسه 08 درس یادگیری تقویتی (Reinforcement Learning) دکتر نیلی، استاد گروه کنترل دانشکده برق و کامپیوتر دانشگاه تهران

توضیحات بیشتر »

07 – یادگیری تقویتی | Learning Comparison Measures

شهریور ۱۶, ۱۴۰۲ هوش مصنوعی, یادگیری تقویتی ۰

جلسه 07 درس یادگیری تقویتی (Reinforcement Learning) دکتر نیلی، استاد گروه کنترل دانشکده برق و کامپیوتر دانشگاه تهران

توضیحات بیشتر »

06 – یادگیری تقویتی | Upper confidence bound method

شهریور ۱۳, ۱۴۰۲ هوش مصنوعی, یادگیری تقویتی ۰

جلسه 06 درس یادگیری تقویتی (Reinforcement Learning) دکتر نیلی، استاد گروه کنترل دانشکده برق و کامپیوتر دانشگاه تهران

توضیحات بیشتر »

05 – یادگیری تقویتی | N-armed bandit Thompson method

شهریور ۱۰, ۱۴۰۲ هوش مصنوعی, یادگیری تقویتی ۰

جلسه 05 درس یادگیری تقویتی (Reinforcement Learning) دکتر نیلی، استاد گروه کنترل دانشکده برق و کامپیوتر دانشگاه تهران

توضیحات بیشتر »

04 – یادگیری تقویتی | Gradient Bandit method

شهریور ۶, ۱۴۰۲ هوش مصنوعی, یادگیری تقویتی ۰

جلسه 04 درس یادگیری تقویتی (Reinforcement Learning) دکتر نیلی، استاد گروه کنترل دانشکده برق و کامپیوتر دانشگاه تهران

توضیحات بیشتر »

03 – یادگیری تقویتی | Bandit point estimation-based learning

شهریور ۳, ۱۴۰۲ هوش مصنوعی, یادگیری تقویتی ۰

جلسه 03 درس یادگیری تقویتی (Reinforcement Learning) دکتر نیلی، استاد گروه کنترل دانشکده برق و کامپیوتر دانشگاه تهران

توضیحات بیشتر »

02 – یادگیری تقویتی | Single state Bayesian value estimation

شهریور ۲, ۱۴۰۲ هوش مصنوعی, یادگیری تقویتی ۰

جلسه 02 درس یادگیری تقویتی (Reinforcement Learning) دکتر نیلی، از دانشکده برق و کامپیوتر دانشگاه تهران، که چگونگی تخمین مقدار بیزین را شرح می‌دهند.

توضیحات بیشتر »

01 – یادگیری تقویتی | From ambiguity to information

شهریور ۱, ۱۴۰۲ هوش مصنوعی, یادگیری تقویتی ۰

جلسه 01 درس یادگیری تقویتی (Reinforcement Learning) دکتر نیلی، از دانشکده برق و کامپیوتر دانشگاه تهران، که مفهوم ابهام و چگونگی رسیدن از ابهام به اطلاعات را شرح می‌دهند.

توضیحات بیشتر »