이런 것을 배울 수 있어요
강화학습의 핵심 알고리즘을 이해하고 구현할 수 있습니다
DQN, PPO로 다양한 게임 환경을 학습시킬 수 있습니다
커스텀 강화학습 환경을 설계하고 에이전트를 훈련할 수 있습니다
강의 소개
강화학습의 핵심 개념인 MDP, Q-Learning, DQN, PPO, SAC를 이론과 구현으로 완벽하게 배웁니다.
OpenAI Gymnasium으로 CartPole, LunarLander, Atari 게임을 정복하고, IsaacGym으로 로봇 팔 제어까지 확장합니다.
Stable-Baselines3 라이브러리로 빠르게 구현하고, 커스텀 환경을 만들어 자신만의 RL 에이전트를 완성합니다.
수강 전 알아두세요
- •PyTorch 기초 이상
- •확률/통계 기초 지식
- •Python 기초 이상
태그
#강화학습#DQN#PPO#OpenAI Gym#Stable-Baselines3