with-RL

  • 홈
  • 태그
  • 방명록

Tag

#Reinforcement Learning #강화학습 #STM32 #바닥부터 배우는 강화 학습 #LED #강화 학습 #Button #NUCLEO-F103RB #Markov Reward Process #CS234 #Markov Process #Q러닝 #Markov Decision Process #ros #uart #interrupt #MDP #몬테카를로 #CubeIED #Actor-Critic #Deep RL #몬테카를로 컨트롤 #MDP Control #밸류 이터레이션 #벨만 최적 방적식 #벨만 기대 방정식 #벨만 방정식 #Prediction과 Control #마르코프 리워드 프로세스 #마르코프 프로세스 #마르코프 결정 프로세스 #강화 학습의 위력 #에이전트와 환경 #순차적 의사결정 문제 #지도 학습과 강화 학습 #강화 학습이란 #Control in MDP #Evaluation in MDP #Evaluation and Control #Exploration and Exploitation #RL Algorithm Components #Markov Assumption #Sequential Decision Process #Sequential Decision Making #정책 이터레이션 #Policy Gradient #cubeide #ST-LINK #Temporal Difference #알파고 #DQN #buzzer #모터 드라이버 #YOLO #docker #sarsa #Markov Chain #모터 제어 #MCTS #플래닝 #Utility #보상 #설치 #ubuntu
프로필사진

강화 학습 기반으로 문제를 해결하는 방법에 대한 공부를 하고 있습니다.

  • 분류 전체보기 (53)
    • 강화 학습 (11)
      • CS234 (0)
      • 바닥부터 배우는 강화 학습 (10)
      • ML-Agent (1)
    • 로봇 (34)
      • ROS (21)
      • STM32 (9)
      • ESP32 (2)
      • 라즈베리파이 (2)
    • 프로그램 (3)
      • Java (3)
    • 환경 (5)

Tag

MDP, 몬테카를로, Markov Process, uart, Actor-Critic, Markov Decision Process, Q러닝, STM32, 바닥부터 배우는 강화 학습, LED, Markov Reward Process, Button, ros, 강화 학습, NUCLEO-F103RB, interrupt, CS234, 강화학습, Reinforcement Learning, CubeIED,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/06   »
일 월 화 수 목 금 토
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바