
김성우 번역자님의 책인 '단단한 강화학습' 에서 사용된 번역을 정리한 글입니다.
신뢰 할당 메커니즘 ☆ credit assignment mechanism
단일 선택 ☆ one-armed bandit
다중 선택 ☆ k-armed bandit
행동자-비평자 구조 ☆ actor-critic architecture
정상 확률 분포 ☆ stationary probability distribution
연관 탐색 ☆ associative search
맥락적 다중 탐색 ☆ contextual bandits
'NLP lab > 강화학습' 카테고리의 다른 글
02. 다중 선택 문제와 행동 가치 방법 [CH2 다중 선택] (0) | 2022.05.02 |
---|---|
01. 틱택토로 알아보는 강화학습 [CH1 소개] (0) | 2022.04.18 |

김성우 번역자님의 책인 '단단한 강화학습' 에서 사용된 번역을 정리한 글입니다.
신뢰 할당 메커니즘 ☆ credit assignment mechanism
단일 선택 ☆ one-armed bandit
다중 선택 ☆ k-armed bandit
행동자-비평자 구조 ☆ actor-critic architecture
정상 확률 분포 ☆ stationary probability distribution
연관 탐색 ☆ associative search
맥락적 다중 탐색 ☆ contextual bandits
'NLP lab > 강화학습' 카테고리의 다른 글
02. 다중 선택 문제와 행동 가치 방법 [CH2 다중 선택] (0) | 2022.05.02 |
---|---|
01. 틱택토로 알아보는 강화학습 [CH1 소개] (0) | 2022.04.18 |