NLP lab/강화학습

00. 강화학습 용어 한국어 번역 정리

heavyteil 2022. 4. 18. 22:12

김성우 번역자님의 책인 '단단한 강화학습' 에서 사용된 번역을 정리한 글입니다.

 

신뢰 할당 메커니즘 ☆ credit assignment mechanism

단일 선택 ☆ one-armed bandit

다중 선택 ☆ k-armed bandit

행동자-비평자 구조 ☆ actor-critic architecture

정상 확률 분포 ☆ stationary probability distribution

연관 탐색 ☆ associative search

맥락적 다중 탐색 ☆ contextual bandits