我尝试使用 openAI Gym 学习在二十一点中应用的 MC-蒙特卡罗方法。我不明白这些行:
def __init__(self, natural=False):
self.action_space = spaces.Discrete(2)
self.observation_space = spaces.Tuple((
spaces.Discrete(32),
spaces.Discrete(11),
spaces.Discrete(2)))
self.seed()
Run Code Online (Sandbox Code Playgroud)
来源:https : //github.com/openai/gym/blob/master/gym/envs/toy_text/blackjack.py