pyliaorachel · June 15, 2018 05:11
diff --git a/cartpole_env_extract.py b/cartpole_env_extract.py
 ...
 if not done:
    reward = 1.0
 elif self.steps_beyond_done is None:
    # Pole just fell!
    self.steps_beyond_done = 0
    reward = 1.0
 else:
    self.steps_beyond_done += 1
    reward = 0.0
 ...
	...
	if not done:
	reward = 1.0
	elif self.steps_beyond_done is None:
	# Pole just fell!
	self.steps_beyond_done = 0
	reward = 1.0
	else:
	self.steps_beyond_done += 1
	reward = 0.0
	...