DQN1 DQN (Deep Q-Networks) DQN (Deep Q-Networks) DQN이 나오기전 Neural network 를 사용하기 어려웠던 이유 1. Correlations 수많은 data중 sampling data를 통해 접근하였을 때, sampling data간 correlation이 있으면 나머지 data와의 관련성이 나오지 않기 때문에 제대로된 학습을 할 수가 없다. 2. Non-stationary targets Q러닝 알고리즘은 cost function(MSE)를 최소화하는 방향으로 학습을 한다. cost function를 보면 min(예측값 - 정답값)^2 식으로 나타내고 있는데 Q_learning 에서 예측값을 실제값과 가까와 지기 위해 θ을 조정하면 실제값의 θ 값 또한 변하게 된다. 즉, 부트스트랩을 진행하면 정답값도 같.. 2020. 12. 1. 이전 1 다음