딥러닝2 DQN (Deep Q-Networks) DQN (Deep Q-Networks) DQN이 나오기전 Neural network 를 사용하기 어려웠던 이유 1. Correlations 수많은 data중 sampling data를 통해 접근하였을 때, sampling data간 correlation이 있으면 나머지 data와의 관련성이 나오지 않기 때문에 제대로된 학습을 할 수가 없다. 2. Non-stationary targets Q러닝 알고리즘은 cost function(MSE)를 최소화하는 방향으로 학습을 한다. cost function를 보면 min(예측값 - 정답값)^2 식으로 나타내고 있는데 Q_learning 에서 예측값을 실제값과 가까와 지기 위해 θ을 조정하면 실제값의 θ 값 또한 변하게 된다. 즉, 부트스트랩을 진행하면 정답값도 같.. 2020. 12. 1. Deep Learning(딥러닝) 개요 일반적으로 머신러닝(Maching Learning:ML)은 현재 값(예측할 값: predictor)을 x로 두고, 실제값(response)을 y라고 하면, y=f(x)를 만족하는 함수(function) f()를 찾는데에 포커싱 되어있다. - 학습되어진 함수 f()는 새로운 x'값이 주어졌을 때에도 분류하는 데에 사용된다. - 예를 들어 어떠한 이미지(x=image)가 주어지고 이미지의 카테고리(y= category)를 맞추는 문제라고 할 때, 이미지를 카테고리로 바꿔주는 함수를 학습하는 것이다. - 학습하는 이유는 새로운 이미지에 대해 학습한 함수를 적용하여 어떤 카테고리인지 예측하기 위해서이다. - 하지만 우리가 원하는 것은 x와 f()가 주어진 상태에서 y값을 얻는 것이 목적이 아닌 경우가 있다. 딥.. 2020. 11. 21. 이전 1 다음