자바전문가그룹


글번호	744
작성자	heojk
작성일	2017-09-07 09:35:32
제목	강화 학습(GAN)
내용	얀 러쿤 발표 ppt 중에서 GAN에 관한 내용(Generative Adversarial Network) 케읶 있는 그림 PPT 딥러닝중에 강화학습, 지도학습, 비지도학습 MNIST DIGITS 생성 샘플 https://wiseodd.github.io/techblog/2016/09/17/gan-tensorflow/ DCGAN으로 얼굴 생성 https://arxiv.org/abs/1511.06434 Atari 게임 강화 학습 https://www.youtube.com/watch?v=V1eYniJ0Rnk https://www.youtube.com/watch?v=T58HkwX-OuI 의사결정을 위한 환경과의 상호작용을 위해 목표 지향적 학습 방법 보상의 합을 최대화 하는 정책, 액션 스테이트를 찾는 장법 몬테카를로 방법과 템포럴 디퍼런트 방법이 있다. 에이전트(액션을 수행한 주체) 체스에서의 목표는 게임의 승리, 보상은 게임의 승리(최종적인 목표)를 기준으로 한다. 상대방의 말을 잡는 것은 보상의 기준이 되어선 안된다. 어떻게 하라는 것을 가르치는 것이 아니다. 긴 시간에 걸친 후의 보상을 고려해야 한다. 이론적으로는 간단하지만 수렴하는 것은 쉽지 않다. 정책을 찾는 것, 보상을 정의하는 것, 벨류 펑션을 통해 강화학습을 ... 벨류 평션을 미로게임을 통해 알려주겠다. 여러 알고리즘 중에서 큐 러닝이라는 것은? 스테이트를 계산하는 방법 중 하나. Q-Learning 현재 상태의 벨류V(S_t) 현재상태의 어떤 액션 V(S_t) <- alpha(R_t+1 _ 감마V(S_t-1) -V(S_t)) 감마 현재의 가치가 미래의 가치보다 높다? 현재의 가치에 대한 예측값 에서 현재의 가치를 뺀 다음 알파밧을 취해서 현재의 가치에 더한다. -------------------------------------------------------------------------------- 딥러닝은 공부를 어떻게 할 것인가? 알고리즘으로 배우는 인공지능, 머신러닝, 딥러닝 입문 인공지능, 머신러닝 ㄷㅂ러닝 입문 Deep Learning 딥러닝 첫걸음 신경망 첫걸음 Deep Learning 딥러닝 제대로 시작하기 김성훈 교수의 모두를 위한 머신러닝/딥러닝 강의(http://hunkim.github.io/ml) 동영상 CS231n: Convolutional Neural Networks for Visual Recognition Reinforcement Learning : An intorduction 2nd edition

내용