KDST

KDST

KDST는 딥러닝을 중심으로 AI와 데이터에 관련된 여러 주제에 대해서 연구하는 팀입니다.

DQN 2

2019 NeurIPS 논문 리뷰 - (Reinforcement Learning)

본 게시물은 필자가 2019년 12월 8일부터 진행되었던 NeurIPS 논문중에서 인상깊었던 논문 및 아이디어를 포스팅 한 것입니다. 본 포스팅은 논문에 첨부된 그림을 첨부했으며 문제가 될 시 삭제하도록 하겠습니다. 또한 본 포스팅은 Deep Q Network에 대한 기본 지식을 가지고 있다는 전제하에 작상된 포스팅입니다. Deep Q-Network에 대한 내용은 아래의 링크를 참조하시길 바랍니다. 논문 링크는 이곳을 클릭해주세요. Sample-Efficient Deep Reinforcement Learning via Episodic Backward Update 강화학습을 실제 환경에 적용하기에는 쉽지 않습니다. Aracade Learning 환경에서 Deep Q-Network를 사용하여 학습을 시킬 시..

카테고리 없음 2019.12.24

Reinforcement Learning - part 1 (Q learning & DQN)

본 게시물은 김성훈 교수님의 모두의 강화학습 https://hunkim.github.io/ml/ 을 참고하였으며 "Playing Atari with Deep Reinforcement Leraning" , "Human-level control through deep reinforcement learning" 논문을 기반으로 제작했음을 알립니다. Q-learning Q-learning은 에이전트(agent)가 주어진 상태 (state) 에서 행동(action)을 취했을 경우 받을 수 있는 보상(reward)의 기댓값을 예측하는 Q 함수를 사용하여 최적의 정책(policy)을 학습하는 강화학습 기법입니다. 1. agent는 현재 환경(environment) 에서 특정 state s에 존재합니다. 2. agen..

카테고리 없음 2019.07.03

KDST

KDST는 딥러닝을 포함한 데이터와 지능에 관련된 여러 주제에 대해서 연구하는 팀입니다.

Reinforcement Learning, gan, bearing fault detection, DQN, autoencoder, Latent reasoning, 강화학습, Knowledge Distillation, domain generalization, KV cache compression, bearing fault diagnosis, point-based image editing #dragdiffusion #dragondiffusion, ICCV, anomaly detection, Chain-of-Thought, pruning, representation leanring, KV cache, robustness, cnn,

Today :
Yesterday :

일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

DQN 2

티스토리툴바