본문 바로가기

분류 전체보기

(40)
[2018.11] Recurrent experience replay in distributed reinforcement learning Experience replay, increasing the data efficiency by stacking a fixed number of consecutive frames to overcome the partial observability in Atari 2600 games. However, with progress towards increasingly difficult, such as partially observable markov decision processes (POMDP), the need for more advanced memory-based representations increases, more principled solutions such as recurrent neural net..
[2017.07] Hindsight Experience Replay Dealing with sparse rewards is one of the biggest challenges in Reinforcement Learning (RL). We present a novel technique called Hindsight Experience Replay which allows sample-efficient learning from rewards which are sparse nd binary and therefore avoid the need for complicated reward engineering. It can be combined with an arbitrary off-policy RL algorithm and may be seen as a form of implici..
Extending Styled Component with TS 재사용을 염두에 두어 Base Style의 Component를 만들고, 이 Component를 Styled-Component로 확장하여(Custom CSS 추가) 사용하고자 한다면, 아래와 같이 Component에 className을 지정해 주어야 한다. const Container = styled.div` transform: scale(0.8); `; interface IProps { backTo: string; //className must be mentioned!!!!! className?: string; } //className must be mentioned!!!!! const BackArrow: React.SFC = ({backTo, className}) => ( ... ); //Base Co..
[2018.06] DARTS: Differentiable Architecture Search When it comes to NAS(Neural Architecture Search), obtaining a state-of-the-art architecture requires 2000 GPU days of reinforcement learning (RL) (Zoph et al., 2018) or 3150 GPU days of evolution (Real et al., 2018). An inherent cause of inefficiency is the fact that architecture search is treated as a black-box optimization problem over a discrete domain, which leads to a large number of archit..
Web Server & WAS Web Server 웹 브라우저를 실행한 후 주소 입력창에 URL 주소를 입력하면, 그 URL주소에 해당하는 결과물이 화면에 보입니다. 우리가 현실에서 주소를 보고 집을 찾아가는 것처럼, 웹 브라우저는 URL 주소에 해당하는 웹서버(Web Server)에 연결하고, 해당 주소에서 볼 수 있는 내용을 읽어 들여 보여주게 됩니다. 웹 서버는 소프트웨어(Software)를 보통 말하지만, 웹 서버 소프트웨어가 동작하는 물리적인 단위의 컴퓨터를 말하는 경우도 있습니다. 웹 서버의 가장 중요한 기능은 클라이언트(Client)가 요청하는 HTML 문서나 각종 리소스(Resource)를 전달하는 것입니다. 웹 브라우저나 웹 크롤러가 요청하는 리소스는 주로 컴퓨터에 저장된 정적(static)인 (i.e. 이미지, HT..
HTTP & HTTPS Server & Port 일반적으로 인터넷 접속을 한다는 것은, 간단하게 물리적인 하나의 컴퓨터(=서버)에 접속하는 것이라고 생각할 수 있습니다. 이러한 인터넷은 보통 TCP/IP기반의 네트워크를 통해서 여러대의 서버를 하나의 연결된 네트워크 결합체로 제공합니다. 물리적인 하나의 컴퓨터에서도 여러 개의 서버가 동작할 수 있으며, 각각의 서버들은 Port로 구분되어서 동작합니다. 웹은 주로 80번 포트, 이메일은 25번 포트, FTP는 21번 포트를 사용합니다. 인터넷 중에서도 웹서비스는 서로 통신하기 위해서 HTTP 프로토콜을 사용합니다. HTTP(Hypertext Transfer Protocol) HTTP는 서버와 클라이언트가 인터넷상에서 HTML을 주고 받기 위한 프로토콜을 의미합니다. HTTP는 계..
[2018.02] AMC: AutoML for Model Compression and Acceleration on Mobile Devices 이 논문은 기존의 Heuristic한 방법의 Model Compression 방법 대신, 강화학습을 사용하여 자동화 되었지만 더 좋은 성능의 Model Compression을 달성하였다고 합니다. 해당 논문은 PostTraining 방법으로, 먼저 Pretrained된 network(i.e. MobileNet)가 필요합니다. 강화학습 모델로는 DDPG Agent를 사용하는데, 이 Agent는 각 Layer마다 State(Weight크기, Input크기, 등) → Action(pruning비율)을 구하게 됩니다. Action Value(Pruning Ratio)를 discrete하게 가져갈 수도 있지만 {64,128,256,512}, 특정 Layer는 Pruning 비율에 굉장히 민감할 수 있기 때문에, ..
[2017.07] Channel Pruning for Accelerating Very Deep Neural Networks 이 논문은 이미 학습한 Model을 가져와서, 후처리로 손실을 최소화 하는 선에서 Channel Pruning을 하는 방법입니다. 코드는 Caffe로 되어 있어서, 지금 보기에는 쉽지 않고, 실험 결과 역시 지금 상황에서는 큰 의미 없어 보입니다. 그렇지만, 뒤에서 다룰 AMC: AutoML for Model Compression and Acceleration on Mobile Devices 논문에 1저자의 논문이여서 읽어보게 되었습니다. URL: https://arxiv.org/abs/1707.06168 Code: https://github.com/yihui-he/channel-pruning 1. Algorithm 점선의 박스에서, Feature Map "B"에서 두개의 Channel이 Pruning될..