JeongBeen Seo

AI(ML,DL) 분야를 중심으로 공부하고 있습니다.

[ 딥러닝 ] GRU

Updated: February 13, 2022

Gated Recurrent Unit (GRU)

Untitled

cell state는 없고 hidden state만 존재한다.
LSTM보다 학습할 weight 수가 적다.

Reset Gate

\[\begin{align*} r_t &= \sigma(W_r \cdot [h_{t-1},x_t]) \\ &= \sigma(W_{hh\_r}h_{t-1}+W_{xh\_r}x_t) \end{align*}\]

과거의 정보를 적당히 reset한다.

Update Gate

\[\begin{align*} z_t & = \sigma(W_z \cdot [h_{t-1},x_t]) \\ & = \sigma(W_{hh\_z}h_{t-1}+W_{xh\_z}x_t) \end{align*}\]

LSTM의 forget gate + input gate
과거($1-z_t$)와 현재 정보($z_t$)의 up-to-date 비율을 결정한다.

Candidate

\[\begin{align*} \tilde{h}_t & = tanh(W \cdot [r_t*h_{t-1},x_t]) \\ & = tanh(Wr_t*h_{t-1}+W_{xh\_\tilde{h}}x_t) \end{align*}\]

현재의 정보 candidate 계산

hidden state 계산

\[\begin{align*} h_t = (1-z_t)*h_{t-1}+z_t*\tilde{h}_t \end{align*}\]

현재의 hidden state 계산

Twitter Facebook LinkedIn

You May Also Enjoy

[ 프로그래머스 ] 올바른 괄호 (Python)

March 16 2023

[ 프로그래머스 ] 같은 숫자는 싫어 (Python)

March 16 2023

[ 데이터구조 ] DFS, BFS

February 16 2023

그래프 순회 방식인 DFS, BFS에 대해 알아봅시다.

[ 백준 ] 11729번 - 하노이 탑 이동 순서 (Python)

March 21 2022

분할정복을 이용해서 해결해봅시다.