Woo Bin

성장을 목표로 끊임없이 배우고 있습니다.

Toggle menu

📂 전체 글 수 149 개
DeepLearning
- NLP 논문 리뷰 (18)
- ML & DL (7)
Coding Test
- 프로그래머스 (42)
- 백준 (35)
TIL 공부 일지
- TIL(23)
데이터 분석
- project(21)
- GA4(3)

[TIL] RNN

RNN

rnn

h_t-1 : 이전 은닉 상태
x_t : 현재 입력 값
h_t : 현재 은닉 상태
f_W : rnn 함수
y : rnn output 값
h_t = f_W(h_t-1,x_t)
h_t = tanh(W_hhh_t-1 + W_xhx_t)
y_t = W_hyh_t
y_t는 1차원 벡터

Types of RNNs

one to one : 일반적인 rnn
one to many : Image Captioning
many to one : Sentiment Classification
many to many : Machine Translation
many to many : Video classification on frame level

Character-level Language Model

word-level, character-levle 둘다 수행 가능.
입력 단어가 들어오면 예측 단어를 생성.
character-level로 단어집합 구성.
각 단어를 one-hot vector로 변환.

BPTT

학습 데이터가 길면 GPU로 못 올라감.
따라서 잘라서 학습 함.

Vanishing/Exploding Gradient Problem in RNN

은닉 상태가 계속 행렬곱이 되고 backpropagation 될 때도 곱해지므로 기울기가 소실되거나 폭발하게된다.

LSTM

기울기 소실, 폭발이 timestamp가 멀어져도 잘 학습.
forget gate : cell state와 element 곱을 해서 특정 비율로 정보를 버림.
gate gate : tanh를 거침. input gate의 값과 곱해져서 새로운 cell state를 만듦.
output gate : cell state를 tanh를 거치고, 시그모이드를 거친 값과 곱해줌.
cell state : 기억해야할 모든 정보를 가지고 있음.
은닉 상태 : 지금 당장 필요한 정보만 필터링하는 역할.

GRU

은닉상태가 LSTM의 cell state와 같은 역할을 함.
새로운 cell state를 만들 때 1-input gate의 값과 input gate의 값의 가중 평균을 사용함.

Share on

Twitter Facebook LinkedIn

You may also enjoy

구글 애널리틱스4 분석 환경 설정

구글 애널리틱스4 시작 전 환경 설정을 알아봅시다!

디지털 마케팅의 종류

구글 애널리틱스의 정의와 디지털 마케팅의 종류를 알아봅시다!

구글 애널리틱스의 데이터 수집 원리

구글 애널리틱스의 디지털 수집 원리를 알아봅시다!

A/B Test 프로젝트

빅쿼리 및 파이썬을 통해 A/B Test 과정을 수행하는 프로젝트입니다.