딥러닝 12.05

2025. 12. 5. 17:33

딥러닝 12.05

메모리의 마법: LSTM에서 현대 Transformer까지

프롤로그: RNN의 치명적 약점

BPTT: 시간을 거슬러 올라가는 학습

LSTM: 메모리라는 혁명

RNN vs LSTM: 구조적 차이

LSTM의 수식: 완전히 동일한 구조

메모리 셀의 작동

LSTM의 한계: 오버피팅

망각 게이트: 메모리 리셋

GRU: 천재의 개선

Peephole: 내부 상태 활용

양방향 RNN: 미래도 보자

현대의 게이팅: NeurIPS Best Paper

Attention Sink 문제

논문의 실용적 조언

에필로그: 게이팅의 교훈