LSTM 이해하기 – 파트 4: LSTM이 무엇을 잊을지 결정하는 방법

발행: (2026년 2월 26일 오전 05:46 GMT+9)
3 분 소요
원문: Dev.to

Source: Dev.to

이전 기사에서는 LSTM의 첫 번째 부분을 완성하고 계산 결과를 얻었습니다. 이제 계속 진행해 보겠습니다.

Forget Gate

입력이 1일 때 우리는 특정 결과를 얻었습니다.
입력을 −10과 같이 비교적 큰 음수로 바꾸면, x축 값을 계산한 뒤 시그모이드 활성화 함수의 출력이 0에 가깝게 됩니다.

시그모이드 활성화 함수는 어떤 입력이든 0과 1 사이의 값으로 변환하므로, 그 출력은 장기 메모리의 어느 정도가 유지될지를 결정합니다. 0에 가까운 값이 나오면 장기 메모리는 완전히 사라집니다. 왜냐하면 0과 곱해지는 모든 값은 0이 되기 때문입니다.

따라서 LSTM의 첫 번째 단계는 장기 메모리 중 얼마만큼을 기억할지 비율을 결정합니다. 이 부분을 forget gate(망각 게이트)라고 합니다.

Second Stage

두 번째 단계에서는 오른쪽 블록이 단기 메모리와 입력을 결합하여 잠재적인 장기 메모리를 생성합니다. 왼쪽 블록은 그 잠재 메모리 중 얼마만큼을 장기 메모리에 추가할지 비율을 결정합니다.

잠재 메모리가 어떻게 생성되는지, 그리고 그 중 얼마가 장기 메모리에 추가되는지를 숫자를 대입해 살펴보겠습니다.

다음 기사에서 이 내용을 계속 탐구하겠습니다.

0 조회
Back to Blog

관련 글

더 보기 »