Seq2Seq 신경망 이해 – 파트 2: 시퀀스 입력을 위한 임베딩
Source: Dev.to

Part 1 요약
이전 기사에서 우리는 시퀀스‑투‑시퀀스(Seq2Seq) 문제를 소개하고 가변 길이 입력과 출력을 처리하는 방법을 논의했습니다.
LSTM을 이용한 가변 길이 시퀀스 처리
우리는 이미 이를 위해 Long Short‑Term Memory (LSTM) 유닛을 사용하는 방법을 알고 있습니다.
예를 들어 입력 문장 **“Let’s go”**가 있을 때:
- “Let’s” 를 LSTM에 입력합니다.
- LSTM을 펼쳐서 두 번째 입력으로 “go” 를 넣습니다.

시퀀스 입력을 위한 임베딩 레이어
원시 단어를 직접 신경망에 넣을 수는 없습니다. 대신 임베딩 레이어를 사용해 각 단어를 숫자 벡터로 변환합니다.

어휘와 토큰
예시를 단순하게 유지하기 위해 우리의 Encoder‑Decoder 모델에 사용되는 영어 어휘는 단 세 단어만 포함합니다:
- “Let’s”
- “to”
- “go”
또한 EOS(End‑of‑Sentence) 기호도 포함됩니다. 어휘가 단어와 기호를 혼합하고 있기 때문에 각 요소를 토큰이라고 부릅니다.
예시로, 각 토큰당 두 차원의 임베딩을 할당합니다(일반적으로는 수백~수천 차원).
다음 단계
입력 어휘에 대한 임베딩 레이어를 만들었으니, 이제 이를 LSTM에 연결하는 것이 다음 단계입니다. 이는 다음 기사에서 다룰 예정입니다.
Sponsored: Installerpedia
도구, 라이브러리, 혹은 전체 저장소를 더 쉽게 설치하고 싶으신가요?
커뮤니티 기반의 구조화된 설치 플랫폼인 Installerpedia를 사용해 보세요. 최소한의 번거로움과 명확하고 신뢰할 수 있는 가이드를 통해 거의 모든 것을 설치할 수 있습니다.
ipm install repo-name
🔗 Installerpedia 여기서 확인: https://hexmos.com/freedevtools/installerpedia/