본문 바로가기
Python

[Python] nn.Embedding 사용해보기

by teamnova 2025. 8. 7.
728x90

이번 포스팅에서는 PyTorch의 nn.Embedding 모듈을 사용하여 정수 인덱스를 임베딩 벡터로 변환해보도록 하겠습니다.

nn.Embedding은 텍스트 처리에서 자주 사용되는 모듈입니다.
앞으로 자연어처리(NLP), 감정 분석, TTS(음성 합성) 등 다양한 딥러닝 프로젝트에 활용될 수 있습니다.

 

우선 터미널에서 PyTorch를 다운로드 받아줍니다.

 

> pip install torch

 

전체 코드입니다.

 

embedding_example.py

import torch
import torch.nn as nn

# 임베딩 정의: 총 10개의 단어, 각 단어를 3차원 벡터로 임베딩
embedding = nn.Embedding(num_embeddings=10, embedding_dim=3)

# 임베딩할 입력 (정수 인덱스): 예를 들어 문장에서 [2, 5, 8] 이라는 단어들이 있다고 가정
input_ids = torch.LongTensor([2, 5, 8])

# 임베딩 수행
output = embedding(input_ids)

print("입력 인덱스:", input_ids)
print("임베딩 결과:\n", output)

 

 

실행 결과입니다.