[Python] 벡터 DB로 문장 검색하기 (Faiss 활용)
안녕하세요오늘은 요즘 AI 서비스에서 빠질 수 없는 두 가지 개념인 임베딩 데이터와 벡터 DB를 소개하고,간단한 실습 예제로 직접 검색기를 만들어보겠습니다. 임베딩 데이터란?임베딩(Embedding)은 텍스트, 이미지, 오디오 같은 데이터를 숫자 벡터로 바꾸는 과정입니다.예를 들어,"강아지" → [0.12, -0.98, 0.55, ...]"고양이" → [0.10, -0.95, 0.57, ...]이렇게 표현되면, 의미적으로 비슷한 데이터일수록 벡터 공간에서 가까운 위치에 있게 됩니다.따라서, 문장 유사도 계산, 검색, 추천 등에 매우 유용합니다. 벡터 DB란?벡터 DB(Vector Database)는 이렇게 만들어진 임베딩 데이터를 저장하고,특정 쿼리와 가장 유사한 벡터를 빠르게 찾아주는 데이터베이스입니다..
2025. 9. 29.