목차
한 줄 요약
벡터DB는 문장이나 문서를 숫자 형태로 저장해 의미가 비슷한 내용을 찾는 데이터 저장 방식입니다.
쉽게 설명하면?
일반 검색은 같은 단어를 찾는 데 강하고, 벡터DB는 표현이 달라도 의미가 가까운 내용을 찾는 데 유리합니다.
왜 필요한가?
AI 문서 검색이나 RAG 구조에서는 사용자의 질문과 관련 있는 문서를 빠르게 찾는 과정이 필요합니다. 벡터DB는 이 과정에서 관련 문서 후보를 찾는 역할을 합니다.
실제 예시
- 사내 매뉴얼 검색
- 제품 설명서 기반 질문 답변
- 문서 추천
- 유사한 자료 찾기
장점
- 의미 기반 검색에 적합합니다.
- 문서가 많을 때 관련 내용을 찾기 좋습니다.
- RAG 구조와 함께 사용하기 좋습니다.
한계
- 문서 정리가 부족하면 결과 품질이 낮아질 수 있습니다.
- 임베딩 품질에 영향을 받습니다.
- 운영 규모가 커지면 관리가 필요합니다.
비슷한 개념과 차이
일반 데이터베이스는 정확한 값 조회에 강하고, 검색엔진은 키워드 검색에 강합니다. 벡터DB는 의미가 가까운 내용을 찾는 데 강합니다.
자주 묻는 질문
Q1. 벡터DB는 일반 DB를 대체하나요?
아닙니다. 용도가 다르므로 함께 사용하는 경우가 많습니다.
Q2. RAG에 꼭 필요한가요?
문서가 많을수록 유용합니다. 작은 규모에서는 다른 검색 방식으로 시작할 수도 있습니다.
Q3. 벡터DB만 있으면 챗봇이 되나요?
아닙니다. 문서 준비, 검색, 답변 생성 구조가 함께 필요합니다.
정리
벡터DB는 AI가 문서의 의미를 기준으로 관련 내용을 찾도록 돕는 핵심 구성요소입니다.