본문으로 건너뛰기

Reranking이란 무엇인가: 검색 결과 품질을 끌어올리는 실무 가이드

·336 단어수·2 분
작성자
Engineer
Vector Search 2026 - 이 글은 시리즈의 일부입니다.
부분 : 이 글

Reranking은 처음에 가져온 후보 문서를 다시 정렬하는 단계입니다. 검색 파이프라인에서 가장 많이 놓치는 부분이지만, 실제 품질 차이는 여기서 크게 납니다.

벡터 검색이나 Hybrid Search는 후보를 잘 뽑는 단계이고, reranking은 그 후보 중에서 진짜로 쓸만한 결과를 골라내는 단계입니다. Qdrant, pgvector, Supabase AI & Vectors, OpenAI File Search를 쓰더라도 최종 품질을 높이려면 reranking이 거의 필수입니다.

Reranking workflow

왜 중요한가
#

검색 품질 문제는 보통 top 20까지는 괜찮아 보이다가 top 5에서 무너집니다. 사용자는 상위 몇 개만 보기 때문에, reranking이 없으면 “찾긴 찾았는데 답답한 검색"이 됩니다.

  • 비슷한 후보가 많을수록 reranking 효과가 큽니다.
  • 짧은 쿼리보다 문장형 쿼리에서 이득이 큽니다.
  • 검색 결과를 LLM 컨텍스트로 넣는 RAG에서는 더 중요합니다.

빠른 시작
#

가장 기본적인 흐름은 다음과 같습니다.

  1. vector search나 hybrid search로 20개에서 100개 후보를 가져옵니다.
  2. reranker에 query + passage 쌍을 넣습니다.
  3. relevance score로 다시 정렬합니다.
  4. 상위 몇 개만 LLM에 전달합니다.
1
retrieve 50 -> rerank -> keep top 5 -> generate

reranker는 대체로 아래 셋 중 하나로 나뉩니다.

  • Cross encoder 기반 모델
  • LLM 기반 reranker
  • 도메인 특화 score rule과 결합한 하이브리드 방식

성능/비용 트레이드오프
#

방식 장점 단점
No rerank 가장 싸고 빠릅니다 품질이 들쭉날쭉합니다
Cross encoder 품질과 비용의 균형이 좋습니다 추가 추론 비용이 듭니다
LLM rerank 유연하고 설명력이 좋습니다 느리고 비쌉니다
Rule + rerank 운영 제어가 쉽습니다 설계가 복잡해집니다

실무에서는 “모든 쿼리에 reranking"보다 “의도가 불분명한 쿼리와 중요 검색에만 reranking"이 더 낫습니다.

체크리스트
#

  • 후보 수를 너무 적게 잡지 않습니다.
  • reranker 입력 길이를 초과하지 않도록 chunk를 조정합니다.
  • latency budget을 검색 단계와 분리해 계산합니다.
  • top-k 평가셋을 만들고 reranking 전후를 비교합니다.
  • exact match가 중요한 필드는 reranker에 함께 넣습니다.
  • RAG에서는 answer quality만 보지 말고 citation 정확도도 봅니다.

결론
#

Reranking은 검색 품질의 마지막 관문입니다. 특히 Hybrid Search를 쓰는 환경에서는 reranking이 있어야 “후보를 잘 찾는 검색"이 아니라 “실제로 쓸 수 있는 검색"이 됩니다.

검색 품질을 한 단계 올리고 싶다면, first-stage retrieval보다 reranking부터 먼저 튜닝하는 것이 효율적입니다.

함께 읽으면 좋은 글
#

Vector Search 2026 - 이 글은 시리즈의 일부입니다.
부분 : 이 글