Document Chunking이란 무엇인가: 2026년 청킹 전략을 고르는 실무 가이드

RAG Pipeline 2026 - 이 글은 시리즈의 일부입니다.

부분 : 이 글

Document Chunking은 RAG 품질을 좌우하는 가장 현실적인 설계 포인트 중 하나입니다. 같은 문서라도 어떻게 나누느냐에 따라 검색 결과와 응답 품질이 크게 달라집니다.

이 글에서는 고정 길이, 의미 기반, 계층형 청킹을 비교하고, RAG 인덱싱 파이프라인, Hybrid Search, 임베딩 모델 선택, RAG Ops와 어떻게 연결되는지 설명합니다.

개요
#

청킹은 문서를 검색 가능한 단위로 자르는 작업입니다. 하지만 단순히 길이만 줄이는 작업으로 보면 안 됩니다. 문단, 제목, 코드 블록, 표, 리스트 같은 구조를 유지해야 검색 결과가 더 잘 맞습니다.

좋은 청킹은 검색 recall과 precision을 동시에 올리고, 불필요한 토큰 낭비를 줄여 비용도 낮춥니다.

결국 청킹은 embedding 품질보다 앞단에서 품질을 결정하는 필터입니다.

대표적인 설계 순서는 다음과 같습니다.

실무에서는 하나만 고정하지 않고, 문서 타입별로 splitter를 분리하는 방식이 더 안정적입니다. 이때 RAG 데이터 신선도가 높아질수록 재청킹 빈도도 같이 증가하므로, 운영 비용까지 같이 봐야 합니다.

권장 구조는 아래와 같습니다.

청킹은 임베딩 모델과 분리해서 생각하기 쉽지만 실제로는 같이 움직입니다. 임베딩 모델 선택에서 모델 크기와 언어 성능을 바꾸면 chunk 길이도 다시 봐야 합니다.

청킹은 단순한 전처리가 아니라 검색 품질 엔진의 일부입니다. 문서 구조를 보존하면서 검색 단위를 만들어야 RAG 전체 흐름이 안정됩니다.

RAG Pipeline 2026 - 이 글은 시리즈의 일부입니다.

부분 : 이 글