Agent memory는 AI 에이전트가 대화와 작업의 맥락을 다음 상호작용까지 이어서 활용하는 방식입니다. 2026년 기준으로는 단순한 대화 기록 저장을 넘어, 사용자 선호, 작업 상태, 도메인 지식, 장기 관계 정보를 분리해서 다루는 설계가 핵심입니다. 검색어로는 agent memory, LLM memory, memory layer, persistent memory for agents, Mem0가 자주 함께 붙습니다.
이 주제가 중요한 이유는 명확합니다. 에이전트가 매번 같은 질문을 다시 하고, 이전 작업 결과를 잊고, 사용자 취향을 반영하지 못하면 실제 제품으로 쓰기 어렵습니다. 반대로 메모리를 제대로 설계하면 개인화, 재사용, 비용 절감, 작업 연속성이 동시에 좋아집니다.
왜 중요한가 #
에이전트 메모리는 기능이 아니라 제품 품질입니다. 기억이 없는 에이전트는 매 턴이 독립적이라 간단한 데모는 가능해도 장기 사용성은 떨어집니다.
- 반복 질문과 반복 입력을 줄일 수 있습니다.
- 사용자 선호와 맥락을 반영할 수 있습니다.
- 장기 작업의 상태를 이어갈 수 있습니다.
- RAG와 도구 호출 정책을 더 정교하게 만들 수 있습니다.
메모리가 없으면 프롬프트는 길어지고, 비용은 올라가고, 사용자 경험은 매번 초기화됩니다. 반대로 메모리를 무작정 쌓으면 노이즈가 늘고 보안 리스크가 커집니다. 그래서 저장보다 선별, 요약, 회수, 삭제 정책이 더 중요합니다.
메모리 계층 #
실무에서는 메모리를 한 덩어리로 보지 않는 편이 좋습니다.
| 계층 | 역할 |
|---|---|
| Short-term memory | 현재 대화와 작업의 즉시 맥락 |
| Working memory | 현재 실행 중인 계획과 중간 결과 |
| Long-term memory | 사용자 선호, 반복 패턴, 역사적 지식 |
| Semantic memory | 의미 기반 검색 가능한 사실/요약 |
| Policy memory | 금지사항, 보안 정책, 사용 규칙 |
Mem0 같은 메모리 레이어 제품은 이 중 일부를 제품화한 예시로 볼 수 있습니다. LangGraph는 상태 저장 오케스트레이션 관점에서 메모리 계층을 묶어 다루기 좋습니다.
설계 방식 #
가장 실용적인 방식은 저장과 회수를 분리하는 것입니다.
- 입력을 받으면 우선 현재 턴의 컨텍스트를 정리합니다.
- 새로 저장할 가치가 있는 정보인지 분류합니다.
- 저장할 때는 원문, 요약, 임베딩을 분리합니다.
- 회수할 때는 최근성, 관련성, 신뢰도, 권한을 함께 평가합니다.
- 실행 결과가 끝나면 다시 학습 가능한 메모리 후보만 남깁니다.
이 구조에서 핵심은 모든 대화를 저장하는 것이 아니라 나중에 재사용될 정보만 남기는 것입니다. 사용자 취향, 프로젝트 상태, 반복 결정, 장기 목표는 저장 가치가 높고, 임시 수치나 일회성 문장은 낮습니다.
체크리스트 #
- 저장할 정보와 저장하지 않을 정보를 먼저 정의합니다.
- 개인 정보와 민감 정보는 별도 정책으로 분리합니다.
- 메모리 회수 시 최근성, 관련성, 권한을 함께 봅니다.
- 요약 메모리와 원문 메모리를 구분합니다.
- 삭제와 만료 정책을 명시합니다.
- 추적 로그와 평가 지표를 붙입니다.
결론 #
Agent memory는 AI 에이전트의 기능이 아니라 운영 체계에 가깝습니다. 잘 설계된 메모리는 개인화와 연속성을 제공하고, 잘못 설계된 메모리는 노이즈와 리스크만 키웁니다. 그래서 메모리 레이어는 저장 방식보다 정책과 계층화가 먼저입니다.