목록으로

Context Routing

컨텍스트 라우팅

협업과 조율OCLS LAYER

각 주체에 필요한 정보만 전달되도록 정보 흐름을 설계한다.


Context

에이전트끼리 협업을 시작하면 컨텍스트(대화 이력, 사용자 의도, 중간 결과)를 주고받아야 한다. 모든 컨텍스트를 모든 에이전트에 뿌리면 군더더기 정보가 판단을 오염시키고, 너무 적게 주면 에이전트가 올바른 판단을 내리지 못한다.

Problem

컨텍스트 전달에 규칙이 없으면 에이전트가 제 책임 밖 정보에 기대거나 필요한 정보를 못 받아 잘못된 결정을 내린다. 컨텍스트가 넘치면 토큰 비용이 오르고 응답 품질이 떨어지며, 모자라면 재질문 루프가 생긴다.

Forces

  • 꼭 필요한 컨텍스트만 전달하면 효율적인 대신 예외 상황에서 정보가 모자랄 수 있다.
  • 구조화된 컨텍스트 포맷은 파싱이 쉬운 반면 비정형 정보를 담기 어렵다.
  • 컨텍스트를 캐싱하면 성능은 좋아지지만 오래된 정보가 판단을 그르칠 수 있다.

Solution

각 에이전트의 책임에 필요한 컨텍스트 항목을 명시적으로 정한다. 핸드오프할 때는 '이 에이전트가 지금 무엇을 알아야 하는가'를 기준으로 컨텍스트를 걸러내고 구조화해 넘긴다. 군더더기 이력은 요약하거나 덜어내고, 필수 항목이 빠지면 핸드오프를 거부하는 검증 로직을 둔다. Anthropic의 [Effective Context Engineering for AI Agents]는 LLM에 'attention budget'이 있어서, 토큰이 늘수록 n²의 쌍별 관계가 희석되어 'context rot'(성능 저하)가 생긴다고 설명한다. 그래서 핵심 원칙은 '가장 작은 고신호 토큰 집합을 찾아 원하는 결과를 끌어올리는 것'이다. Progressive disclosure(점진적 컨텍스트 발견)를 써서 전체를 한꺼번에 올리지 않고 카테고리 구조를 따라 필요한 정보만 차근차근 찾아 들어간다.

판단 질문

이 에이전트는 지금 무엇을 모르면 안 되는가?

적용 시나리오

예시 시나리오 — 본 페이지의 수치와 기업명은 패턴 설명을 위한 가상 사례이며, 실측 데이터가 아닙니다.

Intake Agent가 문의를 분류한 뒤 Response Agent에 핸드오프할 때 전체 대화 이력 30턴을 그대로 넘기면 토큰 비용이 3배로 뛰고 응답 품질이 떨어진다. 대신 { category: '배송 지연', customerSentiment: 'frustrated', keyFacts: ['주문번호 A-1234', '예상 배송일 3일 초과'], priorResolutionAttempts: [] }처럼 구조화된 컨텍스트만 넘긴다. 반면 Escalation Agent는 감정 분석 점수와 이전 에스컬레이션 이력까지 받아야 제대로 판단한다. 에이전트마다 필요한 컨텍스트가 다르다.

이렇게 하면 무너진다

모든 에이전트에 전체 대화 이력을 넘기면 Response Agent가 고객의 지난 불만 이력에 과민하게 반응해 쓸데없는 보상을 제안하거나, QA Agent가 분류 과정의 중간 추론까지 평가 대상으로 삼아 오탐이 는다. 컨텍스트 오염은 소리 없이 품질을 갉아먹어 원인을 잡아내기 어렵다.

구현 패턴 연결

  • Sequential Pipeline
  • Routing Pattern

파이프라인의 각 단계에서 다음 에이전트에 전달할 컨텍스트를 필터링·구조화하는 규칙. Routing Pattern은 문의 유형에 따라 적절한 에이전트로 분기하는 구현.

Academic References

  • The Rise of Agentic AI: Architectures, Taxonomies, and Evaluation Metrics — Future Internet (MDPI)

함께 적용하는 패턴

  • 책임 분할결과를 소유할 주체와 책임 경계를 명확히 정의한다.
  • 상태와 기억 제어단기 상태와 장기 기억을 분리해 정보 누수와 혼선을 방지한다.