Context Routing

컨텍스트 라우팅

협업과 조율OCLS LAYER

각 주체에 필요한 정보만 전달되도록 정보 흐름을 설계한다.


Context

에이전트 간 협업이 시작되면 컨텍스트(대화 이력, 사용자 의도, 중간 결과)를 전달해야 한다. 모든 컨텍스트를 모든 에이전트에 전달하면 불필요한 정보가 판단을 오염시키고, 너무 적게 전달하면 에이전트가 올바른 판단을 내릴 수 없다.

Problem

컨텍스트 전달에 규칙이 없으면 에이전트가 자신의 책임 범위 밖의 정보에 의존하거나, 필요한 정보를 받지 못해 잘못된 결정을 내린다. 컨텍스트 과잉은 토큰 비용을 높이고 응답 품질을 떨어뜨리며, 컨텍스트 부족은 재질문 루프를 만든다.

Forces

  • 필요 최소한의 컨텍스트만 전달하면 효율적이지만, 예외 상황에서 정보가 부족할 수 있다.
  • 구조화된 컨텍스트 포맷은 파싱이 쉽지만, 비정형 정보를 담기 어렵다.
  • 컨텍스트를 캐싱하면 성능이 좋아지지만, 오래된 정보가 잘못된 판단을 유발할 수 있다.

Solution

각 에이전트의 책임에 필요한 컨텍스트 항목을 명시적으로 정의한다. 핸드오프 시 '이 에이전트가 지금 무엇을 알아야 하는가'를 기준으로 컨텍스트를 필터링하고 구조화해서 전달한다. 불필요한 이력은 요약하거나 제거하고, 필수 항목이 누락되면 핸드오프를 거부하는 검증 로직을 둔다. Anthropic의 [Effective Context Engineering for AI Agents]는 LLM에 'attention budget'이 존재하며, 토큰이 늘어날수록 n²의 쌍별 관계가 희석되어 'context rot'(성능 저하)가 발생한다고 설명한다. 따라서 핵심 원칙은 '가장 작은 고신호 토큰 집합을 찾아 원하는 결과를 최대화하는 것'이다. Progressive disclosure(점진적 컨텍스트 발견)를 적용해 전체를 한꺼번에 로드하지 않고, 카테고리 구조를 따라 필요한 정보만 점진적으로 탐색한다.

판단 질문

이 에이전트는 지금 무엇을 모르면 안 되는가?

적용 시나리오

예시 시나리오 — 본 페이지의 수치와 기업명은 패턴 설명을 위한 가상 사례이며, 실측 데이터가 아닙니다.

Intake Agent가 문의를 분류한 뒤 Response Agent에 핸드오프할 때, 전체 대화 이력 30턴을 그대로 넘기면 토큰 비용이 3배로 늘고 응답 품질이 떨어진다. 대신 { category: '배송 지연', customerSentiment: 'frustrated', keyFacts: ['주문번호 A-1234', '예상 배송일 3일 초과'], priorResolutionAttempts: [] }처럼 구조화된 컨텍스트만 전달한다. 반면 Escalation Agent에는 감정 분석 점수와 이전 에스컬레이션 이력까지 포함해야 올바른 판단이 가능하다. 에이전트마다 필요한 컨텍스트가 다르다.

이렇게 하면 무너진다

모든 에이전트에 전체 대화 이력을 전달하면 Response Agent가 고객의 과거 불만 이력에 과도하게 반응해 불필요한 보상을 제안하거나, QA Agent가 분류 과정의 중간 추론까지 평가 대상으로 삼아 오탐이 증가한다. 컨텍스트 오염은 조용히 품질을 떨어뜨리기 때문에 원인 파악이 어렵다.

구현 패턴 연결

  • Sequential Pipeline
  • Routing Pattern

파이프라인의 각 단계에서 다음 에이전트에 전달할 컨텍스트를 필터링·구조화하는 규칙. Routing Pattern은 문의 유형에 따라 적절한 에이전트로 분기하는 구현.

Academic References

  • The Rise of Agentic AI: Architectures, Taxonomies, and Evaluation Metrics — Future Internet (MDPI)

Related Patterns