토큰 전략

OVERVIEW

토큰을 어떻게 쓸 것인가

비즈니스가 루프를 버티게 할 돈을 정했다면, 토큰 전략은 그 돈을 어떻게 쓸지를 정한다. 토큰을 아끼는 것과 태우는 것은 둘 다 전략이다. 비즈니스 상황이 어느 모드를 부르는지 읽고, 그에 맞춰 인력과 검증을 배치할 때 기술이 비즈니스를 받친다.

MODES

토큰 사용 3모드

효율 — 적게 쓴다

토큰 소비를 최소화한다. 경량 모델, 공격적 캐싱, 짧은 컨텍스트, 배치 처리로 단가를 바닥까지 누른다.

언제: 마진 압박이 크거나, 대량의 저위험·반복 트래픽을 처리할 때. 자급 전환이 급할 때.
트레이드오프: 품질·자율성의 상한이 낮다. 어려운 판단이나 차별화가 필요한 경로에는 부족하다.

밸런스 — 경로별로 나눈다

경로별로 차등한다. 고위험·고가치 결정에는 고성능 모델, 분류·필터링 같은 저위험 경로에는 경량 모델을 배정한다.

언제: 안정적으로 운영하며 품질과 비용을 동시에 관리할 때. 대부분의 프로덕션 기본값.
트레이드오프: 경로별 정책과 모니터링이 늘어 운영 복잡도가 올라간다. 경계 설정이 잘못되면 양쪽 다 놓친다.

공격적 — 아끼지 않는다

토큰을 아끼지 않는다. 최고 성능 모델과 확장 사고(extended thinking), 멀티에이전트 검증을 적극 투입해 품질·속도를 끌어올린다.

언제: 차별화가 핵심이거나, 고가치 결정·초기 신뢰 확보가 비용보다 중요할 때. 투자로 시간을 사는 국면.
트레이드오프: 토큰 단가가 높아 자급을 압박한다. 마진 관리 없이 지속하면 비용이 수익을 추월한다.

OPS

전략을 실행하는 인력과 품질

모드를 고르는 것만으로 루프가 돌지는 않는다. 사람은 조직이 아니라 역할로 정리한다 — OCLS 루프의 각 단계에 누가 소유하고(OWN), 무엇을 승인하며(인간 승인), 어디서 보정하는가(SHARPEN)를 명시한다. 역할은 직책이 아니라 루프 위의 책임 지점이며, 조직 개편을 요구하지 않는다.

품질은 새로 만들지 않는다. 평가와 가드레일(pass@k/pass^k, capability·regression eval), private eval(비즈니스 성과 기준), 의사결정 추적, 거버넌스 린트는 이미 갖춰져 있다. 토큰 전략의 일은 선택한 모드가 어떤 모드든 이 검증을 루프에 상시 결선해, 토큰을 더 태우든 아끼든 정직성이 유지되게 하는 것이다.

STAGE GUIDE

단계별 운영 가이드 — 모드와 인력 배분

비즈니스 단계가 바뀌면 권장 모드와 인력 배분도 달라진다.

진화 단계	권장 모드	인력 배분
1. 단일 에이전트 시작	효율 — 단가를 먼저 본다	한 사람이 방향·실행·검토를 함께 소유한다.
2. 책임 분리	효율→밸런스 — 경로별 차등 시작	역할별 결과 소유자를 지정하고, 검토를 분리한다.
3. 멀티에이전트 협업	밸런스 — 고위험은 공격적으로	승인 게이트와 평가를 맡는 인력이 루프 위에 상주한다.
4. 거버넌스 내재화	상황별 동적 — 모드를 마진으로 결정	검증·운영·비용 관리가 역할로 내재화된다(조직 개편 아님).