DATA
환경의 세 번째 면은 '루프가 더 좋아지는가'다. 돈이 버티게 하고 토큰이 돌린다면, 데이터는 다음 바퀴를 이전보다 낫게 만든다.
루프는 발전하는가
지속과 발전은 다르다. 돈·토큰·사람·검증이 루프를 계속 돌게 하지만, 그 루프가 시간이 갈수록 똑똑해지려면 운영이 만든 데이터를 되먹여야 한다. 데이터 없는 루프는 버틸 뿐 자라지 않는다.
데이터 플라이휠의 세 자산
실행 trace — 원천 기록
에이전트의 판단 근거·선택·핸드오프·결과를 구조화된 로그로 남긴다. 운영이 만든 1차 데이터이자, 모델이 교체돼도 남는 기관 기억이다.
- 무엇을 왜 결정했는가, 어떤 모듈을 어떤 근거로 선택했는가, 무엇이 실패했는가.
- trace를 검색·조회 가능한 형태로 두지 않으면 묻힌 데이터일 뿐, 기관 기억이 되지 못한다.
평가 데이터 — 정제된 기준
trace에서 비즈니스 성과 기준으로 평가셋을 만든다. 외부 벤치마크가 아니라 우리 결과를 재는 자다.
- 어떤 결과가 좋고 나쁜가에 대한 우리만의 정답·라벨, capability·regression eval 케이스.
- 벤치마크만 보면 우리 제품이 실제로 나아지는지 알 수 없다. 기준이 외부에 있으면 데이터 주권이 없다.
학습 신호 — 개선의 연료
인간 피드백·결과 라벨·승인 기록을 다음 루프를 개선하는 신호로 되먹인다. 플라이휠을 돌리는 힘이다.
- 무엇이 통과·거절되었는가, 인간이 어디서 개입했는가, 어떤 경로가 마진을 냈는가.
- 신호를 되먹이지 않으면 루프는 지속될 뿐 발전하지 않는다 — 데이터가 흘러나가고 모델만 교체된다.
데이터 주권과 플라이휠
데이터는 루프를 더 좋게 만드는 유일한 자원이다. 돈은 루프를 돌리고, 토큰은 연산하고, 사람은 운영하지만, 다음 바퀴를 이전 바퀴보다 낫게 만드는 것은 운영이 쌓은 데이터다. 운영 → trace 축적 → 평가로 측정 → 학습 신호로 개선 → 더 나은 운영. 이 고리가 돌수록 우리만의 데이터가 복리로 쌓인다.
그래서 데이터는 모델 밖에 우리 자산으로 두어야 한다. 모델은 교체 가능한 부품이고, 갈아끼워도 trace·평가셋·학습 신호는 남는다 — 그것이 데이터 주권이다. 제너럴리스트 모델 위에 우리 조직만의 맥락을 얹는 층이 바로 이 데이터이며, 경쟁이 복제하기 가장 어려운 해자다.
데이터 성숙도 사다리 — 진화 단계 위의 플라이휠
데이터 자산은 한 번에 쌓이지 않는다. 진화 단계와 함께 성숙한다 — 로그 수집에서 자기개선 루프까지.
| 진화 단계 | 데이터 성숙도 |
|---|---|
| 1. 단일 에이전트 시작 | 로그 수집 — 호출·결과·실패를 남기기 시작한다. |
| 2. 책임 분리 | trace 구조화 — 판단 근거와 핸드오프를 조회 가능하게 만든다. |
| 3. 멀티에이전트 협업 | 평가셋 구축 — 비즈니스 성과 기준의 private eval을 운영한다. |
| 4. 거버넌스 내재화 | 자기개선 루프 — 학습 신호가 다음 루프를 자동으로 끌어올린다. |