DATA

데이터

환경의 세 번째 면은 '루프가 더 좋아지는가'다. 돈이 버티게 하고 토큰이 돌린다면, 데이터는 다음 바퀴를 이전보다 낫게 만든다.


OVERVIEW

루프는 발전하는가

지속과 발전은 다르다. 돈·토큰·사람·검증이 루프를 계속 돌게 하지만, 그 루프가 시간이 갈수록 똑똑해지려면 운영이 만든 데이터를 되먹여야 한다. 데이터 없는 루프는 버틸 뿐 자라지 않는다.

ASSETS

데이터 플라이휠의 세 자산

실행 trace — 원천 기록

에이전트의 판단 근거·선택·핸드오프·결과를 구조화된 로그로 남긴다. 운영이 만든 1차 데이터이자, 모델이 교체돼도 남는 기관 기억이다.

포착
무엇을 왜 결정했는가, 어떤 모듈을 어떤 근거로 선택했는가, 무엇이 실패했는가.
흔한 실패
trace를 검색·조회 가능한 형태로 두지 않으면 묻힌 데이터일 뿐, 기관 기억이 되지 못한다.

평가 데이터 — 정제된 기준

trace에서 비즈니스 성과 기준으로 평가셋을 만든다. 외부 벤치마크가 아니라 우리 결과를 재는 자다.

포착
어떤 결과가 좋고 나쁜가에 대한 우리만의 정답·라벨, capability·regression eval 케이스.
흔한 실패
벤치마크만 보면 우리 제품이 실제로 나아지는지 알 수 없다. 기준이 외부에 있으면 데이터 주권이 없다.

학습 신호 — 개선의 연료

인간 피드백·결과 라벨·승인 기록을 다음 루프를 개선하는 신호로 되먹인다. 플라이휠을 돌리는 힘이다.

포착
무엇이 통과·거절되었는가, 인간이 어디서 개입했는가, 어떤 경로가 마진을 냈는가.
흔한 실패
신호를 되먹이지 않으면 루프는 지속될 뿐 발전하지 않는다 — 데이터가 흘러나가고 모델만 교체된다.
SOVEREIGNTY

데이터 주권과 플라이휠

데이터는 루프를 더 좋게 만드는 유일한 자원이다. 돈은 루프를 돌리고, 토큰은 연산하고, 사람은 운영하지만, 다음 바퀴를 이전 바퀴보다 낫게 만드는 것은 운영이 쌓은 데이터다. 운영 → trace 축적 → 평가로 측정 → 학습 신호로 개선 → 더 나은 운영. 이 고리가 돌수록 우리만의 데이터가 복리로 쌓인다.

그래서 데이터는 모델 밖에 우리 자산으로 두어야 한다. 모델은 교체 가능한 부품이고, 갈아끼워도 trace·평가셋·학습 신호는 남는다 — 그것이 데이터 주권이다. 제너럴리스트 모델 위에 우리 조직만의 맥락을 얹는 층이 바로 이 데이터이며, 경쟁이 복제하기 가장 어려운 해자다.

LADDER

데이터 성숙도 사다리 — 진화 단계 위의 플라이휠

데이터 자산은 한 번에 쌓이지 않는다. 진화 단계와 함께 성숙한다 — 로그 수집에서 자기개선 루프까지.

진화 단계데이터 성숙도
1. 단일 에이전트 시작로그 수집 — 호출·결과·실패를 남기기 시작한다.
2. 책임 분리trace 구조화 — 판단 근거와 핸드오프를 조회 가능하게 만든다.
3. 멀티에이전트 협업평가셋 구축 — 비즈니스 성과 기준의 private eval을 운영한다.
4. 거버넌스 내재화자기개선 루프 — 학습 신호가 다음 루프를 자동으로 끌어올린다.