# 개인용 AI Agent 제작이 조직의 KPI로 되기까지

AI를 쓰다 보면 질문이 바뀌는 순간이 옵니다. "AI로 뭘 하지?"가 아니라, "AI로 안 되는 게 뭐지?"로요. AI 활용의 문제가 아닙니다. 일이 재배치되고, 역할이 다시 짜이고, 조직의 운영 방식이 재정의 됩니다.

그래서 팀제이커브는 6월까지 **AI Agent 1000개**를 만들기로 했습니다. 목표라기보다, 앞으로의 일을 대하는 가장 강력한 키액션을 KPI로 두었습니다.

![출처: 팀제이커브(AI Agent 리스트, 이 시트 정리도 클로드 코워크가 진행 함)](https://upload.cafenono.com/image/slashpagePost/20260317/160034_kzxh0b0XoZCKegBEh9?q=80&s=1280x180&t=outside&f=webp)

## AI가 '혼자' 일하는 시간이 길어지기 시작했다

AI가 좋아졌다는 말은 이제 너무 흔합니다. 

중요한 건 "얼마나 똑똑해졌나"가 아니라, **얼마나 길게 일을 끌고 가나**입니다. 짧은 질문에 답하는 도구와, **연속된 작업을 끝까지 완주하는 존재**는 다르거든요. METR는 이걸 _time horizon_으로 봅니다. 

_*METR(Model Evaluation & Threat Research, 프런티어 AI 모델의 능력·리스크를 평가하는 비영리 연구기관)_

숙련된 사람이 하는 연속 작업을 기준으로, AI가 **50% 확률로 대체 가능한 작업 길이**가 어디까지 늘어났는지를 측정하죠. 

최근 공유된 추정치 중에는, 소프트웨어 작업에서 **약 14.5시간 수준**이 언급됩니다. 

물론 단서가 붙습니다. 데이터가 더 쌓여야 하고, 측정 자체가 점점 어려워지고 있다는 이야기까지 같이 나옵니다. [m](https://metr.org/time-horizons/?utm_source=chatgpt.com)

[METR](https://metr.org)

하지만 결론은 단순합니다. AI는 이제 "도움"이 아니라 **업무의 덩어리**를 가져가기 시작했습니다. 그 순간부터 조직은 사람을 논의하기 전에 먼저 묻게 됩니다.

> 이 일은 정말 사람이 해야 하는가? 아니면 AI에게 맡길 수 있는 형태로 다시 쪼갤 수 있는가?

![출처: METR](https://upload.cafenono.com/image/slashpagePost/20260317/161408_yLucLO8Zx9sofqZusP?q=80&s=1280x180&t=outside&f=webp)

---

## 개인 효용감이 AX 전환으로

"2026년 우리 팀의 목표는 AI가 가장 일하기 좋은 팀이 되는 것."

이런 슬로건을 걸어놓고, 정작 대표인 저는 3월이 다 되도록 **1월 결산을 못 끝내고** 있었습니다.

스타트업 대표 일이라는 게 그렇잖아요. 전략 얘기하다가도 갑자기 영수증 챙기고, 카드 내역 맞추다 보면 하루가 그냥 갑니다. 어느 순간 이런 생각이 들더군요.

> _진짜 AI Native가 되려면, 내 고통부터 외주 줘야겠다._

그래서 Claude를 붙잡고 **월결산 AI Agent**를 만들기 시작했습니다. 만들다 보니 제 안의 '보안 담당관'이 튀어나오더라고요. 은행이랑 카드 사용내역 다운로드까지 싹 자동화하고 싶었는데, **비밀번호를 Agent에게 넘기는 건 못 하겠는**거예요. 

OpenClaw로 PC 제어까지 붙일 수도 있겠지만, 보안은 생명이니까요. 결국 타협했습니다.

> _다운로드는 내가 할게. 정산과 분석은 네가 해._

완벽한 자동화는 아니었지만, 오히려 이게 더 현실적인 AX라고 느꼈습니다. **무조건 다 맡기는 게 아니라, 내가 안심할 수 있는 경계선을 긋고 그 안에서 AI를 극대화**하는 방식이요.

그래서 Plan 모드로 설계서를 깎았습니다. 애매한 지점에서 Agent가 저한테 질문을 던지고, 제가 컨펌만 하게 만드는 구조로요. 손은 AI가 움직이고, 인간은 결정만 하는 형태에 가까웠습니다.

![이미지 출처: 팀제이커브(AI Agent 설계서)](https://upload.cafenono.com/image/slashpagePost/20260317/161744_vNnGMTR6mabP5da2Xk?q=80&s=1280x180&t=outside&f=webp)

결과는 대단했습니다.

- **신뢰도 95% 이상**: 맥락 설명이 빠진 항목에서만 오류가 났고, 1월부터 3월까지 케이스가 쌓이면서 정확도가 올라갔습니다.

- **12시간짜리 일을 10~15분으로**: 다운로드 시간 포함해서요.

- **토큰 비용은 Pro 플랜으로도 충분**했습니다. (거래량이 월 평균 100건 내외라서 더 그랬을 수도 있고요.)

그리고 최근 AI 1:1 PT 진행 중이던 축산업 CEO 한 분이 제 케이스를 들으시더니 질문을 하셨습니다. "지출결의도 되냐"는 질문이 나왔어요. 그 자리에서 **5분도 안 돼**지출결의 파일이 엑셀로 정리됐습니다. 

원본 영수증 이미지를 엑셀에 넣고, **겹친 영수증은 구분**하고, **카드/현금까지 분류**했죠.

![이미지: 실제 클로드로 작업한 예시 이미지(*지출결의 영수증은 더미 데이터입니다)](https://upload.cafenono.com/image/slashpagePost/20260317/161818_4kQ0yHK92HDaQi1JXQ?q=80&s=1280x180&t=outside&f=webp)

이런 경험을 몇 번 겪고 나면, 고민이 바뀝니다. "가능할까?"가 아니라, "어디까지 맡길까?"로요. 

## 그래서 '혼자 만들던 AI Agent'가 조직 KPI가 됐다

개인 실험은 원래 "개인 효용감"으로 끝나기 쉽습니다. 내 일이 편해지고, 내 시간이 늘고, 거기서 만족하고 멈추죠.

그런데 이번엔 달랐습니다. 이유는 단순합니다. AI가 가져가는 건 '업무 하나'가 아니라 **업무의 덩어리**였거든요. 

결산처럼 반복되는 일은 물론이고, 지출결의처럼 증빙을 모으고 분류하고 정리하는 작업까지, 생각보다 빠르게 비워집니다. 이뿐만 아니라 최근에는 콘텐츠 마케터의 블로그/영상 제작까지 위협하고있죠.

그 순간부터는 개인의 생산성이 아니라 **조직의 구조**가 질문을 받기 시작합니다.

> 이 역할은 계속 사람을 늘려서 확장해야하나? 아니면 AI가 일할 수 있는 형태로 조직을 설계할 건가?

그래서 팀제이커브는 6월까지 **AI Agent 1000개**를 만들기로 했습니다. 여기서 중요한 건 숫자 자체가 아닙니다. "Agent를 많이 만들자"는 목표라기보다, **AI로 안 되는 것부터 찾는 조직**이 되기로 한 선언에 가깝습니다. 

!['개인 실험 → 조직 KPI'로 확장되는 흐름(개인 효용감, 업무 덩어리 이동, 6월 1000개 목표)과 팀 내 아이디어 확산을 보여주는 다이어그램. 클로드 show me 기능으로 제작됨.](https://upload.cafenono.com/image/slashpagePost/20260317/193648_5FsTylPbbuW1WDraUb?q=80&s=1280x180&t=outside&f=webp)

예를 들어볼까요? 어떤 일이 보이면, 먼저 묻는 방식이 바뀌는 겁니다. 이렇게요.

- 이건 사람이 해야 하나?

- AI에게 맡기려면 일을 어떻게 쪼개야 하나?

- 어디까지는 자동화하고, 어디부터는 사람이 결정해야 하나?

그런데, 재미있는 건 속도입니다. 프로젝트가 시작된 지 2주도 안 됐는데, 이미 아이디어가 쏟아지고 있습니다. 

"내가 귀찮았던 것"들이 하나씩 떠오르기 시작하거든요. 그동안은 그냥 참고 하던 일들인데, 이제는 참을 이유가 없어졌습니다. 결국 KPI는 숫자보다 **습관**을 강제합니다.

"AI를 도입하자"는 말은 너무 추상적입니다. 반면 "6월까지 1000개"는 매일 묻게 만듭니다.

> 오늘 우리는 무엇을 AI에게 넘길 것인가?

---

## 팀제이커브 AI Agent 그라운드 룰: 한 스텝씩 만든다

AI Agent를 이야기하면 갑자기 멀어지는 팀이 있습니다. "개발해야 하는 거 아니야?" "자동화는 어려워" 같은 말이 먼저 나오죠. 그래서 팀제이커브는 반대로 갔습니다. 

Agent를 거창하게 정의하지 않고, **지금 당장 떼어낼 수 있는 일부터 **단계로 쪼갰습니다. 

핵심은 하나예요. _한 번에 완벽하게 만들지 않는다._ 대신 매일 조금씩 넘긴다.

### 1단계: AI assistant부터 만든다 (GPTs/Gems)

가장 먼저 만드는 건 "자동화"가 아니라 **초안 생성 능력**입니다. 카피, 정리, 분석처럼 반복되는 일. 혹은 내가 잘 모르는 영역인데 다른 팀원에게 설명해야 하는 일. 이런 것들은 GPTs/Gems로 **개인 비서**처럼 붙이면 바로 효과가 납니다. 

![AI assistant 도입 1단계 인포그래픽. GPTs와 Gems를 활용해 반복되는 업무(카피, 정리, 분석), 설명이 필요한 업무, 판단이 필요한 업무에 개인 비서처럼 붙이는 구조.](https://upload.cafenono.com/image/slashpagePost/20260317/193803_aZ8YGCHubUH7Mctg6b?q=80&s=1280x180&t=outside&f=webp)

여기서 중요한 건 성능이 아니라, **내 업무에서 '반복되는 문장'과 '반복되는 판단'을 발견하는 감각**이 생긴다는 점입니다.

### 2단계: 워크플로우를 그려본다 (w. 노코드 자동화 툴)

자동화 방식은 떠오르는데 머릿속이 정리 안 될 때가 있습니다.  그럴 땐 n8n 같은 노코드로 흐름을 그려봅니다. 

![워크플로우 분해 2단계 인포그래픽. n8n, Make 같은 노코드 툴로 입력, 중간 판단, 출력을 나눠보는 흐름도.Agent 직접 제작 3단계 인포그래픽. Claude Code로 만들고 테스트하고 고치고 굴리는 실행 루프와, 사람의 역할(경계선, 판단 지점, 결정만 남기기) 3가지를 배치.](https://upload.cafenono.com/image/slashpagePost/20260317/193839_3xeP3natyEiRJzgxdu?q=80&s=1280x180&t=outside&f=webp)

이 단계의 목표는 "완성"이 아니라 **분해**예요. 입력은 뭐고, 중간 판단은 어디서 하고, 출력은 어떤 형태여야 하는지. 일을 쪼개보면, AI에게 넘길 수 있는 구간이 갑자기 보입니다. 

특히 "위임을 해본 적 없는 팀원"에게 이 단계는 꽤 유효합니다.

### 3단계: 직접 Agent를 만든다 (Claude Code)

워크플로우가 정리되면 이제는 빠릅니다. 클로드코드로 Agent를 만들고, 테스트하고, 고치고, 굴립니다. 그리고 요즘은 솔직히 말하면, **2단계를 생략하는 경우도 많습니다. **AI가 워크플로우 분해를 더 잘 해주기도 하니까요. 

![Agent 직접 제작 3단계 인포그래픽. Claude Code로 만들고 테스트하고 고치고 굴리는 실행 루프와, 사람의 역할(경계선, 판단 지점, 결정만 남기기) 3가지를 배치.](https://upload.cafenono.com/image/slashpagePost/20260317/193934_nydZOy3zIbZHCslnH3?q=80&s=1280x180&t=outside&f=webp)

다만 그럴수록 더 중요한 건 사람의 역할입니다. **경계선을 긋고(보안/책임), 판단 지점을 설계하고, 결정만 남기는 구조**를 만드는 것. 이게 AI Native의 "협업 감각"입니다.

결국 이 그라운드 룰은 한 문장으로 정리됩니다.

> AI Agent는 기술이 아니라, 일을 'AI가 하기 좋은 형태'로 다시 설계하는 습관이다.

---

## 마무리: 장현민의 AI Native 가설

### 1. AI 시대의 경쟁력은 '지식'이 아니라 '실험량'에서 갈린다

AI는 누구나 쓸 수 있게 됐습니다. 차이는 "무슨 모델을 쓰냐"가 아니라, **AI가 어디까지 되는지 직접 해본 사람/조직이냐**에서 벌어집니다. 결국 경쟁력은 정보가 아니라 경험에서 나오고, 그 경험은 실험량으로 축적됩니다.

### 2. 완전 자동화보다 중요한 건 '경계선 설계'다

현실의 업무는 보안, 책임, 결재 같은 벽이 있습니다. 그래서 중요한 건 "다 맡기자"가 아니라, **내가 안심할 수 있는 경계선을 긋고 그 안에서 AI의 능력을 최대화**하는 겁니다. 다운로드는 사람이 하고, 정산과 분석은 AI가 하는 식의 타협이 오히려 지속 가능한 AX가 됩니다.

### 3. 개인의 효용감은 KPI가 될 때 조직의 습관이 된다

개인이 Agent를 하나 만들면 그건 개인 생산성으로 끝나기 쉽습니다. 하지만 조직이 "6월까지 1000개"처럼 목표를 걸면, 그건 숫자가 아니라 **매일 던지는 질문의 형태**로 바뀝니다.

> 이 일은 정말 사람이 해야 하는가? 
> AI에게 맡기려면 무엇부터 쪼개야 하는가? 
> 어디까지 자동화하고, 어디부터는 사람이 결정할 것인가?

이 질문을 매일 던지는 조직이 되면, 1000개는 결과가 아니라 새로운 방정식을 찾게 되는 것 같습니다. 팀제이커브는 그 흔적을 가능한 한 많이 공유해보려 합니다. 

이 시대 최고의 공부는 결국, **직접 해보는 것**이니까요.

For the site tree, see the [root Markdown](https://blog.teamjcurve.com/.md).
