밤 10시의 받은편지함에서 시작된 이야기
2024년, Anthropic에 한 영업사원이 입사했다. 이름은 자레드 사이어스(Jared Sires). 아마존 출신의 스타트업 담당 어카운트 이그제큐티브(AE)였고, 터미널을 한 번도 열어본 적이 없는 사람이었다.
그의 담당 계정은 600700개. 하루 고객 콜은 1015건. 매일 밤 9~10시까지 이메일에 답장을 했다. 그는 당시를 이렇게 회상한다.
"받은편지함을 관리하는 게 거의 불가능했어요. 거기에 아웃바운드까지 해야 하는데, 어디에 집중해야 할지조차 알 수 없었죠."
2026년 6월 5일, Anthropic은 이 사람의 이야기를 공식 블로그에 공개했다. 코드를 전혀 모르던 그가 Claude Code로 4,300줄짜리 이메일 자동화 앱을 만들었고, 주당 10~15시간을 절약했으며, 그 도구를 플러그인으로 패키징하자 몇 달 만에 Anthropic 영업조직의 약 80%가 사용하게 됐다는 내용이다. 그의 직함은 이제 영업사원이 아니라 GTM 프로덕트 매니저다.

이 글이 공개되자마자 GTM(Go-To-Market) 업계가 들썩였다. 단순히 "AI로 시간을 아꼈다"는 미담이어서가 아니다. 이 글은 지난 15년간 B2B 영업의 표준이었던 모델이 구조적으로 붕괴하고, 그 폐허 위에서 'GTM 엔지니어링'이라는 새로운 직군과 방법론이 어떻게 태어나 여기까지 왔는지를 보여주는, 가장 구체적인 1차 사료이기 때문이다.
이 특집은 그 전체 이야기를 다룬다. 어제의 화제 글에서 출발해, 개념의 기원(2011년)까지 거슬러 올라간 뒤, 다시 현재와 미래로 돌아온다.
제1장: 사건의 전말 — 자레드와 CLAFTS 이야기
↓
제2장: 왜 태어났나 — '예측 가능한 매출' 모델의 붕괴
↓
제3장: 직군의 발명 — Clay와 GTM 엔지니어의 역사
↓
제4장: 두 갈래 길 — AI SDR의 추락 vs GTM 엔지니어의 부상
↓
제5장: 왜 이렇게 잘 작동하나 — 설계도 해부
↓
제6장: 최고의 사례들 — 4,000개 계정을 혼자 굴리는 법
↓
제7장: 실무 가이드 — 오늘 시작하는 법
↓
제8장: 한국 시장 — 직함은 없지만 기회는 있다
제1장: 사건의 전말 — 자레드와 CLAFTS 이야기
첫 실험: "오늘 누구한테 집중해야 하지?"
자레드의 첫 번째 문제는 이메일이 아니라 우선순위였다. 700개 계정 중 오늘 누구에게 전화해야 하는가? Anthropic은 제품이 24~48시간마다 바뀌는 회사다. 배치 API의 SLA, 프롬프트 캐싱 할인율, SDK 동작 방식 — 고객이 묻는 기술적 질문에 답하려면 Slack, Google Docs, 내부 지식베이스, 공식 문서를 헤집고 다녀야 했다.
그가 처음 만든 것은 거창한 게 아니었다. Google Apps Script와 Claude를 엮어, 매일 아침 제품 사용량 데이터를 기준으로 700개 계정을 성장 속도순으로 정렬한 브리핑을 받아보는 스크립트였다.
"매일 Claude가 '오늘은 이 고객들에게 집중해야 한다'는 브리핑을 줬어요. 사용량이 얼마나 늘었는지를 기준으로요."
작지만 결정적인 변화였다. 아웃바운드의 가장 어려운 질문 — "어디에 시간을 쓸 것인가" — 에 매일 아침 데이터가 답해주기 시작한 것이다.
CLAFTS: 받은편지함 안에 들어온 에이전트
다음 타깃은 받은편지함이었다. 자레드는 Claude Code로 CLAFTS(Claude Drafts) 라는 앱을 만들었다. Gmail 안에 상주하면서 Claude API로 고객 이메일의 답장 초안을 자동 생성하는 도구다.

흥미로운 건 그의 진입 장벽에 대한 고백이다.
"Claude Code는 이름에 '코드'가 붙어 있어서, 시작하는 것조차 좀 겁났어요. 그런데 어느 순간부터, 이게 내 컴퓨터에 연결된다는 것의 위력을 이해하게 됐죠."
CLAFTS의 구조는 단순한 "이메일 자동완성"이 아니다:
① 맥락 수집
공유 Google Drive 폴더와 서드파티 도구에서 해당 고객의 히스토리·컨텍스트를 가져온다
② 최신 문서 검증
웹 검색으로 Anthropic 공식 문서의 '현재' 버전을 확인 — 24~48시간마다 바뀌는 제품 정보를 사람의 기억에 의존하지 않는다
③ 목소리 재현
수백 번 다듬은 시스템 프롬프트로 자레드 본인의 문체를 재현한 초안 생성
④ 사람의 판단
초안은 발송 대기함에 쌓일 뿐 — 검토와 발송 버튼은 끝까지 사람의 몫
총 코드는 약 4,300줄. 거의 전부 Claude Code가 작성했다. 그는 시스템 프롬프트를 "수백 번" 반복해서 다듬었다고 말한다. 초기 초안은 너무 길고 변명조였기 때문이다. 이 부분이 중요하다 — 도구를 만드는 비용은 코딩이 아니라, 자기 업무에 대한 도메인 지식을 프롬프트로 옮기는 데 들었다.
CLAFTS Tones: 화난 이메일 실험
CLAFTS에는 'Tones'라는 기능이 있다. 상대가 고객인지, 동료인지, 가족인지에 따라 말투를 패턴 매칭으로 바꿔주는 기능이다. 자레드는 이 기능을 테스트하려고 자기 개인 계정으로 점점 더 화가 난 이메일을 보내봤다.

"Claude가 그 말투를 따라 하기 시작했어요. 그런데 어느 시점부터 거부 응답이 나오더라고요. 고객에게 화난 이메일을 쓰고 싶지 않다는 거죠. 그때 'CLAFTS Tones가 제대로 작동하는구나' 하고 알았습니다."
웃긴 일화처럼 보이지만, 실무적으로는 핵심을 찌른다. 뒤에서 다루겠지만 — AI에게 고객 커뮤니케이션을 맡길 때 가장 무서운 것은 능력 부족이 아니라 브랜드를 망치는 출력이 무방비로 나가는 것이다. 모델 차원의 안전장치가 작동하는지를 직접 한계까지 밀어붙여 본 것이다.
개인 도구에서 조직 인프라로
효과는 즉시 측정 가능했다. 하루 23시간, 주당 1015시간 절약. 그가 Slack에 도구를 공유하자 24시간 안에 다른 영업 직원들이 쓰기 시작했고, BDR 동료 존 앨버트(John Albert)가 합류해 함께 개선했다.
그다음 단계가 이 이야기의 진짜 핵심이다. 자레드는 도구들을 스킬(Skill) 단위로 쪼개고, MCP 커넥터와 함께 Claude Cowork 플러그인으로 패키징했다:
| 스킬 | 하는 일 | 효과 |
|---|
| 데일리 브리프 | 캘린더를 읽고, 오늘 만날 사람들을 웹 리서치해서 토킹포인트 생성 | 아침 미팅 준비가 출근 전에 끝나 있음 |
| 데일리 리캡 | Google Docs 미팅 노트를 읽고 팔로업 이메일 초안 작성 | 밤 10시까지 하던 일이 검토 30분으로 |
| /customer-context | Salesforce·Intercom·Gong·Gmail·Drive·BigQuery를 가로질러 계정 360° 뷰 생성 | 계정당 약 90초 |
| /pipeline-management | 위험 딜 탐지, 예측, 다음 액션 추천 | 파이프라인 리뷰 자동화 |
결과: 몇 달 만에 영업조직의 약 80%가 채택. 남은 20%는 대부분 신규 입사자인데, 그게 오히려 다음 타깃이다 — 예전엔 신입이 자기 워크플로우를 갖추는 데 몇 주가 걸렸지만, 이제는 입사 첫날 플러그인 하나를 설치하면 20개 이상의 스킬이 함께 따라온다.
"이 워크플로우들을 하나로 엮으면, Claude가 하루의 업무를 관리하게 됩니다. 그게 본질적으로 에이전트예요."
자레드의 직함은 AE → GTM 프로덕트 매니저로 바뀌었고, 그는 스스로를 "GTM 아키텍트"라고 부른다. 이제 그는 영업조직의 운영 문제를 발견하고, Claude 기반 해법을 설계하고, 마지막 구간만 시니어 엔지니어와 협업한다.
"기술 장벽이 녹아내리면서, 저는 거의 제품을 '설계'할 수 있게 됐어요. 1년 전에 누가 '너 Anthropic에서 GTM 프로덕트 매니저가 될 거야'라고 했으면 정말 놀랐을 겁니다. 이제 되돌아갈 길은 없어요(there's no turning back)."
여기까지가 화제가 된 글의 내용이다. 그런데 — 왜 이 이야기가 이렇게까지 반향을 일으켰을까? 그걸 이해하려면 2011년으로 돌아가야 한다.
제2장: 왜 태어났나 — '예측 가능한 매출' 모델의 붕괴
2011년: B2B 영업의 헌법이 쓰이다
2011년, Salesforce의 150번째 직원이었던 애런 로스(Aaron Ross)가 『Predictable Revenue(예측 가능한 매출)』라는 책을 낸다. 핵심 아이디어는 분업이었다.
- SDR(Sales Development Rep): 콜드 이메일·콜로 잠재고객을 발굴하고 미팅을 잡는 전담 역할
- AE(Account Executive): 잡힌 미팅에서 딜을 클로징하는 역할
"발굴과 클로징을 분리하라"는 이 단순한 공식이 Salesforce에서 1억 달러 이상의 매출을 만들었다는 서사와 함께, 이후 10여 년간 B2B SaaS 영업조직의 표준 설계도가 됐다. SDR 수십 명을 뽑아 이메일을 대량 발송하고, 응답률 몇 퍼센트를 미팅으로 전환하는 깔때기 — 우리가 아는 그 모델이다.
그리고 깔때기가 막히기 시작했다
2020년대 들어 이 모델의 전제가 하나씩 무너진다. 업계 집계마다 수치는 조금씩 다르지만 방향은 일치한다.
첫째, 응답률의 장기 하락. 1,650만 통의 콜드 이메일을 분석한 데이터에서 평균 응답률은 2023년 6.8%에서 이듬해 5.8%로 떨어졌고, 2026년 집계로는 평균 3.4% 수준까지 내려왔다. SDR 한 명이 하루에 만드는 '양질의 대화'는 3.6건 — 2014년 대비 55% 감소다.
역설적이게도 하락을 가속한 건 AI였다. 모두가 비슷한 AI 카피라이팅 도구로 비슷한 프레임워크의 이메일을 쓰기 시작하자, '개인화된 척하는 이메일'이 받은편지함을 채웠고 차별화는 소멸했다.
둘째, 2024년 2월의 인프라 단속. Google과 Yahoo가 대량 발신자(일 5,000통 이상)에게 SPF/DKIM/DMARC 인증, 스팸 신고율 0.3% 미만, 원클릭 수신거부를 의무화했다. 콜드 캠페인의 통상 신고율은 0.51% — 기준치의 23배다. 대응하지 못한 팀들은 그해 2분기 전달률이 30~50% 하락했다. "양으로 밀어붙이기"가 기술적으로 봉쇄된 순간이다.
셋째, 구매자가 영업사원을 피하기 시작했다. Gartner의 2026년 3월 조사에서 B2B 구매자의 67%가 "영업사원 없는(rep-free) 구매 경험"을 선호한다고 답했다(2025년 61%에서 상승). 더 아픈 수치는 이것이다 — 구매자의 73%가 "무관한 아웃리치를 보내는 벤더를 적극적으로 회피"한다. 대량 발송은 이제 중립적인 실패가 아니라, 브랜드에 마이너스를 새기는 행위가 됐다.
넷째, 경제성. 미국 기준 SDR 한 명의 완전 부담 비용(연봉+수당+도구+관리)은 연 약 13만 9천 달러. 응답률이 반토막 난 세계에서, 같은 파이프라인을 만들기 위해 SDR을 두 배로 뽑는 산수는 더 이상 성립하지 않는다.
⚠
문제
응답률 3%대 추락 + 발송 인프라 단속 + 구매자 67%의 영업 회피 + SDR 1인당 연 $139K — '사람을 더 뽑아 양을 늘리는' 2011년식 모델의 4중 붕괴
🔧
시장의 응답
"더 적은 사람으로 더 많은 파이프라인을" — 사람의 수가 아니라 시스템의 정밀도로 승부하는 새 직군의 수요 폭발
✓
결과
2023년, 그 직군에 이름이 붙는다 — 'GTM 엔지니어'
제3장: 직군의 발명 — Clay와 GTM 엔지니어의 역사
어느 Slack 채널에서 태어난 직함
'GTM 엔지니어'라는 말을 만든 곳은 뉴욕의 스타트업 Clay다. 2017년 카림 아민(Kareem Amin)이 창업한 Clay는 원래 범용 노코드 도구였다가 2021년 말 영업 데이터 자동화로 피벗했다.
전환점은 2023년 가을이었다. 엔터프라이즈 영업을 확장하려고 전통적인 영업 인력을 뽑았는데 — 실패했다. 대신 초기 멤버들이 직접 고객 미팅에 들어가 30분 안에 고객의 데이터 문제를 즉석에서 풀어주는 "리버스 데모"를 하자 딜이 닫히기 시작했다. 공동창업자 바룬 아난드(Varun Anand)의 회고는 이렇다.
"이 역할의 가장 근본적인 스킬은 세일즈가 아니었어요. Clay를 잘 다루는 것이었죠."
이 역할을 뭐라고 부를지 내부 Slack에서 토론하다 나온 이름이 GTM 엔지니어다. "절반은 AE, 절반은 SDR, 절반은 솔루션 엔지니어, 그리고 완전한 제품 전문가"라는, 산수가 안 맞는 정의와 함께. 실제로 Clay에는 AE도 솔루션 엔지니어도 없다. 영업조직 전원이 GTM 엔지니어이고, 전직 창업자·기계공학자·구조공학자처럼 비(非)영업 출신으로 구성돼 있다.
Clay의 공식 정의는 이 직군의 야심을 잘 보여준다:
"GTM 엔지니어링이란 AI, 데이터 인리치먼트, 워크플로우 자동화로 매출 시스템을 구축하는 실천이다. 소프트웨어를 코딩하는 대신, 매출을 코딩한다(coding revenue)."
직군의 족보: Sales Ops에서 GTM 엔지니어까지
이 직군이 하늘에서 떨어진 건 아니다. 15년에 걸친 진화의 마지막 형태다.
2010 · Growth Hacking
션 엘리스가 명명. "성장이 유일한 지표인 사람" — 데이터 기반 실험 문화의 원형이지만, 실무에선 광고 운영과 A/B 테스트로 협소화
2011 · SDR 분업 모델
『Predictable Revenue』 출간. 발굴(SDR)과 클로징(AE)의 분리가 B2B 표준이 되다
2018 · RevOps 부상
마케팅·영업·CS를 가로지르는 운영 직군. CRM·도구·프로세스의 '관리자' — Gartner는 2026년까지 고성장 기업 75%가 채택할 것으로 전망
2023 · GTM 엔지니어 명명
Clay 내부 Slack에서 탄생. 도구를 '관리'하는 게 아니라 매출 시스템을 '구축'하는 역할
2025~26 · AI 에이전트 시대
Claude Code·MCP·Skills가 런타임이 되면서, 코드를 모르는 도메인 전문가도 GTM 엔지니어가 될 수 있게 — 자레드가 그 증명
RevOps와의 차이를 가장 날카롭게 정리한 사람은 GTM 엔지니어링의 선구자로 불리는 조던 크로포드(Jordan Crawford)다.
"RevOps는 CRM 유지보수다. GTM 엔지니어는 회사 담장 밖에서 데이터를 가져와 채널로 밀어내는 사람이다."
업계에서 자주 쓰이는 또 하나의 구분: "RevOps는 기록의 시스템(system of record)을 소유하고, GTM 엔지니어링은 행동의 시스템(system of action)을 소유한다."
숫자로 보는 직군의 폭발
이 명명이 얼마나 정확하게 시대의 수요를 포착했는지는 채용 시장이 증명한다. 1,000개의 GTM 엔지니어 채용공고를 분석한 Bloomberry의 연구에 따르면:
- 신규 공고 전년 대비 +205% (2024 → 2025)
- LinkedIn 기준 공고 수 1,400건(2025 중반) → 3,000건+(2026년 1월)
- 공개 연봉 중앙값 $127,500, AI 기업은 $300K를 넘기도
요구 스킬에서도 직군의 성격이 드러난다. SQL과 Python이 각각 공고의 38%에 등장하고, 도구로는 Clay(58%), HubSpot(52%), Outreach(49%), Salesforce(45%)순이다. 영업 직군인데 채용 요건은 주니어 데이터 엔지니어에 가깝다.
명명자인 Clay 자신이 이 흐름의 최대 수혜자가 됐다. ARR $1M → $100M까지 2년(2025년 12월), 2026년 1월 기준 기업가치 $5B, 고객 14,000+ (OpenAI, Anthropic, Cursor, Canva, Rippling 포함). 독립 부트캠프 7곳에서 2,500명 이상이 'GTM 엔지니어' 과정을 수료했다. 직군 하나를 발명한 것이 곧 회사의 해자가 된, 드문 사례다.
제4장: 두 갈래 길 — AI SDR의 추락 vs GTM 엔지니어의 부상
여기서 중요한 분기점이 있다. 2024년, "영업 + AI"라는 같은 재료를 들고 시장은 두 개의 정반대 방향으로 달려갔다. 한쪽은 불탔고, 한쪽은 Anthropic의 80% 채택이 됐다. 이 대비가 이번 화제 글을 이해하는 열쇠다.
첫 번째 길: "사람을 해고하라" — AI SDR의 약속과 추락
2024년의 뜨거운 돈은 'AI SDR' — 사람 SDR을 통째로 대체하는 자율 에이전트 — 로 몰렸다.
11x.ai가 그 상징이었다. 창업 2년 만에 ARR $10M을 주장하며 Benchmark에서 $24M, a16z에서 $50M(기업가치 $350M)을 유치했다. 그러나 2025년 3월 TechCrunch의 폭로로 모든 게 무너진다. 고객이 아닌 ZoomInfo와 Airtable의 로고를 홈페이지에 걸었고(ZoomInfo는 법적 대응 검토), 90일 해지 조항이 있는 계약을 해지 후에도 연간 계약 전액으로 ARR에 계상했다. 전 직원들의 증언에 따르면 주장한 ARR $14M 중 실제로 트라이얼을 넘긴 것은 약 $3M, 고객 이탈률은 70~80%였다. 제품은 이메일이 제대로 안 나가거나 환각이 섞인 메시지를 보냈다. 2025년 5월, CEO는 물러났다.
Artisan은 다른 의미로 상징적이었다. 샌프란시스코에 "Stop Hiring Humans(인간 채용을 멈춰라)" 빌보드를 걸어 분노와 낙서, 협박까지 부른 그 회사다. CEO는 나중에 빌보드가 "거의 어그로 목적"이었다고 인정했고, 정작 Artisan은 사람 22명을 채용 중이었다.
업계 분석가들의 추정으로는 AI SDR 도구의 50~70%가 1년 안에 해지됐다.
왜 실패했나: 능력의 문제가 아니라 설계의 문제
흥미로운 점은, AI SDR의 실패가 모델 성능 탓이 아니었다는 것이다. 실패의 구조는 세 가지였다.
- 얕은 컨텍스트. AI SDR은 LinkedIn 프로필과 마케팅 사이트 같은 표면 데이터로 이메일을 썼다. CRM 히스토리도, 콜 녹취도, 제품 사용 데이터도 없이. "효과적이기보다 그럴듯하게 들리도록" 만들어진 시스템이었다.
- 판단의 외주. 영업 개발의 본질은 기계적 발송이 아니라 타이밍·관계·브랜드에 대한 판단이다. AI는 기계적인 부분을 잘했고, 판단이 필요한 부분에서 무너졌다.
- 자율성-품질 트레이드오프. 사람의 검토 없이 자율성을 높일수록 평균 출력 품질은 떨어졌고, 그 출력이 고객에게 직접 발사됐다.
학술 데이터도 이 직관을 뒷받침한다. Salesforce AI Research의 CRMArena-Pro 벤치마크(2025)는 현실적인 CRM 환경에서 LLM 에이전트의 영업 업무 수행력을 측정했는데, 최고 성능의 에이전트도 단일 턴 작업 성공률 약 58%, 멀티턴 대화에서는 35%로 급락했다.
성공률 58%짜리 시스템을 고객 앞에 무인으로 세우면 어떻게 되는지를, 11x의 70~80% 이탈률이 보여줬다.
두 번째 길: AI를 사람 '뒤'에 세우다
Anthropic의 접근은 정확히 반대였다. 같은 모델, 정반대의 배치.

| 설계 축 | AI SDR (1세대) | GTM 엔지니어링 (Anthropic 방식) |
|---|
| AI의 위치 | 고객 앞 — AI가 직접 발송 | 사람 뒤 — AI는 준비, 사람이 발송 |
| 컨텍스트 | LinkedIn·웹 등 표면 데이터 | CRM + 이메일 + 콜 녹취 + 제품 사용량 + 캘린더 (MCP) |
| 판단·관계 | AI에 위임 (블랙박스) | 사람이 보유 — 마지막 클릭은 항상 사람 |
| 도구의 소유권 | 월 $900~5,000 임대 (벤더 종속) | 직접 구축·소유 — 한계비용은 토큰 값 |
| 실패 모드 | 환각 이메일이 고객에게 직발 → 브랜드 손상 | 나쁜 초안은 검토 단계에서 폐기 → 손실은 시간뿐 |
| 결과 | 연 이탈률 50~70%, 11x 사태 | 영업조직 80% 자발 채택, 주 10~15시간 절약 |
이 표의 마지막 줄이 모든 것을 요약한다. 강제 도입도 아니고 톱다운 지시도 아닌, 자발적 채택 80%. 도구가 정말 일을 덜어줄 때만 나오는 숫자다.
같은 깨달음이 업계 전반에서 수렴 중이다. 2026년 초가 되자 살아남은 AI SDR 제품들조차 대부분 "AI가 준비하고, 사람이 원클릭으로 승인하는" 하이브리드 모델로 후퇴했다. CLAFTS Tones의 화난 이메일 실험이 보여주듯 — 모델의 안전장치 + 사람의 최종 판단이라는 이중 방어선이 현재의 균형점이다.
제5장: 왜 이렇게 잘 작동하나 — 설계도 해부
미담을 걷어내고 기술적으로 물어보자. 왜 이 방식은 이렇게 성능이 좋은가? 답은 세 겹이다.
5-1. 진짜 병목은 '쓰기'가 아니라 '조사'였다
Salesforce의 State of Sales 조사에 따르면 영업사원이 실제로 영업에 쓰는 시간은 근무시간의 30% 미만이다. 나머지 70%는 행정, 데이터 입력, 미팅 준비, 그리고 조사다. 잠재고객 한 명을 제대로 조사하는 데 3040분 — 50개 계정 리스트면 첫 콜을 걸기도 전에 2533시간이 조사로 사라진다.
여기가 레버리지 포인트다. 이메일을 빨리 쓰는 건 부차적이다. Anthropic의 /customer-context 스킬이 하는 일 — 7개 시스템에 흩어진 계정 정보를 90초 만에 종합하는 것 — 은 30~40분짜리 병목을 90초로 압축한다. 26배다.
직접 비교해보자. 아래 시뮬레이터의 '하루 비교' 탭은 자레드의 사례를 재구성한 것이고, '에이전트 루프' 탭은 데일리 브리프 → 데일리 리캡 체이닝이 실제로 어떻게 도는지 단계별로 보여준다.
5-2. 컨텍스트 집계: 어떤 단일 도구도 이길 수 없는 것
두 번째 답은 MCP(Model Context Protocol) 다. 1세대 AI SDR이 표면 데이터로 실패한 바로 그 지점에서, MCP는 회사 안에 이미 쌓여 있던 데이터를 에이전트의 컨텍스트로 합류시킨다.
Anthropic 영업 스택의 설계도를 원문과 공개 자료 그대로 재구성하면 이렇다:
Salesforce
딜·계정 기록
Gong
콜 녹취·대화 인텔리전스
Gmail / Calendar
커뮤니케이션·일정
BigQuery
제품 사용량 데이터
Google Drive / Intercom
문서·고객 대화
↓ MCP 커넥터 (컨텍스트 레이어) ↓
Claude (추론 레이어)
종합·판단·생성 — Claude Code / Cowork
↓ 스킬 (워크플로우 레이어) ↓
데일리 브리프
/customer-context
/pipeline-management
데일리 리캡
↓ 플러그인 (배포 레이어) — 팀 전체에 원클릭 설치 ↓
사람 (판단 레이어)
초안 검토 · 발송 승인 · 관계와 책임
각 레이어의 역할 분담이 핵심이다:
- 컨텍스트 레이어(MCP): 2026년 현재 Salesforce 호스티드 MCP 서버가 GA됐고, Gong도 MCP를 공식 지원한다. 에이전트가 CRM과 콜 데이터를 직접 읽고 쓴다.
- 워크플로우 레이어(Skills): 팀의 영업 플레이북을 마크다운 절차 파일로 인코딩한다. 코드가 아니라 문서라서, 도메인 전문가가 직접 다듬을 수 있다 — 자레드가 시스템 프롬프트를 수백 번 고친 것처럼.
- 배포 레이어(Plugin): 개인 해킹이 조직 인프라가 되는 지점. "도구를 만든 사람이 영원한 병목이 된다"는 자동화의 고전적 함정을, 플러그인 마켓플레이스가 푼다.
- 판단 레이어(사람): 마지막 클릭. AI SDR과의 결정적 차이.
5-3. 에이전트 루프 vs 정적 자동화
세 번째 답은 자동화의 '종류'다. Zapier식 자동화는 "트리거 → 정해진 액션"의 정적 파이프라인이다. 모든 분기를 미리 알아야 하고, 모호함 앞에서 부서진다. 영업은 정확히 그 반대의 영역이다 — 매 계정이 다르고, 매 이메일의 뉘앙스가 다르다.
에이전트는 다르게 작동한다. 목표를 받고, 도구를 골라 쓰고, 결과를 관찰하고, 다시 판단한다. 자레드의 표현을 빌리면 "하나의 Claude 실행 결과가 다음 실행의 입력이 되는" 체이닝이다. 아침의 데일리 브리프가 만든 맥락이 저녁의 데일리 리캡으로 흘러들고, 그 리캡이 내일 아침 브리프의 입력이 된다.
그리고 이 모든 것의 토대에는 한 가지 더 조용한 변화가 있다. 만드는 비용 자체가 붕괴했다. 4,300줄짜리 Gmail 연동 앱은 2023년이라면 외주로 수천만 원짜리 프로젝트였다. 자레드는 그걸 영업 일을 하면서 부업처럼 만들었다. 코드를 모르는 채로. GTM 엔지니어링이 2023년에 명명되고 2026년에 폭발한 이유가 여기 있다 — 직군의 정의는 Clay가 했지만, 진입 장벽을 부순 것은 코딩 에이전트다.
제6장: 최고의 사례들 — 4,000개 계정을 혼자 굴리는 법
사례 1: Travis Bryant — 영업 리더의 4,000계정 운영
자레드의 이야기가 '개인 생산성'의 사례라면, 같은 회사의 Travis Bryant 사례는 '리더십 스케일'의 사례다. Anthropic 미국 미드마켓 GTM 총괄인 그는 4,000개 계정을 Claude Cowork로 운영한다.
- 매일 아침 90분 분량의 마이크로 태스크가 자동 실행: 회의실 예약, BigQuery 사용량 + Salesforce 파이프라인을 종합한 미팅 사전 브리핑 — 출근 전에 끝나 있다
- 주간 예측(Forecast) 스킬: Salesforce 기회, 확정 예측치, BigQuery 토큰 사용량, 내부 문서를 종합해 리더십이 선호하는 포맷의 1페이지 리포트 생성 — 주 3시간 절약
- 압권은 분기별 영역 스코어링: 4,000개 계정 전체를 두 가지 커스텀 루브릭으로 하룻밤에 점수화 — 차원별 수치 점수와 서면 근거, 인터랙티브 대시보드까지. 이전에는 "수백 시간의 크로스펑셔널 작업"이었다
사례 2: 'How Anthropic uses Claude' 시리즈 — 같은 패턴의 6번 반복
이번 GTM 글은 사실 시리즈의 6번째다. 시리즈 전체를 나란히 놓으면 무서운 패턴이 보인다.
| 팀 | 만든 사람 | 만든 것 | 대표 성과 |
|---|
| 법무 | 변호사 (Mark Pike) | 마케팅 리뷰 Slack 도구, 계약 레드라이닝 | 마케팅 검토 2~3일 → 24시간 |
| 마케팅 | 그로스 마케터 | Figma 광고 변형 플러그인 | 광고 제작 30분 → 30초 |
| 보안 | 탐지 엔지니어 | 위협 탐지 플랫폼 CLUE | 오탐 33% → 7%, 30일간 약 1,870시간 절약 |
| 재무 | 재무 담당자 | 보드덱 검증·엑셀 모델 추적 | 주 10~20시간 회수 |
| 데이터 | 데이터 과학자들 | 에이전틱 text-to-SQL 분석 시스템 | 비즈니스 분석 쿼리 95% 자동화 (정확도 ~95%) |
| 영업 (이번 글) | 코드 못 쓰던 AE | CLAFTS + Sales 플러그인 | 주 10~15시간 절약, 조직 80% 채택 |
여섯 팀, 같은 공식: 도메인 전문가 + 코딩 에이전트 = 내부 제품. 엔지니어가 만든 게 하나도 없다는 점에 주목하라. 변호사가, 마케터가, 영업사원이 만들었다. 특히 데이터팀 사례에는 의미심장한 디테일이 있다 — 스킬(업무 절차 문서) 도입만으로 텍스트-to-SQL 정확도가 21%에서 95%로 뛰었다. 모델이 똑똑해진 게 아니라, 회사의 암묵지가 문서화된 것이 정확도의 원천이었다.
사례 3: WorkOS 워크숍 — 60분 만에 GTM 파이프라인 전체를
이 방법론이 Anthropic 바깥에서도 재현되는지 보여주는 사례가 WorkOS에서 열린 Claude Cowork 워크숍이다. 150석에 800명이 신청한 이 세션에서, Anthropic의 엔지니어는 하나의 Cowork 세션 안에서 7개 모듈을 라이브로 만들었다:
① ICP 수집 (8~9분)
15초 음성 프롬프트 → 콘퍼런스 연사 페이지 스크래핑 → 33명의 이름·직함·회사 + 산업·규모 인리치먼트
② 경쟁사 배틀카드 (7~8분)
Reddit·G2·개발자 포럼 스크래핑 → 취약점 등급·사용자 인용·가격 비교·공략 각도가 담긴 HTML 배틀카드
③~④ 포지셔닝 + 콜드 이메일
발견한 경쟁사 약점 기반 포지셔닝 → 150단어 미만, 프로스펙트별 페인포인트를 짚는 "사람이 쓴 것 같은" 이메일
⑤~⑥ SEO 콘텐츠 + 콘텐츠 캘린더
마케팅 플러그인으로 롱테일 키워드 블로그 초안 + 4주 콘텐츠 캘린더
⑦ 스케줄링
매주 월요일 오전 9시 블로그 자동 생성 예약 — "일요일 밤에 10개 태스크를 걸어두고 자는" 운영 모델
각 모듈은 수작업이라면 며칠몇 주짜리 일이고, 라이브에서는 모듈당 79분이 걸렸다.
사례 4: 숫자가 말하는 것들
그 밖의 공개된 성과 수치들(벤더 발표 수치는 출처 표기):
- Rippling (Clay 사례연구): 자동화 아웃바운드에서 오픈율 60%, 응답률 10% — 업계 평균 응답률(1
3%)의 310배. 콜드 이메일 채널 성과 전년 대비 2배
- Anthropic × Gong (Gong 사례연구): 영업 생산성 +64%, 신규 입사자 램프업 시간 46% 단축
- HubSpot 조사: 생성형 AI를 쓰는 영업팀의 83%가 매출 성장 경험 (미사용 팀 66%)
- Anthropic × Clay: Anthropic 자신도 Clay 고객 — 데이터 인리치먼트 커버리지 3배
한 가지 더. 이 흐름은 'Forward Deployed Engineer(FDE)'라는 인접 직군의 폭발과 같은 동전의 양면이다. Palantir가 2010년대에 발명한 — 엔지니어를 고객 현장에 파견해 문제를 직접 풀게 하는 — FDE 모델은 채용공고가 전년 대비 +1,165% 성장했고, OpenAI·Salesforce(1,000명 채용 공약)·Anthropic이 모두 도입했다. 차이가 있다면: FDE는 한 고객 안에 들어가고, GTM 엔지니어는 수천 프로스펙트를 동시에 건드리는 내부 시스템을 만든다. 공통점은 하나다 — 엔지니어링이 곧 매출 기능이 됐다.
제7장: 실무 가이드 — 오늘 시작하는 법
여기까지 읽고 "우리 팀도"라는 생각이 들었다면, 좋은 소식이 있다. Anthropic은 내부에서 쓰는 Sales 플러그인의 오픈소스 버전을 GitHub에 공개해 뒀다.
7-1. 5분 설치: 공식 Sales 플러그인
설치
claude plugin marketplace add anthropics/knowledge-work-plugins
claude plugin install sales@knowledge-work-plugins
포함된 커맨드
/call-summary — 콜 녹취 → 액션 아이템 + 팔로업 초안
/forecast — CSV 또는 CRM 연동 가중 파이프라인 예측
/pipeline-review — 정체 딜 플래그 + 주간 액션 플랜
포함된 스킬
account-research · call-prep · daily-briefing · draft-outreach · competitive-intelligence · create-an-asset
설계 철학이 훌륭하다: 모든 스킬은 MCP 커넥터 없이도 웹 검색만으로 작동하고, Salesforce·Gong·Clay 같은 MCP를 연결하면 "슈퍼차지"되는 점진적 구조다. CRM 연동 승인을 기다리는 동안에도 오늘부터 쓸 수 있다.
7-2. 컨텍스트 엔지니어링: CLAUDE.md에 무엇을 넣을 것인가
실무자들이 한목소리로 강조하는 성공 요인은 모델이 아니라 컨텍스트 문서의 품질이다. GTM용 CLAUDE.md(프로젝트 컨텍스트 파일)에 들어가야 할 다섯 가지:
① 정체성·목표
우리가 누구고 이번 분기 GTM 목표가 무엇인지
② 시그널 기반 ICP
"직원 50~200명" 말고 "최근 VP Sales를 뽑았고, 시리즈 B를 받았고, SDR 채용공고를 낸 회사"
③ 제품 컨텍스트
무엇을 풀고, 무엇은 못 푸는지
④ 금지 목록
접촉 금지 계정, 쓰면 안 되는 표현, 컴플라이언스 제약
⑤ 영업 방법론
MEDDICC, Challenger 등 — 팀의 플레이북 그 자체
자레드가 시스템 프롬프트를 수백 번 고친 것도, Anthropic 데이터팀의 정확도가 스킬 문서로 21%→95% 뛴 것도 같은 원리다. 에이전트의 성능은 곧 문서화된 도메인 지식의 성능이다.
7-3. 안전수칙: 마찰이 사라진다는 것의 의미
Databar의 실무 가이드에 이 방법론의 가장 중요한 경고가 있다:
"이메일 주소를 하나하나 복사하던 시절에는, 이름이 이상해 보이면 알아챌 수 있었다. 그 마찰이 생각할 시간을 줬다. Claude Code는 그 마찰을 통째로 제거한다."
그래서 규율이 필요하다:
①
드라이 런 (Dry Run)
외부로 나가는 액션은 절대 바로 실행하지 않는다 — 항상 "보낼 목록을 먼저 보여줘"
②
배치 제한
10건 → 검수 → 50건 → 검수 → 스케일. 자동화의 속도가 아니라 검증의 속도에 맞춰 늘린다
③
아이 테스트 (Eye Test)
개인화 출력의 10~15% 샘플은 반드시 사람이 읽는다 — 환각은 통계가 아니라 표본에서 잡힌다
7-4. 정직한 한계: 아직 안 되는 것들
균형을 위해, 이 접근의 현재 한계도 기록해 둔다 (SyncGTM의 분석 기준):
- 영속적 스케줄링의 제약 — Cowork 스케줄링이 답이지만 아직 로컬 실행 의존이 남아 있다 (클라우드 실행은 로드맵)
- 워터폴 인리치먼트 부재 — Clay처럼 100여 개 데이터 소스를 폭포식으로 탐색하는 매치율 최적화는 전문 도구가 여전히 우위
- 상태 관리 — "지난주에 이미 컨택한 사람"같은 캠페인 상태의 지속 관리는 직접 설계해야 한다
- 속도의 함정 — 위 안전수칙이 없으면, 잘못된 이메일 1,000통을 보내는 데 걸리는 시간도 10분이다
판단 기준은 단순하다: 개인·소규모 팀의 워크플로우 자동화와 POC는 코드-퍼스트 접근이 압도적으로 빠르고, 매일 수만 건을 처리하는 프로덕션 캠페인 인프라는 아직 전문 플랫폼과의 하이브리드가 현실적이다.
제8장: 한국 시장 — 직함은 없지만 기회는 있다
공백이라는 기회
미국에서 GTM 엔지니어 채용이 +205% 성장하는 동안, 한국에는 아직 이 직함 자체가 사실상 없다. 채용 플랫폼에서 'GTM 엔지니어'를 검색하면 거의 나오지 않는다. 하지만 역할의 수요는 이미 와 있다 — 세일즈 옵스, 그로스 매니저, RevOps, 영업 자동화 담당이라는 이름으로.
국내 생태계도 조용히 형성 중이다:
- Relate(릴레잇): YC 출신 한국계 B2B CRM. 아웃바운드 플레이북과 Apollo.io 연동 프로스펙팅 자동화 콘텐츠를 활발히 발행
- 세일즈맵(Salesmap): AI 네이티브 CRM — AI 어시스턴트가 미팅 기록·딜 인사이트·채팅 기반 업무 실행을 지원
- 리캐치(Re:catch): AI 기반 세일즈/마케팅 CRM + 그로스 패키지
Clay 커뮤니티의 서울 밋업도 열리기 시작했지만, 국내 유료 사용자는 아직 극소수다. 요컨대 — 방법론은 검증됐고, 국내 경쟁은 비어 있다.
한국적 변형이 필요한 지점
미국 플레이북을 그대로 이식하면 안 되는 부분이 두 가지 있다.
첫째, 채널. 한국 B2B는 콜드 이메일 문화가 약하고 전화·소개·대면 중심이다. 그러나 이건 방법론의 무효화가 아니라 재배치다. GTM 엔지니어링의 본질은 콜드 메일이 아니라 조사 병목의 제거와 컨텍스트 집계다. 소개 미팅 전 90초 만에 상대 회사의 최근 투자·채용·기술 스택을 종합하는 /customer-context는 채널과 무관하게 작동한다. 오히려 관계 중심 시장일수록 준비된 사람의 프리미엄이 크다.
둘째, 규제. 정보통신망법상 영리 목적 광고성 정보는 수신자의 사전 동의가 원칙이고, 야간 시간대 전송은 별도 동의가 필요하다. 미국식 대량 콜드 아웃리치를 자동화로 증폭하는 것은 한국에서 법적 리스크를 증폭하는 일이 될 수 있다. 자동화 설계 단계에서 수신 동의 상태를 금지 목록(no-go list)으로 관리하는 것까지가 한국형 GTM 엔지니어링이다.
코어닷투데이의 관전평
우리가 이 사례에서 가장 주목하는 건 따로 있다. Anthropic 시리즈 여섯 팀의 공통점 — 만든 사람이 전부 비개발자라는 사실이다. 이것은 "AI가 개발자를 대체한다"는 이야기가 아니라, 자기 업무의 병목을 가장 잘 아는 사람이 직접 도구를 만들 수 있게 됐다는 이야기다. 한국 조직에 번역하면: 다음 분기에 개발팀에 요청서를 내는 대신, 영업팀의 누군가가 이번 주에 직접 만들어보는 것. 그 한 사람이 자레드처럼 조직의 GTM 아키텍트가 된다.
맺으며: 화살표의 방향이 바뀌었다
이 특집을 한 장의 그림으로 압축하면 이렇다.
2011년의 모델은 사람을 늘려서 파이프라인을 늘렸다. 2024년의 AI SDR은 사람을 빼고 AI를 고객 앞에 세웠다가 무너졌다. 2026년의 GTM 엔지니어링은 AI를 사람 뒤에 세운다 — 컨텍스트를 모으고, 초안을 준비하고, 우선순위를 계산하는 일은 에이전트가, 판단과 관계와 마지막 클릭은 사람이.
2011 · 예측 가능한 매출
사람의 수 = 파이프라인
→
2024 · AI SDR
사람을 대체 → 추락
→
2026 · GTM 엔지니어링
사람을 증폭 → 80% 자발 채택
그리고 이 변화의 가장 조용한 함의: 자레드는 영업을 그만두고 엔지니어가 된 게 아니다. 영업을 더 잘하게 됐다. "CLAFTS 이후에야 비로소, 내가 원래 하고 싶었던 일 — 영업 — 을 더 많이 할 수 있게 됐다"는 그의 말이 이 방법론의 가장 정확한 요약이다.
기술 장벽은 녹고 있고, 병목은 도구가 아니라 도메인 지식의 문서화로 이동했다. 당신 팀에서 매일 밤 10시까지 받은편지함과 싸우는 사람이 있다면 — 그 사람이 아마 당신 조직의 첫 GTM 아키텍트일 것이다.
참고 자료
1차 자료 (Anthropic)
GTM 엔지니어링의 역사
AI SDR의 명암
실무 가이드 & 사례