들어가며 — 한 번의 잘못된 채용이 조직을 끝낸다
스타트업 CEO 한 명이 처음으로 마케팅 헤드를 채용한다. 그는 마케팅을 잘 모른다. 후보가 들고 온 슬라이드는 화려하다. "퍼널 최적화", "어트리뷰션 모델링", "그로스 루프" 같은 단어가 나온다. CEO는 "내가 모르는 영역이니 이 사람이 잘 알겠지"라고 생각하고 채용한다.
6개월 뒤, 마케팅 채널은 작동하지 않는다. 새로 뽑힌 헤드는 자신이 통제할 수 있는 사람만 팀에 추가했다. 그 팀원들은 다시 자신보다 약한 사람을 데려왔다. 1년이 지나자 회사의 마케팅 조직 전체가 "CEO가 직접 손을 대는 게 더 빠른" 상태가 됐다.

이 시나리오는 실리콘밸리에서 매주 반복된다. Jason Cohen — 4개의 회사를 매각하고 WP Engine을 1억 달러 ARR로 끌어올린 창업가 — 은 그의 에세이 "How to Hire People Who Are Better Than You"에서 단 한 문장으로 이 결론을 정리한다.
"If you feel like it's easier to just do it yourself, you hired incorrectly."
— "당신이 직접 하는 게 더 빠르다고 느끼는 순간, 당신은 잘못 채용한 것이다."
(asmartbear.com — Hire Better Than You)
이 한 줄에는 40년 된 채용 원칙의 본질이 응축돼 있다. 그러나 이 원칙은 따라하기가 거의 불가능하다. 진짜 어려운 질문은 따로 있기 때문이다.
"내가 잘 모르는 분야의 전문가를, 내가 어떻게 평가하나?"
이 글은 이 한 가지 질문을 따라간다. Iacocca → Jobs → Hastings → Cohen으로 이어진 40년의 진화, 5가지 실전 평가법, 한국 조직 적용 시 자주 나오는 함정, 그리고 AI가 채용 평가의 절반을 차지하기 시작한 2026년의 변형까지 풀어낸다.
이 글은 다음을 다룬다.
- 1984년 — Lee Iacocca의 한 줄에서 시작된 채용 철학의 원형
- "A는 A를 뽑는다 / B는 C를 뽑는다" — Steve Jobs의 보조 폭발(Bozo Explosion) 경고
- 인재 밀도(Talent Density) — Reed Hastings의 Netflix 실험
- Jason Cohen의 5가지 실전 평가법 — "검증할 수 없는 것을 어떻게 검증하나"
- 평판 조회(Reference Check)의 재구성 — 3가지 새로운 질문
- 거짓 양성(False Positive) — 잘못된 채용이 더 비싼 이유
- 2026년 AI 시대 — 인간 평가와 AI 평가가 만나는 지점
- 한국 조직에서의 적용 — 5가지 함정과 그 우회법
제1장: 1984년 — Lee Iacocca의 한 줄에서 모든 게 시작됐다
미국 자동차 산업이 두 번째 위기에 들어선 1980년대 초, Lee Iacocca — Ford에서 Mustang을 만들고, Chrysler를 파산 직전에서 구한 인물 — 는 자서전과 인터뷰에서 자신의 채용 원칙을 한 줄로 정리한다.
"I hire people brighter than me and then I get out of their way."
— "나는 나보다 똑똑한 사람을 뽑고, 그들이 일하도록 비켜준다."
(Fast Company — Lee Iacocca's best quotes)
이 한 문장에는 두 개의 명령이 들어 있다. 첫째, 나보다 잘하는 사람을 뽑아라. 둘째, 그 사람을 통제하지 마라. 두 명령은 동시에 성립해야 한다. 한쪽만 지키면 작동하지 않는다.
왜 이 단순한 원칙이 이렇게 어려운가
대부분의 리더는 첫째 명령에서 무너진다. "내가 평가할 수 없는 사람을 어떻게 뽑지?" 평가할 수 없는 것이 두렵기 때문에, 자신이 충분히 이해하는 — 그래서 자신보다 작은 — 후보를 뽑는다. 두려움의 결과물이다.
두 번째 명령에서 무너지는 리더도 많다. 잘하는 사람을 뽑아놓고 사사건건 개입한다. 그 사람이 가져온 기존 방법론을 무시하고 자기 방식대로 다시 가르치려 한다. 6개월이 지나면 그 인재는 "여기서는 내 능력의 30%만 쓸 수 있다"고 말하며 떠난다.
Peter Drucker가 이미 1959년에 말했다
Iacocca의 한 줄은 사실 Peter Drucker가 1959년에 처음 정의한 "지식 노동자(Knowledge Worker)" 개념의 결론이다. Drucker는 "지식 노동자에게는 무엇을 할지 지시하는 것이 아니라, 무엇이 필요한지 알려줘야 한다"고 적었다.
20세기 매니지먼트 이론은 이 한 줄에 대한 긴 각주다. 자기 분야의 전문가가 자기 일에 대해 가장 잘 안다. 리더의 일은 그 사람이 일할 수 있는 환경을 만드는 것이지, 그 사람의 일을 대신 결정하는 것이 아니다.
한국 기업에서 가장 많이 무너지는 지점
Iacocca의 두 번째 명령 — "비켜준다" — 은 한국 조직에서 특히 어렵다. 위계가 강한 조직 문화에서 "비켜준다"는 "무관심"으로 해석되기 쉽다. 또한 의사결정의 책임 소재가 모호한 경우, 리더가 "마지막 결정권"을 놓지 않으려는 본능이 강하게 작동한다.
이 글의 마지막 챕터에서 한국 조직에서 "비켜준다"를 "방치하지 않으면서 위임하는" 형태로 어떻게 구현하는지 다루겠다.
제2장: A는 A를, B는 C를 뽑는다 — Apple의 보조 폭발(Bozo Explosion)
Iacocca의 한 줄은 Steve Jobs의 1985년 인터뷰에서 더 강력한 형태로 다시 등장한다. Jobs는 "평균과 최고의 차이는 100:1이다"라는 표현으로 인재의 비대칭성을 설명했다.

"The dynamic range between what an average person could accomplish and what the best person could accomplish was 50 or 100 to 1. Given that, you're well advised to go after the cream of the cream… A small team of A+ players can run circles around a giant team of B and C players."
(Elite Team Tactics — Why Steve Jobs insisted on A players)
보조 폭발(Bozo Explosion)의 메커니즘
Apple의 chief evangelist였던 Guy Kawasaki는 Jobs의 채용 원칙을 한 줄로 정리한다. "A는 A를 뽑는다. B는 C를 뽑는다. C는 D를 뽑는다." (Guy Kawasaki — What I Learned From Steve Jobs)
이 도미노 효과를 보조 폭발(Bozo Explosion) 이라 부른다. 한 번 B 플레이어가 들어오면 — 그 사람은 자신이 가장 똑똑하기를 원하기 때문에 — 자기보다 약한 C를 뽑는다. C는 D를 뽑는다. 1년이 지나면 조직 전체가 광대(bozo)들로 가득 찬다. 한 번의 잘못된 채용이 시간 차로 조직 전체를 무너뜨린다.
보조 폭발 — 한 번의 실수가 조직을 어떻게 무너뜨리나
Layer 0 — A급 창업자
자기보다 잘하는 사람을 뽑는다
→ A급 직원 채용
Layer 1 — A급 직원
A는 A를 끌어당긴다
→ 또 다른 A급
Layer 2 — 한 명의 B급
위협을 느껴 자기보다 약한 사람만 뽑는다
→ C급 채용
Layer 3 — C급들
D급, E급으로 이어지는 도미노
→ 조직 전체가 광대
결과 — 보조 폭발
1년 뒤 조직 평균 수준이 폭락
A급들이 떠나기 시작
CEO의 깨달음
"내가 직접 하는 게 더 빠르다"
→ Cohen의 진단점
실제 사례 — Apple Macintosh 팀의 채용 철학
Jobs는 자신의 팀 채용을 위임하지 않았다. 모든 면접에 직접 들어갔다. 면접에서 그는 첫 5분 동안 후보의 기술 역량을 확인했고, 그 다음에는 "이 사람이 Apple을 사랑하게 될 것인가" 만을 봤다.
가장 유명한 일화. 1980년대 초 Apple II 팀에서 일하던 엔지니어 Andy Hertzfeld가 코드를 짜고 있던 중, Jobs가 그의 컴퓨터 전원 코드를 뽑아버리고 "너는 이제 Mac 팀이다"라고 통보했다. Jobs는 Hertzfeld가 A급이라는 걸 알아봤고, 그 한 사람을 끌어올리기 위해 즉흥적으로 행동했다(TalenTrust — How Steve Jobs got A+ players).
이 행동의 핵심은 "A급은 A급과 일하고 싶어 한다" 는 가설이다. Mac 팀은 그렇게 시작됐고, Mac 1.0이 나오기까지 4년 동안 "세상을 바꾸려는 100명" 으로 팀이 유지됐다.
Kawasaki의 작은 수정 — "A는 자기보다 더 잘하는 사람을 뽑는다"
Kawasaki는 Jobs의 "A는 A를 뽑는다"에서 한 발 더 나갔다. 그의 수정안은 "A는 자기보다 더 잘하는 사람을 뽑는다". 이 차이는 미묘하지만 중요하다. "동급"이 아니라 "한 단계 위". 그래야 회사가 매번 새로 뽑을 때마다 평균이 올라간다.
이 원칙은 그대로 Iacocca의 1984년 한 줄과 만난다. 두 사람은 같은 결론을 다른 입구로 도달했다.
제3장: Reed Hastings의 인재 밀도(Talent Density) 실험
Apple이 "한 사람을 끌어올리는 채용" 의 모델이라면, Netflix의 Reed Hastings는 그것을 회사 전체의 운영 원리로 끌어올린 사람이다. 그의 책 "No Rules Rules" 에서 핵심 단어는 두 개다. 인재 밀도(Talent Density), 그리고 키퍼 테스트(Keeper Test).
2001년의 우연 — 1/3을 자른 회사가 더 빨라졌다
Hastings는 닷컴 버블이 터진 2001년, Netflix 직원의 1/3을 정리해야 했다. 그는 "회사가 멈출 줄 알았다"고 적었다. 그러나 정반대였다. 남은 2/3가 더 많은 일을 더 빨리 해냈다. 같은 일을 하던 사람 중 정말 잘하는 사람만 남았기 때문이다.
이 우연한 실험은 Hastings에게 한 가지 결론을 줬다.
"인재 밀도가 높으면, 프로세스가 거의 필요 없다." (Startup Archive — Reed Hastings on talent density)
A급 100명은 알아서 일한다. B급 200명은 끊임없는 회의·승인·문서·KPI 시스템을 필요로 한다. 회사가 커질수록 후자의 비용이 폭증한다. 그래서 Netflix의 답은 사람을 적게 뽑고, 평균을 끊임없이 올리는 것이었다.
키퍼 테스트(Keeper Test) — 매니저가 매주 던지는 질문
Netflix의 모든 매니저는 자신의 모든 팀원에 대해 매주 한 가지 질문을 던진다.
"이 사람이 다른 회사로 비슷한 자리에 가겠다고 한다면, 나는 그를 붙잡기 위해 싸울 것인가?"
답이 "아니오"이면, 그 사람은 떠나야 한다 — Netflix의 표현으로는 "adequate performance gets a generous severance package(평범한 성과는 후한 퇴직 패키지를 받는다)". (Founders Tribune — The Keeper Test)
이 정책은 가혹해 보인다. 그러나 Hastings의 논리는 단순하다. A급 한 명이 떠나는 가장 큰 이유는 옆에 B급이 있기 때문이다. B급을 빨리 보내야 A급이 남는다. "가족 같은 회사" 가 아니라 "프로 스포츠팀 같은 회사" — 모든 포지션의 최고를 매번 새로 결정한다.
P
문제 — 보통 회사가 빠지는 함정
B급도 회사에 충성한다. 자르기 미안하다. 그러나 옆의 A급이 그 B급 때문에 매일 좌절한다.
S
해결 — 키퍼 테스트와 후한 퇴직 패키지
B급에게 가장 후한 패키지를 주고 빨리 보낸다. 죄책감 대신 명확한 보상.
R
결과 — A급이 남는다, 프로세스가 줄어든다
Netflix는 동급 회사 대비 매니저당 직원 수가 더 많고, 회의 시간이 더 짧다. 인재 밀도의 직접 효과.
Hastings 모델의 한국 적용 — 어디에서 깨지는가
Netflix 모델을 한국에 그대로 가져오면 거의 항상 실패한다. 이유는 두 가지다.
- 법적 환경: 한국 근로기준법은 "적절한 성과" 를 이유로 해고하는 것을 거의 허용하지 않는다.
- 문화적 환경: "가족 같은 회사" 정서가 깊다. "프로 스포츠팀" 비유가 차갑게 들린다.
그래서 한국형 변형은 다음과 같다 — 자르는 대신 자리를 바꾼다. 키퍼 테스트의 답이 "아니오" 이면, 그 사람을 다른 부서·다른 역할로 옮긴다. 한국 대기업의 "전배" 문화는 이 변형의 자연스러운 도구다. "성과가 부족하니 나가라" 가 아니라 "이 자리에 더 맞는 사람을 찾아주자". 결과는 같지만 절차는 인간적이다.
제4장: 핵심 딜레마 — 검증할 수 없는 것을 어떻게 검증하나
여기까지가 "왜 자기보다 뛰어난 사람을 뽑아야 하는가" 에 대한 40년의 합의다. 그러나 진짜 어려운 질문은 따로 있다.
"내가 잘 모르는 분야의 전문가를, 내가 어떻게 평가하나?"
이 질문에 가장 정직하게 답한 사람이 Jason Cohen이다. 그는 4개의 회사를 매각했고(Smart Bear가 가장 유명), 현재 WP Engine을 운영한다. 그는 "How to Hire People Who Are Better Than You" 에세이에서 이렇게 시작한다.
"You are hiring people who are better than you in their domain. By definition, you cannot evaluate their domain expertise. So what can you actually verify?"
— "당신은 자기 분야에서 당신보다 잘하는 사람을 뽑는다. 정의상, 당신은 그들의 도메인 전문성을 평가할 수 없다. 그렇다면 당신이 실제로 검증할 수 있는 것은 무엇인가?"
Cohen의 답은 다섯 가지다. 이 다섯 가지는 모두 "기술 평가가 아닌 다른 신호를 본다" 는 공통점을 갖는다.

제5장: Cohen의 5가지 평가법 — 실전 가이드
평가법 1: 행동을 일으키는 아이디어 (Ideas That Inspire Action)
면접이 끝나고 후보가 떠난 뒤, 당신과 팀이 "채용 결정과 무관하게, 그가 한 말의 절반은 우리가 당장 해야 할 일" 이라는 느낌을 받는다면, 그것이 첫 번째 신호다.
Cohen의 표현: "Even if we don't hire them, we've got to do half of what they recommended."
이 신호는 "진짜 도메인 전문성" 과 "일반론적 프레임워크" 를 구분하는 가장 빠른 방법이다. 일반론적 프레임워크는 후보가 책에서 외운 내용이다. "퍼널 단계마다 측정 지표를 정의해야 한다" 같은 문장은 누구나 할 수 있다.
진짜 전문가는 다르다. 그는 당신 회사의 구체적 문제를 듣고 — "당신의 가입 페이지에서 이메일 입력 필드 위에 가격 비교가 들어가 있는데, 이건 컨버전을 30% 잘라먹는다. 우리 회사에서 똑같은 패턴이 있어서 1주일 만에 빼보고 알았다" — 같이 즉시 행동 가능한 디테일을 준다.
팀 회의에서:
"방금 그 후보가 우리에게 알려준 것 중에, 채용 결정과 무관하게 우리가 당장 해야 할 일은 무엇이지?"
답이 한 가지 이상 나오면:
→ 진짜 도메인 전문성 신호. 채용 강한 추천.
답이 없거나 일반론만 나오면:
→ 외운 프레임워크. 패스.
평가법 2: 면접 중에 당신이 배우는가 (Mutual Learning)
좋은 후보와의 면접은 양방향 대화다. 당신이 묻고 그가 답하는 단방향이 아니라, 그가 답하면서 당신이 "아, 그렇구나" 를 자주 말하는 형태다.
Cohen의 표현: "You should already be learning from them during the interview."
이때 중요한 디테일: 검증 가능한 것을 말하는가? 면접 중에 들은 내용이 — 면접이 끝난 뒤 검색이나 책으로 확인했을 때 — 정확하다면, 그것은 진짜 전문성이다.
사례 — Stripe의 면접 패턴
Patrick Collison은 Stripe의 첫 10명을 뽑을 때 6개월에 2명을 뽑았다. 그의 면접은 일반적인 "질문-답변" 형식이 아니었다. 그는 후보와 함께 결제 시스템의 구체적 문제 를 화이트보드에 적고 같이 풀었다(Sahil S — Stripe's Founder Advice).
그 시간에 Patrick 자신이 무엇을 배우는가가 가장 중요한 신호였다. 후보가 "이 패턴은 PCI-DSS 4.1 때문에 작동 안 한다" 같이 Patrick이 모르던 것을 알려주면, 그것이 채용 신호였다.
평가법 3: 자기 분야 너머의 조직 향상 (Broader Lift)
훌륭한 후보는 자기 분야 너머까지 회사를 끌어올린다. 마케팅 헤드 후보가 마케팅 이야기만 하면 — 그것도 좋은 일이지만 — 가장 좋은 후보는 프로세스, 의사소통, 의사결정 구조 같은 횡단 영역까지 닿는다.
Cohen의 표현: "Great leaders improve processes, team strength, communication, and decision-making across departments."
사례 — Anthropic의 채용 기준
Anthropic은 ML 엔지니어 채용에서 PhD를 요구하지 않는다. 약 50%만이 PhD다. 대신 그들이 보는 것은 "전례가 없는 문제를 처음부터 풀어내는 능력(first-principles thinking)" 이다(Data Exec — Breaking Into AI in 2026).
면접에서는 새로운 문제 — 기존 솔루션이 없는 문제 — 를 주고, 후보가 어떻게 추론을 진행하는지 본다. 이것이 Cohen의 "broader lift" 와 같은 신호다. 도메인 깊이가 아니라 사고 도구가 얼마나 일반화되어 있는가.
평가법 4: 진짜 회사 문제로 평가 (Real Problem-Solving)
표준 면접 질문 — "어려운 프로젝트를 어떻게 해결했나요" — 은 거의 무용지물이다. 후보는 이미 그 답을 외워 왔다. 더 좋은 방법은 회사가 지금 실제로 풀고 있는 문제를 보여주고, 면접 중에 같이 풀어보는 것이다.
Cohen의 핵심 관찰: "좋은 후보는 모르는 것을 모른다고 한다."
자신이 모르는 영역에 부딪히면, 그는 "이건 제가 잘 모르는 영역인데, 두 가지 가능성이 있을 것 같습니다…" 처럼 답한다. 나쁜 후보는 "제가 한 ABC 프로젝트에서 이런 비슷한 게 있었는데…" 라며 외운 답을 끼워맞춘다.
| 신호 | 좋은 후보 | 나쁜 후보 |
|---|
| 모르는 질문에 부딪힐 때 | "이건 제가 잘 모르는 영역인데, 두 가지 추측이 가능합니다…" | "제 경험에서는 이런 비슷한 게…" (질문 회피) |
| 명확화 질문 | "제가 정확히 답하려면 ABC를 알아야 합니다. 알 수 있나요?" | (질문 없이 일반론으로 답) |
| 프레임워크 사용 | 도구로 사용 (필요할 때만) | 프레임워크가 답 자체 (모든 답에 등장) |
| 자기 한계 인식 | 명확함, 지점이 구체적임 | 모호함, "다 할 수 있다" 톤 |
사례 — Anthropic의 라이브 추론 면접
Anthropic은 후보에게 모델 해석 가능성(interpretability) 같은 새로운 문제를 던지고, 후보가 라이브로 추론을 진행하는 모습을 본다. 답을 맞추는지 보다 사고의 경로 가 우선이다. 이는 Cohen의 평가법 4와 정확히 일치하는 패턴이다.
평가법 5: 평판 조회의 재구성 (Strategic Reference Checks)
표준 평판 조회 — "이 사람이 좋은 사람인가요?" — 는 거의 모든 답이 "네, 좋은 사람입니다" 다. 의미가 없다.
Cohen의 대안은 세 가지 질문이다.
질문 1 — 환경 적합성
"이 사람이 가장 잘 일하는 환경은 어떤 환경인가요? 그가 무너지는 환경은 어떤 환경인가요?"
질문 2 — 약점
"이 사람이 가장 어려워하는 일은 무엇인가요? 어떤 종류의 동료와 일할 때 갈등이 생겼나요?"
질문 3 — 본인이 모르는 강점
"이 사람이 자기 자신은 잘 모르지만, 옆에서 보면 분명히 보이는 자연스러운 강점은 무엇인가요?"
이 세 질문은 "이 사람을 채용해도 되나요" 가 아니라 "이 사람을 어디에 어떻게 배치해야 하나요" 를 알려준다. 이것이 Cohen이 강조하는 차이다 — 평판 조회는 채용 여부를 정하는 도구가 아니라, 이미 채용 결정이 70% 기울어진 후보에 대한 배치 도구 다.
제6장: 거짓 양성(False Positive) — 잘못된 채용이 더 비싼 이유
Cohen의 에세이에서 가장 짧지만 가장 중요한 한 단락이 있다.
"Some strong interviewees underperform; weaker performers excel. Only false positives prove truly costly. Act decisively if misfires occur — your best employees will recognize problems before you do."
이 문장에는 두 개의 결론이 들어 있다.
1. 거짓 양성(잘못 뽑은 사람)이 거짓 음성(놓친 좋은 후보)보다 훨씬 비싸다.
좋은 후보를 놓치면 — 회사는 못 잡았지만 다른 회사가 잡는다. 비용은 "기회 비용" 한 단위다. 잘못된 사람을 뽑으면 — 612개월의 월급, 옆 사람들의 좌절, 그 사람이 끌어당긴 또 다른 잘못된 채용까지 — 비용이 510배가 된다.
2. 잘못 뽑은 걸 알면 빨리 움직여라. A급들이 너보다 먼저 안다.
가장 빠른 신호는 "옆 자리 A급들이 갑자기 회의가 줄어들고, Slack에서 더 짧게 답하기 시작한다" 다. 그들은 위 사람의 답을 기다리지 않는다. 그들은 떠나기 시작한다.
거짓 음성 (놓친 좋은 후보)
기회 비용 1×
거짓 양성 (잘못 뽑은 사람) — 즉시 깨달음
실비용 2×
거짓 양성 — 6개월 늦게 깨달음
실비용 5×
거짓 양성 — 12개월 늦게 깨달음 (보조 폭발 발생)
실비용 10×
결정의 지연이 가장 비싸다
여기서 가장 중요한 점은 "결정 자체" 보다 "결정의 지연" 이 훨씬 비싸다는 것이다. 모든 리더는 채용 실수를 한다. 잘하는 리더와 못하는 리더의 차이는 그 실수를 알아챈 뒤 며칠 만에 움직이는가 다.
Hastings의 키퍼 테스트는 이 "지연" 을 줄이기 위한 도구다. 매주 한 번 던지는 질문이 "이 사람을 붙잡기 위해 싸울 것인가" 라면, 지연이 최대 1주일을 넘지 않는다.
제7장: 사례 연구 — 4개 회사의 채용 철학 비교
지금까지의 원칙들이 실제 회사에서 어떻게 다르게 구현되는지 비교한다.
| 회사 | 채용 철학 | 가장 강조하는 신호 | 거짓 양성 처리 |
|---|
| Apple (Jobs 시대) | A는 A를 끌어당긴다 / 보조 폭발을 막는다 | "Apple을 사랑할 것인가" — 문화 적합성 | Jobs 직접 면접·즉시 결정 |
| Netflix (Hastings) | 인재 밀도가 프로세스를 대체한다 | 키퍼 테스트 — "다시 뽑을 것인가" | 주 단위 점검 + 후한 퇴직 |
| Stripe (Collison) | 6개월 동안 2명만 뽑는다 | 1주 트라이얼 + 화이트보드 같이 풀기 | 매우 보수적 채용 → 거짓 양성 자체가 적음 |
| Anthropic (2026) | First-principles 추론 | 처음 보는 문제에 라이브로 부딪히는 모습 | 6개월 평가 사이클 |
공통점 — 4개 회사가 모두 동의하는 3가지
- CEO/창업자가 면접에 직접 들어간다 — 위임하지 않는다
- 표준 면접 질문을 거의 안 쓴다 — 회사의 진짜 문제로 평가한다
- 거짓 양성을 빨리 정리한다 — 후한 퇴직 패키지가 있을지언정, 늦지 않는다
차이점 — 회사 규모와 단계가 결정하는 변형
작은 회사(Stripe 초기)는 천천히 신중하게 뽑는다. 거짓 양성 비용이 회사 전체에 비례하기 때문이다. 큰 회사(Netflix)는 빨리 뽑고 빨리 정리 한다. 거짓 양성을 0으로 만드는 것이 불가능하기 때문에, 발견 → 정리의 사이클을 짧게 만든다.
한국 창업자의 함정: 작은 회사인데 큰 회사처럼 "빨리 뽑고 빨리 정리" 를 따라하면 — 정리 비용을 감당하지 못한다. 작은 회사는 Stripe 모델이 맞다. 첫 10명은 6개월~1년에 걸쳐 천천히.
제8장: 2026년 — AI 시대, 이 평가법은 어떻게 진화하는가
지금까지의 5가지 평가법은 모두 인간이 인간을 평가한다는 전제 위에 있다. 그러나 2026년 현재, 이 전제가 흔들리고 있다.

변화 1 — 후보가 AI로 면접을 준비한다
2026년 기준, 시니어 엔지니어 후보의 80% 이상이 Claude·ChatGPT로 면접을 사전 시뮬레이션 한다. "이 회사 면접 패턴이 뭔가" 를 미리 검색하고 답안을 정련해 온다. 이는 "외운 프레임워크 vs. 진짜 도메인 전문성" 의 경계를 더 흐리게 만든다.
대응책: Cohen의 평가법 4 — "회사의 진짜 문제로 평가" 의 가중치가 더 커진다. 일반적인 면접 질문은 AI가 더 잘 답한다. 그러나 "우리 회사가 지금 실제로 풀고 있는, 외부에 공개되지 않은 문제" 는 AI가 답할 수 없다.
변화 2 — 첫 스크리닝은 AI가 한다
OpenAI는 2026년 기준 4,500명에서 8,000명으로 빠르게 확장 중이다(CNBC — AI talent war 2026). Anthropic도 비슷한 속도. 이 속도에서 모든 후보를 사람이 1차 면접하는 것은 불가능하다. 첫 스크리닝(이력서·서류·온라인 코딩 챌린지)은 AI 보조가 표준이 됐다.
이 변화의 위험: AI가 골라준 후보풀이 단조로워질 수 있다. AI는 학습된 패턴 안에서 평가한다. 평균을 잘 맞추는 후보를 선호하고, "기존 패턴 바깥의 뛰어난 사람" — Cohen이 말하는 진짜 A급 — 을 놓치기 쉽다.
대응책: AI 스크리닝 + "AI가 거른 후보 중 하위 10%를 사람이 다시 본다" 는 보완 절차. 하위 10%에 진짜 다이아가 숨어 있을 가능성이 높다(특이한 이력, 비전형적 배경).
변화 3 — 평가 항목 자체가 달라진다
2026년 채용에서 새로 등장한 평가 차원은 다음과 같다.
2026 새로운 평가 차원
도메인 깊이
전통적 차원 (Cohen)
자기 분야의 진짜 전문성
학습 속도
전통 + 강화
2년 전 모델로 일했는가, 매분기 도구가 바뀌는데 따라가는가
AI 도구 활용
2026 신규 차원
Claude·Cursor·Devin을 어떻게 일에 녹였나. 단순 사용자 vs. 도구를 만드는 사람
판단력
2026 가중치 폭증
AI가 답을 100개 만들 때, 그중 옳은 것을 고르는 능력
문화 적합성
전통 차원 (Jobs)
팀의 일부가 될 의지·태도
메타인지
2026 신규 차원
AI가 틀렸을 때 그것을 알아채는 능력. 환각·편향 감지
특히 "판단력" 과 "메타인지" 는 이전에는 가중치가 낮았던 차원이다. AI가 답을 무한히 생성할 수 있는 시대에, "올바른 답을 고르는 사람" 의 가치가 폭증했다. 이는 Cohen의 평가법 1("행동을 일으키는 아이디어")이 더 중요해진다는 뜻이다 — 누구나 답은 만들 수 있고, 진짜 가치는 올바른 답을 식별하는 것.
변화 4 — 채용 사이클이 짧아졌다
2026년 시니어 ML 엔지니어의 면접 사이클은 46주에서 **12주** 로 줄었다. 이유: AI 회사 간 인재 경쟁이 격화돼, 결정이 느린 회사는 후보를 놓친다. 이는 Cohen의 "천천히 뽑아라" 와 충돌한다.
대응책: 첫 미팅에서 결정에 필요한 것을 모두 본다. 30분 + 90분 + 90분 = 4시간 안에 5가지 평가법을 모두 거친다. 빠르게 "yes/no" 가 결정될 수 있는 면접 설계가 새로운 표준.
보상의 폭증
Anthropic·OpenAI·DeepMind에서 시니어 ML 엔지니어의 중간값 보상은 연 470K 630K, 일부 직무는 $900K를 넘는다(Data Exec — Breaking Into AI in 2026). 이 보상은 "A급 한 명이 B급 100명보다 가치 있다" 는 Jobs의 1985년 가설이 30년 뒤 한 사람당 100만 달러 단위로 환산된 결과다.
제9장: 한국 조직에서의 적용 — 5가지 함정과 우회법
함정 1 — "위계 호환성"이 도메인 전문성보다 먼저
한국 대기업에서 가장 흔한 채용 실패 패턴: 후보의 도메인 전문성이 명확한데도, "우리 위계와 안 맞을 것 같다" 는 이유로 패스한다. 이 함정의 결과는 항상 "우리 위계에 잘 맞는 B급" 채용.
우회법: 채용 결정에서 "문화 적합성" 과 "위계 호환성" 을 명시적으로 분리한다. "문화" 는 회사의 핵심 가치다(Cohen이 강조하는 부분). "위계" 는 그 사람이 보고 라인을 어떻게 다루는가에 대한 것일 뿐. 이 두 가지가 섞이는 것이 한국 조직의 가장 큰 채용 실수다.
함정 2 — "내부 양성"이 외부 영입을 막는다
"있는 사람을 키우자" 는 좋은 원칙이지만, 새로운 도메인(예: AI/ML, 데이터 엔지니어링)에서는 외부에서 시니어를 데려와야 한다. 그 영역에 대해 5년 이상 부딪힌 사람이 없으면, 내부 양성은 5년이 걸린다.
우회법: "외부 영입 vs. 내부 양성" 의 결정을 "이 도메인이 회사 안에 5년 이상 부딪힌 사람이 있는가" 로 단순화한다. 답이 "아니오" 면 외부 영입. 그리고 외부 영입자에게는 첫 6개월 "성과 압박" 보다 "조직 학습 + 매핑" 시간을 명시적으로 준다.
함정 3 — "빠른 결정"의 부재
Stripe가 6개월에 2명을 뽑은 것과 한국 기업이 6개월에 면접 일정을 못 잡는 것은 다르다. 후자는 "신중함" 이 아니라 "의사결정 비용" 의 문제다. 좋은 후보는 그 사이에 다른 회사로 간다.
우회법: 채용 결정의 SLA를 명시한다 — "첫 면접부터 오퍼까지 14일 이내". 14일 안에 결정 안 나면, 그것은 "채용하지 않는다" 의 신호로 본다. 모호한 "검토 중" 상태가 가장 비싸다.
함정 4 — 평판 조회가 형식적이다
한국에서 평판 조회는 흔히 "인사팀이 후보 동의 받고 1명에게 전화" 형태로 형식적으로 진행된다. Cohen의 3가지 질문이 들어갈 자리가 없다.
우회법: CEO/하이어링 매니저가 직접 3명에게 30분씩 전화한다. 형식적 "이 사람 좋은 사람인가요" 가 아니라, Cohen의 3가지 질문 — 환경 적합성, 약점, 본인이 모르는 강점. 이 한 시간 반이 6개월의 잘못된 채용을 막는다.
함정 5 — 거짓 양성을 알고도 6개월을 끌고 간다
한국 조직에서 가장 비싼 함정. 채용한 지 3개월 만에 "이 사람 잘못 뽑았다" 가 명확해도, "6개월은 봐야지" 로 미룬다. 6개월 끄는 동안 옆 자리 A급들이 떠난다.
우회법: 3개월 명시적 점검. 입사 90일 시점에 "이 사람을 다시 뽑을 것인가" 라는 질문에 명시적으로 답한다. 답이 "아니오" 면, 3개월 시점에 후한 패키지로 빨리 정리한다. 시간이 지날수록 정리 비용은 기하급수적으로 늘어난다.
제10장: 실전 체크리스트 — 다음 채용에서 이번 주에 할 일

사전 준비 — 회사의 진짜 문제 3개를 적는다
현재 풀고 있고, 외부에 공개 안 된, 그 도메인의 진짜 어려움 3개. AI로 못 만드는 종류의 문제. (Cohen 평가법 4)
면접 1 — 30분 도메인 대화
위에서 적은 문제 1개를 같이 푼다. "당신이 우리 자리에 있다면 어떻게 풀겠는가"가 아니라 "우리는 이렇게 풀고 있다, 어떻게 보이는가". 평가법 1 + 4.
면접 2 — 90분 화이트보드
문제 2번을 화이트보드에서 같이 푼다. 사고 경로를 보고, 모르는 것에 대해 어떻게 답하는지 본다. 평가법 4.
면접 3 — 다른 부서 사람들과 60분
엔지니어링 후보를 마케팅·영업 사람들과 만나게 한다. 자기 분야 너머에 어떻게 닿는가. 평가법 3 (broader lift).
평판 조회 — 본인이 직접 3명
Cohen의 3가지 질문(환경 적합성·약점·본인이 모르는 강점)을 30분씩 3명. 평가법 5.
면접 후 팀 회의
"채용 결정과 무관하게, 이 사람이 알려준 것 중 우리가 당장 해야 할 일은?"이 첫 질문. 답이 1개 이상이면 강한 신호. 평가법 1 + 2.
90일 점검
입사 90일 후 키퍼 테스트. "이 사람을 다시 뽑을 것인가." 답이 아니오면 후한 패키지로 빨리 정리. 늦을수록 비용 폭증.
면접 직전 — 자기 자신에게 던질 한 가지 질문
면접실에 들어가기 전에 본인에게 한 가지 질문을 하라.
"오늘 내가 후보에게서 무엇을 새로 배우고 싶은가?"
이 질문에 답이 없다면, 당신은 "내가 평가하는 면접" 모드로 들어가는 것이다. 그것은 평가법 2("상호 학습")을 막는 모드다. 답이 명확하면 — "우리 마케팅 퍼널의 ABC 부분에 대해 이 사람의 관점을 듣고 싶다" — 면접의 질이 다르게 시작된다.
맺으며 — 두려움을 기준으로 채용하지 마라
40년 전 Iacocca의 한 줄, 30년 전 Jobs의 보조 폭발 경고, 20년 전 Hastings의 인재 밀도, 10년 전 Cohen의 5가지 평가법, 그리고 2026년 AI 시대의 새로운 차원까지 — 이 모든 진화는 한 가지 교훈으로 수렴한다.
"두려움을 기준으로 채용하지 마라. 평가할 수 없다는 두려움이 자기보다 작은 사람을 뽑는 결정으로 이어진다. 그 결정 한 번이 5년 뒤 회사를 결정한다."
자기보다 잘하는 사람을 뽑는 것은 직관에 반한다. "내가 통제할 수 없는 사람을 회사에 들이는 것" 처럼 느껴지기 때문이다. 그러나 그것이 바로 핵심이다. 회사는 당신이 통제할 수 있는 것보다 훨씬 큰 것을 만들어야 살아남는다. 그것은 정의상 당신보다 잘하는 사람들이 만든다.
Cohen의 한 줄이 남는다.
"If you feel like it's easier to just do it yourself, you hired incorrectly."
이 문장이 모든 채용 면접의 마지막 시험이다. 면접 후 6개월 뒤, 그 사람의 영역에서 — 마케팅이든, 엔지니어링이든, 영업이든 — 당신이 "내가 직접 하는 게 더 빠르겠다" 고 느낀다면, 채용은 잘못된 것이다. 그러면 빨리 움직여라. A급들이 이미 알고 있다.
2026년 5월, AI가 채용 평가의 절반을 차지하기 시작했다. 그러나 평가의 본질은 바뀌지 않았다. 검증할 수 없는 것을 검증하는 5가지 우회로 — 그것이 40년 전 Iacocca의 한 줄을 오늘도 살아 있게 만든다.
좋은 채용 결정 한 번이 5년의 기회를 만든다. 잘못된 채용 결정 한 번이 5년의 기회를 갉아먹는다. 이 비대칭이 인재 결정이 회사에서 가장 비싼 결정인 이유다.
더 읽어볼 자료
원문 — Hire Better Than You
채용 철학의 원형 — Iacocca, Jobs, Drucker
Netflix · Hastings — 인재 밀도와 키퍼 테스트
Stripe · Collison — 천천히 신중하게
Jim Collins — First Who, Then What
2026 AI 시대 채용
시리즈 연결