프롬프트 엔지니어링gstackEverything Claude CodeClaude Code슬래시 커맨드SkillsAgentsGarry TanAndrej Karpathy바이브 코딩

프롬프트의 진화 — 한 줄에서 '오픈소스 팀'까지, gstack·ECC로 읽는 6세대

Garry Tan의 gstack과 Affaan Mustafa의 Everything Claude Code. 두 오픈소스 레포가 업계를 뒤흔든 이유는 '프롬프트 모음집'이어서가 아니다. 한 줄 지시에서 시작한 프롬프트가 25년 만에 조직도·운영체계·가상 팀으로 진화한 여정을 압축해 보여주기 때문이다. 이 글은 두 레포의 실제 SKILL.md·AGENTS.md·ETHOS.md를 인용하며 6세대 진화 맵을 그린다. 한 줄 지시가 어떻게 CEO 페르소나가 되고, 페르소나가 어떻게 플레이북이 되고, 플레이북이 어떻게 슬래시 커맨드 팀이 됐는지. 그리고 당신의 워크플로에 오늘 밤 적용할 수 있는 7단계를.

코어닷투데이2026-04-2445분

들어가며: Garry Tan의 "2013년 대비 240×"

단일 스티키 노트에서 역할별 플레이북 책장으로, 다시 로봇 가상 팀 룸으로 확장되는 3단 일러스트

Y Combinator 대표 Garry Tan이 2026년 4월 공개한 README 한 줄이 업계를 흔들었다.

"2013년 Bookface를 만들던 시절 연간 772건 기여. 2026년은 4월 18일 기준 이미 1,237건. 같은 사람, 다른 시대. 차이는 툴링(tooling)이다."

그가 공개한 도구가 gstack. Claude Code에 23개의 슬래시 커맨드를 더하는 프롬프트 컬렉션이다. 마크다운 파일 몇 개. 그 이상도 그 이하도 아니다. 그런데 이걸로 한 사람이 60일 동안 3개의 프로덕션 서비스, 40개의 기능을 출시했다고 한다.

2주 전, 또 다른 레포가 Anthropic 해커톤 우승 후 GitHub 트렌드 1위에 올랐다. Everything Claude Code(ECC). 별 14만 개, 포크 2.1만 개. "38 agents, 156 skills, 72 commands, 12개 언어 생태계." 이쪽도 본질은 같다. 잘 설계된 프롬프트들의 오픈소스 묶음.

왜 "프롬프트 묶음"이 이렇게 중요해졌을까? 그 답을 찾으려면 2020년부터 2026년까지, 프롬프트라는 것이 무엇으로 진화해왔는지를 되짚어야 한다. 이 글의 목적이다.

이 글은 세 가지를 약속한다.

6세대 진화 맵 — 한 줄 지시에서 "오픈소스 팀"까지
실제 프롬프트 원문 발췌 — gstack과 ECC의 SKILL.md·ETHOS.md에서 직접
당신이 오늘 저녁 시작할 수 있는 7단계 — 나만의 stack 만들기

제1장: 프롬프트 진화 6세대 지도

한 줄 프롬프트 → Few-shot → 페르소나 → 플레이북 → 오케스트레이션 → 오픈소스 조직으로 이어지는 6단계 타임라인

"프롬프트"라는 단어는 6년 동안 의미가 계속 바뀌어왔다.

Gen 1 · 2020

한 줄 지시: "에세이 써줘." GPT-3 playground의 원형. 입력과 출력의 1:1 매핑.

Gen 2 · 2022

Few-shot + CoT: 예시 몇 개와 "단계별로 생각해보자" 한 문장. 구글 Wei 외의 Chain-of-Thought 논문이 표준화.

Gen 3 · 2023

페르소나·시스템 프롬프트: "너는 ○○ 전문가다." 역할 기반 프레이밍이 ChatGPT UI에 탑재되며 대중화.

Gen 4 · 2024

플레이북(Playbook): 단일 프롬프트에 보이스·형식·금지어·자가 검사를 내장한 긴 문서. Anthropic이 "Projects"와 "Custom Instructions" UI를 공개.

Gen 5 · 2025

오케스트레이션: Claude Code의 Agent SDK·Skills·Subagents. 슬래시 커맨드로 여러 역할·도구를 라우팅. MCP가 외부 시스템 연결을 표준화.

Gen 6 · 2026

오픈소스 운영체계: gstack, ECC처럼 한 조직의 철학·보이스·테스트·스킬이 통째로 레포로 배포되는 시대. 프롬프트가 인프라가 됨.

각 세대 사이에는 단순한 규모의 차이가 아니라 "무엇을 적어야 하는가"에 대한 관점의 전환이 있다. 이것을 한 표로 압축한다.

세대	적어야 하는 것	단위	유지보수 주체
Gen 1	원하는 결과 한 줄	문장	없음
Gen 2	예시 + "단계별로"	문단	개인 메모
Gen 3	역할 + 제약 + 출력 형식	시스템 프롬프트	개인 즐겨찾기
Gen 4	보이스 + 금지어 + 자가 검증 체크	플레이북 문서	팀 공유 문서
Gen 5	여러 역할의 라우팅 규칙 + 도구 접근권	스킬 + 슬래시 커맨드	팀 레포
Gen 6	조직 철학 + 테스트 + 메모리 + 보안 + 훅	전체 운영체계(OS)	오픈소스 커뮤니티

프롬프트가 단위를 바꿔왔다는 점이 결정적이다. 문장 → 문단 → 문서 → 레포. 코드가 변수에서 함수, 클래스, 모듈, 라이브러리, 프레임워크로 진화한 것과 정확히 같은 궤적을 30년 만에 압축한 셈이다.

제2장: gstack 해부 — "23명의 전문가가 내 안에 산다"

CEO·엔지니어·디자이너·QA·보안·배포 담당 로봇들이 슬래시 커맨드 말풍선과 함께 인간 조율자 주변에 배치된 장면

Garry Tan은 gstack을 이렇게 설명한다.

"Claude Code를 가상 엔지니어링 팀으로 바꾼다. 제품을 재검토하는 CEO, 아키텍처를 잠그는 eng manager, AI-slop을 잡는 디자이너, 프로덕션 버그를 찾는 reviewer, 실제 브라우저를 여는 QA 리드, OWASP·STRIDE 감사를 돌리는 보안 담당자, PR을 보내는 릴리스 엔지니어. 스물세 명의 전문가와 여덟 개의 파워 툴, 전부 슬래시 커맨드, 전부 마크다운, 전부 무료, MIT 라이선스."

파일 구조: 마크다운이 곧 직군이다

gstack/
├── plan-ceo-review/SKILL.md       # CEO 모드 전략 검토
├── plan-eng-review/SKILL.md        # 엔지니어링 매니저 아키텍처 리뷰
├── design-review/SKILL.md          # 디자이너 QA
├── investigate/SKILL.md            # 디버깅 4단계 프로토콜
├── qa/SKILL.md                     # 실제 브라우저 QA
├── cso/SKILL.md                    # 보안 감사 (OWASP+STRIDE)
├── ship/SKILL.md                   # 릴리스 파이프라인
├── review/SKILL.md                 # 코드 리뷰
├── office-hours/SKILL.md           # YC 오피스 아워 모드
└── ETHOS.md                        # 모든 스킬에 주입되는 철학

각 디렉터리의 SKILL.md가 하나의 전문가다. 사용자는 /plan-ceo-review라고 치면 Claude Code가 그 파일을 로드해 CEO 페르소나 + 사전 체크 스크립트 + 질문 포맷 + 자가 검증 규칙을 전부 내재화한 상태로 대응한다.

ETHOS.md: 23명의 전문가에게 공통 주입되는 "세계관"

gstack의 정체성을 가장 잘 보여주는 파일이 ETHOS.md다. 모든 스킬의 프리앰블(preamble)에 자동 주입된다. 핵심 원칙을 원문 그대로 발췌한다.

ETHOS.md — Boil the Lake (원문 발췌)

"AI-assisted coding makes the marginal cost of completeness near-zero. When the complete implementation costs minutes more than the shortcut — do the complete thing. Every time.

Lake vs. ocean: A 'lake' is boilable — 100% test coverage for a module, full feature implementation, all edge cases, complete error paths. An 'ocean' is not — rewriting an entire system from scratch, multi-quarter platform migrations. Boil lakes. Flag oceans as out of scope.

Anti-patterns:
- 'Choose B — it covers 90% with less code.' (If A is 70 lines more, choose A.)
- 'Let's defer tests to a follow-up PR.' (Tests are the cheapest lake to boil.)
- 'This would take 2 weeks.' (Say: '2 weeks human / ~1 hour AI-assisted.')"

이 한 페이지가 gstack 전체 23개 커맨드의 판단 기준이 된다. 예를 들어 /plan-ceo-review가 옵션 A(완전판)와 옵션 B(단축판)를 비교할 때, Completeness: 10/10 vs Completeness: 7/10 같은 점수를 붙이고 자동으로 완전판을 추천한다. "호수냐 바다냐"라는 비유 하나가 수십 번의 의사결정을 일관되게 정렬한다.

Voice: 언어까지 표준화한다

gstack의 스킬들은 말투까지 지정한다. plan-ceo-review/SKILL.md의 Voice 섹션 원문.

gstack Voice 원칙 (원문 발췌)

"Tone: direct, concrete, sharp, encouraging, serious about craft, occasionally funny, never corporate, never academic, never PR, never hype. Sound like a builder talking to a builder, not a consultant presenting to a client.

Writing rules:
- No em dashes. Use commas, periods, or '...' instead.
- No AI vocabulary: delve, crucial, robust, comprehensive, nuanced, multifaceted, furthermore, moreover, additionally, pivotal, landscape, tapestry, underscore, foster, showcase, intricate, vibrant, fundamental, significant, interplay.
- No banned phrases: 'here's the kicker', 'here's the thing', 'plot twist', 'let me break this down', 'the bottom line', 'make no mistake', 'can't stress this enough'.
- Short paragraphs. Mix one-sentence paragraphs with 2-3 sentence runs.
- Name specifics. Real file names, real function names, real numbers.
- End with what to do. Give the action.

Example of the right voice: 'auth.ts:47 returns undefined when the session cookie expires. Your users hit a white screen. Fix: add a null check and redirect to /login. Two lines. Want me to fix it?'

Not: 'I've identified a potential issue in the authentication flow that may cause problems for some users under certain conditions. Let me explain the approach I'd recommend...'"

이 발췌만 봐도 Gen 3(페르소나)와 Gen 4(플레이북)의 차이가 선명해진다. "너는 전문가다"로 끝났던 역할 설정이, "이런 단어는 금지, 이런 예시가 맞는 톤"까지 구조화된 공학적 제약으로 진화했다.

AskUserQuestion 포맷: 질문조차 템플릿화한다

gstack의 가장 혁신적인 부분은 사용자 질문의 포맷 자체를 규격화한 것이다.

AskUserQuestion Self-check (원문 발췌)

"Before calling AskUserQuestion, verify:
- [ ] D<N> header present
- [ ] ELI10 paragraph present (stakes line too)
- [ ] Recommendation line present with concrete reason
- [ ] Completeness scored (coverage) OR kind-note present (kind)
- [ ] Every option has ≥2 ✅ and ≥1 ❌, each ≥40 chars (or hard-stop escape)
- [ ] (recommended) label on one option
- [ ] Net line closes the decision
- [ ] You are calling the tool, not writing prose

If you'd need to read the source to understand your own explanation, it's too complex — simplify before emitting."

이것이 Gen 6의 핵심이다. AI가 사용자에게 질문을 던지는 순간조차 공학적으로 설계된다. 옵션마다 장점 2개·단점 1개 최소 40자, 완전성 점수, 추천 라인, 최종 판정 한 줄. 맥킨지 컨설턴트가 고객 미팅 전 체크리스트로 쓸 법한 품질 게이트가 매 대화에 자동 적용된다.

제3장: everything-claude-code 해부 — "156개 스킬을 통치하는 SOUL과 RULES"

곡선형 도서관 서가에 프론트엔드·보안·아티클쓰기 같은 스킬 책들이 정렬되고, 사람이 툴벨트에 스킬을 로드하는 장면

ECC의 스케일은 gstack의 한 자릿수 위에 있다.

Agents 38개 — 언어별 리뷰어·리졸버

Skills 156개 — 도메인·패턴·베스트 프랙티스

Commands 72개 — 슬래시 커맨드

Language Ecosystems 12개 — TS·Python·Go·Java·Kotlin·C++·Rust·Perl…

SOUL.md: 정체성의 원소스

ECC의 루트에는 SOUL.md라는 파일이 있다. "이 플러그인이 누구인가"를 선언한다. 원문.

SOUL.md — Core Principles (원문 발췌)

"Core Principles
1. Agent-First — route work to the right specialist as early as possible.
2. Test-Driven — write or refresh tests before trusting implementation changes.
3. Security-First — validate inputs, protect secrets, and keep safe defaults.
4. Immutability — prefer explicit state transitions over mutation.
5. Plan Before Execute — complex changes should be broken into deliberate phases."

이 다섯 줄이 156개 스킬 전체의 행동 헌장이다.

RULES.md: 선언된 금칙

RULES.md — Must Always / Must Never (원문 발췌)

"Must Always
- Delegate to specialized agents for domain tasks.
- Write tests before implementation and verify critical paths.
- Validate inputs and keep security checks intact.
- Prefer immutable updates over mutating shared state.
- Follow established repository patterns before inventing new ones.

Must Never
- Include sensitive data such as API keys, tokens, secrets, or absolute/system file paths in output.
- Submit untested changes.
- Bypass security checks or validation hooks.
- Duplicate existing functionality without a clear reason.
- Ship code without checking the relevant test suite."

흥미로운 점은 이 규칙들이 "에이전트가 어기면 차단되는 가드레일"로 기능한다는 사실이다. ECC는 실제로 훅(hook)을 통해 출력을 검사하고, Must Never 항목이 포함되면 세션을 중단시킨다. 프롬프트가 정책 엔진이 된 것이다.

article-writing 스킬: 문화까지 프롬프트화한다

ECC의 156개 스킬 중 article-writing은 이 책을 쓰는 방식 자체에 영감을 줬다. 원문을 그대로 인용한다.

.agents/skills/article-writing/SKILL.md (원문 발췌)

"Core Rules
1. Lead with the concrete thing: artifact, example, output, anecdote, number, screenshot, or code.
2. Explain after the example, not before.
3. Keep sentences tight unless the source voice is intentionally expansive.
4. Use proof instead of adjectives.
5. Never invent facts, credibility, or customer evidence.

Banned Patterns
- 'In today's rapidly evolving landscape'
- 'game-changer', 'cutting-edge', 'revolutionary'
- 'here's why this matters' as a standalone bridge
- fake vulnerability arcs
- a closing question added only to juice engagement
- biography padding that does not move the argument
- generic AI throat-clearing that delays the point"

이 스킬 하나로 ECC를 쓰는 모든 사용자의 글은 "Lead with proof, not adjectives" 라는 공통 DNA를 갖게 된다. 브랜드 가이드가 프롬프트가 되고, 프롬프트가 문화가 된다.

identity.json: 프롬프트에 자료구조가 생기다

ECC에서 특히 새로운 것은 프롬프트가 JSON 스키마로도 존재한다는 점이다.

.claude/identity.json (원문 발췌)

{
  "version": "2.0",
  "technicalLevel": "technical",
  "preferredStyle": {
    "verbosity": "minimal",
    "codeComments": true,
    "explanations": true
  },
  "domains": ["javascript"],
  "suggestedBy": "ecc-tools-repo-analysis"
}

사용자의 취향, 기술 수준, 도메인이 구조화 데이터로 저장된다. 프롬프트가 사람이 읽는 문서일 뿐 아니라 다른 프로그램이 읽고 쓰는 데이터가 되는 전환점이다. 이것이 Gen 6와 Gen 5의 차이를 가장 선명하게 보여준다.

제4장: 두 레포의 공통 DNA — Gen 6 프롬프트의 6가지 공학 속성

스티키 노트가 트리 구조의 조직도를 거쳐 여러 층으로 나뉜 건물 단면으로 변신하는 일러스트

gstack과 ECC는 스타일이 다르다(한쪽은 YC CEO의 목소리, 다른 쪽은 해커톤 우승자의 엔지니어링). 그러나 여섯 가지 공통 속성을 공유한다. 이 속성들이 Gen 6 프롬프트가 Gen 5 프롬프트와 다른 이유다.

Gen 6 프롬프트의 6가지 공학 속성

① 철학 선언 ETHOS.md / SOUL.md — 모든 의사결정의 기준이 되는 세계관을 명시. Boil the Lake, Agent-First, Security-First.

② 역할 모듈화 하나의 역할 = 하나의 파일. CEO/Eng/Design/QA가 독립 SKILL.md로 분리되고 슬래시 커맨드로 호출.

③ 보이스 표준화 금지 단어 리스트 + 예시 문장 + 길이 규칙. "AI 티 안 나게 쓰는 법"이 공학화됐다.

④ 자가 검증 체크 AskUserQuestion self-check, Quality Gate. 출력을 내보내기 전 스스로 N개 항목을 점검.

⑤ 가드레일과 훅 Must Never 규칙 + 훅으로 실행을 중단시킴. 프롬프트가 정책 엔진으로 동작.

⑥ 메모리·세션 영속 ~/.gstack/sessions, .claude/homunculus/instincts. 대화 한 번으로 끝나지 않고 세션 간 학습이 누적.

⁺ 공개·재사용 가능 MIT 라이선스로 GitHub 공개. 레포를 포크하면 하루 안에 자기 팀에 이식.

제5장: 왜 2026년인가 — 인프라 준비도 곡선

친절한 과학자가 작은 호수를 끓이는 성공 장면과 바다 앞에서 작은 주전자로 당황한 실패 장면의 대조

"왜 이런 프롬프트 레포가 2024년이 아닌 2026년에 터졌는가"라는 질문에는 분명한 답이 있다. 세 가지 기반 기술이 동시에 준비됐기 때문이다.

🧠

(A) 모델 품질의 임계점 돌파

2025년 말 Claude Opus 4.7, GPT-5, Gemini 3가 긴 시스템 프롬프트(10K토큰 이상)를 안정적으로 추종. "복잡한 역할 기술서"를 제대로 지킬 수 있게 됐다.

🔌

(B) MCP와 슬래시 커맨드의 표준화

2024년 11월 Anthropic의 MCP 공개 + Claude Code의 Skills·Subagents 정식 지원. 프롬프트가 외부 도구를 다룰 수 있는 연결 표준이 완성.

🌍

Garry Tan, Peter Steinberger(OpenClaw 24.7만 스타), Affaan Mustafa. 모두 "내 개인 워크플로를 MIT로 푼다"는 패턴을 따름. 개인 기술이 곧장 공공재가 되는 순간.

이 세 조건이 충족되지 않은 2024년에는 gstack도 ECC도 이만큼 유용할 수 없었을 것이다. 2026년은 "프롬프트가 소프트웨어의 한 형태"로 정식 데뷔한 해다.

제6장: 실무자 가이드 — 오늘 저녁 시작하는 나만의 stack 7단계

7단계 체크리스트가 스케치로 그려진 공책을 펼쳐둔 따뜻한 책상 장면

gstack과 ECC가 너무 커 보일 수 있다. 그러나 두 레포 모두 작은 SKILL.md 하나로 시작됐다. 아래 7단계로 오늘 저녁부터 시작할 수 있다.

나만의 stack 만들기 — 7단계

① 내 워크플로 감사 최근 2주간 AI에게 반복한 요청 10개를 기록. 3번 이상 반복된 패턴이 스킬 후보.

② 가장 자주 쓰는 1개부터 문서화 가령 /code-review. 목적, 입력, 출력 형식, 금지 사항, 예시를 한 마크다운 파일에.

③ ETHOS 선언 추가 "나는 어떤 품질을 지향하는가" 3~5개 원칙. 이것이 모든 스킬에 주입되는 DNA.

④ 평가 루프 설계 출력 직전 self-check 체크리스트 추가. "X·Y·Z 조건을 만족했는지 스스로 확인하라."

⑤ 가드레일 한 줄 Must Never 규칙 하나라도 명시. "API 키 출력 금지", "검증되지 않은 데이터 언급 금지" 등.

⑥ 두 번째 스킬 추가 /plan-review 같은 상호 보완 역할. 둘 사이 호출 관계(라우팅)를 문서화.

⑦ GitHub 공개 MIT 또는 CC0. 다른 사람이 포크·개선할 수 있게 오픈. 피드백이 당신의 프롬프트를 성장시킨다.

이 7단계는 gstack 자체의 역사를 압축한 것이다. Garry Tan도 2024년 말 단일 /review 커맨드에서 시작했다. 지금 23개가 된 경로가 그대로 남아 있다.

제7장: 한계와 반론 — Gen 6의 그림자

프롬프트 인프라화에는 분명한 그림자도 있다. 정직하게 짚는다.

우려	현실과 완화책
프롬프트 인플레이션 — 모든 커맨드에 수십 줄 프리앰블	모델의 컨텍스트 길이가 이미 200K~1M 수준. 비용은 캐싱으로 해결됨. 실제 병목은 사람이 기억해야 할 커맨드 수.
LOC 논쟁 — "AI가 쓴 줄 수는 부풀려진다"	Garry Tan은 'ON_THE_LOC_CONTROVERSY.md'에서 논리적 코드 변경량(logical LOC)으로 재측정해 여전히 2013년 대비 810× 생산성을 보인다고 방어.
의존성 위험 — 남의 ETHOS를 그대로 쓰면 남의 취향이 내 결과물에	피할 수 없는 트레이드오프. 포크한 뒤 30% 이상은 자기 손으로 다듬는 것을 권장. 보이스 특히 민감.
보안·프라이버시 — 스킬이 실행 권한을 갖는다	ECC가 AgentShield와 1,282개 보안 테스트로 대응. gstack은 /careful·/freeze·/guard로 디렉터리 잠금.
페르소나의 함정 — USC PRISM이 보여줬듯 전문가 페르소나가 정확도를 낮출 수 있음	gstack·ECC는 페르소나를 "관점 이동용"으로만 쓰고 사실 회상은 별도 도구(MCP·WebSearch)에 위임. 두 논문 결과와 일관.

마무리: 프롬프트가 코드가 된 순간, 개발은 다시 정의됐다

2020년 GPT-3 플레이그라운드 시절, 프롬프트는 "호기심을 채우는 한 줄"이었다. 2022년엔 "추론을 깨우는 주문"이 됐다. 2023년에 "역할 주입", 2024년에 "플레이북 문서", 2025년에 "스킬·에이전트 오케스트레이션". 2026년, 드디어 "조직의 세계관·규칙·도구·기억이 통째로 담긴 오픈소스 운영체계"가 됐다.

이 여정을 한 줄로 요약하면 이렇다.

프롬프트는 문장에서 시작해, 팀이 됐다.

Garry Tan의 gstack과 Affaan Mustafa의 ECC는 그 팀이 어떤 모습인지 보여주는 두 개의 명확한 사례다. 둘 다 마크다운과 JSON 몇 개로 구성돼 있다. 둘 다 MIT 라이선스다. 둘 다 한 사람의 개인 워크플로에서 시작해 수만 명의 표준이 되어가고 있다.

그리고 그것은 당신의 워크플로에도 해당된다. 당신이 어제 AI에게 요청한 그 작업, 이번 주 세 번 반복한 그 패턴, 동료에게 "이렇게 쓰면 되는데"라고 설명한 그 방법. 그것이 당신의 첫 번째 SKILL.md다.

오늘 저녁, 빈 마크다운 파일 하나를 열어보라. 맨 위에 이렇게 쓰면 된다.

hljs language-markdown

---
name: my-first-skill
description: [당신이 가장 자주 반복하는 AI 요청]
---

# When to activate
...

# Core rules
...

# Quality gate
...

그 파일이 내일의 당신을 가장 빠르게 확장시킬 인프라의 씨앗이다.

더 읽어볼 자료

gstack (Garry Tan): github.com/garrytan/gstack — README, ETHOS.md, plan-ceo-review/SKILL.md
Everything Claude Code (Affaan Mustafa): github.com/affaan-m/everything-claude-code — SOUL.md, RULES.md, article-writing SKILL.md
OpenClaw (Peter Steinberger): github.com/openclaw/openclaw — 24.7만 스타 돌파, Karpathy가 언급한 솔로 빌더 레퍼런스
Boil the Lake 에세이: garryslist.org/posts/boil-the-ocean
Karpathy, vibe coding 원 트윗: twitter.com/karpathy/status/1886192184808149383
Anthropic, MCP: anthropic.com/news/model-context-protocol
코어닷투데이 관련 특집:

특집2026.04.07