#AI 에이전트
27개의 포스트

비밀은 모델이 아니라 마크다운이었다 — Anthropic은 어떻게 데이터 분석의 95%를 Claude에게 맡겼나
Anthropic이 사내 비즈니스 분석 쿼리의 95%를 Claude로 자동화하고 정확도 ~95%를 달성한 방법을 공개했다. 스킬 없이는 21%였던 정확도가 어떻게 95~99%가 되었는가 — 60년 Text-to-SQL의 역사, 30년 셀프서비스 BI의 좌절부터 4계층 에이전틱 분석 스택, ablation 방법론, 업계 비교, 실무 적용 가이드까지 완전 해부한다.

Claude Cowork 완전 정복 — '답하는 AI'에서 '일을 끝내주는 AI'로
Anthropic의 공식 Claude Cowork 제품 가이드(2026년 6월)를 깊이 읽고 풀어냈습니다. 챗봇은 왜 '답변'에서 멈췄는지, ReAct·Toolformer·MCP·Computer Use로 이어진 4년의 연구가 어떻게 '일을 끝내주는 AI'로 수렴했는지 — 그리고 주간 보고 90분 중 80분을 잡아먹던 '찾는 시간'이 사라지는 7가지 실전 사례까지. 인터랙티브 데모와 함께 정리한 특집입니다.

하니스(Harness) — AI가 스스로 일하는 방식을 설계하다
모델은 같은데 왜 어떤 AI는 50개 작업 중 20개에서 멈추고, 어떤 AI는 6일 만에 Bun을 통째로 다시 쓸까? 답은 '하니스(harness)'에 있습니다. ReAct에서 동적 워크플로우까지 — 모델을 둘러싼 골격이 어떻게 진화해 왔는지, 왜 지금 화제인지를 논문과 사례로 쉽게 풀어드립니다.

HTML의 비합리적인 효과 — 왜 Claude Code는 Markdown을 버리고 HTML로 갔나
Anthropic Claude Code 팀의 글 한 편이 X에서 800만 뷰를 찍으며 'Markdown은 끝났는가'라는 논쟁에 불을 붙였습니다. 제목의 계보(Wigner의 수학 → Halevy의 데이터 → 2026의 HTML)부터, 왜 에이전트 시대에 Markdown이 족쇄가 됐는지, 왜 LLM은 HTML을 '비합리적으로' 잘 만드는지, 그리고 그대로 써먹는 5가지 프롬프트까지 — 인터랙티브 데모와 일러스트로 쉽게 풀었습니다.

Computer Use와 자동화 — 코드 자동완성에서 디지털 동료로 (Codex Use Cases 특집 6·완결)
Codex가 책상에 앉았다. Cua Driver가 만든 멀티 커서 백그라운드, 받은 편지함 정리, /goal로 지속되는 장기 목표, Verified Operations, Skills로 절차 영구화까지 — Codex Use Cases 특집 시리즈를 닫는 마지막 편. 코드 자동완성이 어떻게 디지털 동료가 됐는지의 완결.

Codex의 탄생 — HumanEval에서 Computer Use까지 (Codex Use Cases 특집 1)
코드 자동완성에서 '내 컴퓨터로 일을 끝내는 에이전트'가 되기까지 — Codex의 5년 역사와 벤치마크, 4-표면 아키텍처, 에이전틱 루프를 비유와 사례로 쉽게 풉니다. Codex Use Cases 특집 1편.

당신의 스타트업은 이미 죽어 있을지 모른다: AI 시대 창업 플레이북의 재작성
Steve Blank의 2026년 글 'Your Startup Is Probably Dead On Arrival'을 출발점으로, 왜 기존 스타트업 공식이 AI 시대에 흔들리는지 역사와 사례, 논문, 실무 체크리스트로 풀어낸다. 고객개발, MVP, 제품시장적합성, 애자일, VC 조달, AI 에이전트, 결과 기반 가격 모델까지 연결해 2026년 창업자가 반드시 다시 물어야 할 질문을 정리한다.

바이브코딩 특집: 30분 만에 환자 데이터가 열린 이유
바이브코딩은 소프트웨어 개발의 장벽을 낮춘 혁명인가, 아니면 무지한 배포를 가속하는 위험한 유행인가. Tobias Brunner가 공개한 환자 관리 시스템 사고를 출발점으로, Copilot에서 Codex·Claude Code까지 이어진 AI 코딩의 역사, 최신 논문들이 말하는 장점과 위험, 그리고 실무자가 반드시 지켜야 할 안전 경계를 깊이 있게 정리한다.

Ultraplan 완전 가이드 — AI 코딩 에이전트는 어떻게 '생각'하는가
Claude Code의 Ultraplan은 3개의 독립 탐색 에이전트와 1개의 비평 에이전트가 협업하여 최적의 구현 계획을 만드는 클라우드 기반 멀티 에이전트 아키텍처입니다. 단일 에이전트의 앵커링 바이어스를 극복하고, 더 다양하고 견고한 계획을 생성합니다. 이 글에서는 AI 계획 수립의 역사부터 Ultraplan의 핵심 아키텍처, 실전 활용법까지 풍부한 사례와 함께 깊이 있게 다룹니다.

Zep 논문 해부: AI 에이전트에게 '시간을 아는 기억'을 선물하다
AI 에이전트가 어제 대화를 기억하지 못한다면? Zep은 시간 인식 지식 그래프(Temporal Knowledge Graph)로 이 문제를 해결한다. 3계층 그래프 구조, 이중 시간축 모델, 동적 엣지 무효화 — MemGPT를 넘어 LongMemEval에서 18.5% 정확도 향상과 90% 레이턴시 감소를 달성한 Zep의 핵심을 완전 해부한다.

컨텍스트 엔지니어링 완전 정복: 프롬프트의 시대는 끝났다
프롬프트 한 줄로 AI를 다루던 시대가 저물고 있다. 2026년, AI 에이전트 시대의 핵심 역량은 '컨텍스트 엔지니어링'이다. 역사적 배경부터 핵심 개념, 실전 사례까지 — Anthropic의 가이드를 바탕으로 완전 해부한다.

지금 AI에서 가장 중요한 5가지 아이디어 — 2026년, 세상이 바뀌는 원리를 해부하다
AlphaGo Zero의 자기 대국부터 카르파시의 Autoresearch, 바이브 코딩의 탄생, 70만 명의 숨은 AI 훈련사까지 — 2026년 AI를 관통하는 5가지 핵심 아이디어를 역사·논문·사례로 깊이 파고듭니다. 왜 이 개념들이 중요한지, 그리고 이들이 서로 만나면 무슨 일이 벌어지는지.