프롤로그: 변호사 한 명이 5,000달러 벌금을 낸 이유
2023년 6월 22일, 미국 뉴욕 남부지방법원의 케빈 캐스텔(P. Kevin Castel) 판사는 한 변호사에게 5,000달러의 벌금을 부과했다.
피고는 평범한 30년 경력의 베테랑 변호사 스티븐 슈와르츠(Steven Schwartz). 그가 한 일은 단순했다. 의뢰인 로베르토 마타(Roberto Mata)가 아비앙카(Avianca) 항공사를 상대로 낸 인신상해 소송에서, 항공사 측의 각하 신청에 반박하는 서면을 ChatGPT를 활용해 작성했다. 그리고 거기에는 6건의 판례가 인용되어 있었다.
- Varghese v. China Southern Airlines
- Shaboon v. Egypt Air
- Petersen v. Iran Air
- Martinez v. Delta Airlines
- Estate of Durden v. KLM
- Miller v. United Airlines
그런데 항공사 측 변호인이 "이런 판례를 찾을 수 없다"고 답신을 보냈다. 판사가 직접 Westlaw와 Lexis를 뒤졌지만 결과는 같았다. 여섯 건 모두 존재하지 않는 판례였다. ChatGPT가 통계적으로 "있을 법한" 판례명, 인용번호, 심지어 판결문 발췌까지 그럴듯하게 만들어 낸 것이다.
법조계는 충격에 빠졌다. 캐스텔 판사는 판결문에 이렇게 적었다.
"기술 발전은 일상이며, 신뢰할 수 있는 인공지능 도구를 사용하는 것 자체에 본질적으로 부적절한 점은 없다. 그러나 변호사는 자신의 제출물의 정확성을 보장할 게이트키퍼 역할을 유지해야 한다."
이 사건은 Mata v. Avianca라는 이름으로, 변호사 시험 윤리 문항과 미국 변호사 협회 가이드라인, 그리고 전 세계 법학 교과서에 등장하는 AI 환각(hallucination) 사례의 전범이 되었다.

그로부터 약 3년 뒤인 2026년 5월 12일, Anthropic은 한 가지 발표를 했다. 발표 제목은 단순했다 — "Claude for the Legal Industry".
이 발표는 2023년 슈와르츠 변호사를 무너뜨린 바로 그 문제 — 환각, 신뢰성, 검증 가능성 — 을 정면으로 겨냥한, 그리고 동시에 법률 산업 자체를 AI 시대로 끌어올리기 위한, 매우 야심 찬 청사진이다.
이 글은 그 청사진을 한국 독자가 가장 쉽고 깊게 이해할 수 있도록 풀어낸 특집이다. 단순한 보도 요약이 아니라 — 왜 이 일이 지금 일어났는지, 어떤 기술적 토대 위에서 가능해졌는지, 그리고 2026년 우리가 살아가는 시대에 이것이 무엇을 의미하는지를 다룬다.
1장. 2026년 5월 12일, 무엇이 발표되었는가
먼저 발표의 핵심을 한눈에 정리해 보자.
20+
MCP 커넥터
계약 관리·문서 관리·전자발견·법률 조사를 Claude에 직접 연결
12
실무 영역 플러그인
M&A, 고용, 개인정보, IP, 소송 등 분야별 패키지
90.9%
BigLaw Bench
Claude Opus 4.7이 Harvey 벤치마크에서 기록한 모델 최고점
~500%
Freshfields 사용량
파트너십 첫 6주 만에 늘어난 Claude 활용도
발표 내용은 크게 네 축으로 정리할 수 있다.
Claude for Legal
법률 산업 통합 AI 플랫폼
① MCP 커넥터
DocuSign · Ironclad · iManage · Relativity · Westlaw · Harvey 등 20개 이상 직접 연결
② 12개 플러그인
Commercial · Corporate · Employment · Privacy · Product · Regulatory · IP · Litigation · AI Governance · Law Student · Legal Clinic · Builder Hub
③ Office 365 통합
Word · Outlook · Excel · PowerPoint 안에서 동일한 맥락 유지
④ 접근성 프로그램
Free Law Project · Justice Tech Association · Courtroom5와 연계, 비영리 무료/할인 제공
Anthropic은 이 발표가 단순한 신제품 출시가 아니라 "법률 산업의 운영 방식 자체를 재정의하는 시도"라고 못 박았다.
특히 주목할 만한 통계가 하나 있다. Anthropic의 법률 부문 책임자 마크 파이크(Mark Pike)는 이렇게 밝혔다.
"Claude Cowork에서 법률은 1순위 파워유저 직군이 되었습니다. 다른 어떤 직군보다 3배 이상의 사용량을 기록했죠. 4월 'How Legal Teams Put Claude to Work' 웨비나에는 2만 명이 등록했습니다. 우리가 진행한 법률 세션 중 역대 최대 규모였습니다."
법무는 더 이상 AI를 두려워하는 직군이 아니다. 가장 적극적으로 사용하는 직군이다. 그렇다면 왜 하필 법률인가?
2장. 왜 법률이 'AI의 첫 산업 운영체제'가 되는가
법률이라는 직업의 비밀
대중의 이미지 속 변호사는 "법정에서 격렬한 변론을 하는 사람"이지만, 실제 변호사가 가장 많은 시간을 쓰는 일은 읽기·쓰기·찾기다.
- 100쪽 짜리 인수합병(M&A) 계약서를 검토하고 위험 조항을 빨갛게 표시(redline)한다.
- 상대방이 제출한 1만 건의 이메일에서 핵심 증거를 추려낸다(전자발견, e-discovery).
- 회사 내부 NDA 표준 양식을 거래마다 살짝 수정해 보낸다.
- 30년 치 판례에서 우리 사건과 가장 가까운 사례를 찾아 메모를 쓴다.
이 모든 작업은 정확히 언어 모델(LLM)이 가장 잘하는 일 — 긴 문서를 읽고, 패턴을 찾고, 재구성하고, 인용을 만드는 일 — 과 일치한다.
핵심 통찰: 법률은 "텍스트가 곧 자산"인 산업이다. 회계가 숫자로, 의료가 데이터로 일한다면, 법률은 단어 하나하나로 일한다. 그래서 LLM의 폭발적 발전이 가장 빠르게 가치를 만드는 분야가 되었다.
6가지 구조적 이유
법률 산업이 AI의 첫 본격 산업이 된 이유를 정리하면 다음과 같다.
여섯 가지 모두가 LLM 기술의 약점과 정확히 맞물린다. 텍스트 의존도와 반복 업무 비율은 AI의 잠재력을 키우는 요소이지만, 정확성 요구와 보안 민감도는 함부로 풀 수 없는 족쇄다. 결국 잠재 효용은 크지만 신뢰성 장벽이 압도적으로 높은 시장이라는 뜻이다.
이 양쪽을 동시에 풀어낸 회사가 시장을 가져간다. Anthropic이 "법률"을 첫 번째 산업 OS로 노린 이유가 여기에 있다.
3장. 역사: 법률 AI의 3년 진화사
리걸테크에 관심이 없던 독자도 따라올 수 있도록, 핵심 사건만 짧고 굵게 정리해 본다.
2022.11
ChatGPT 등장
변호사들이 처음으로 "AI에게 법률 질문을 던지는" 경험을 함. 사내에서 비공식 사용 폭증.
2023.06
Mata v. Avianca 사건
변호사가 ChatGPT 환각 판례를 그대로 인용해 \$5,000 벌금. 법조계의 'AI 트라우마'가 시작됨.
2023~2024
Harvey, Hebbia, Eve의 부상
"법률 특화 LLM 인터페이스"라는 카테고리가 형성. AmLaw 100 로펌 ⅔가 Harvey를 도입.
2024.11
Anthropic, MCP 공개
AI를 외부 시스템에 연결하는 개방 표준 'Model Context Protocol' 발표. AI의 USB-C 시대 시작.
2025.03
OpenAI도 MCP 채택
경쟁사인 OpenAI가 MCP를 공식 채택. AI 생태계의 사실상 표준으로 굳어짐.
2025.10
Agent Skills 출시
"조직 지식을 폴더에 담아 AI에게 가르치는" 새로운 패러다임. 컨텍스트 엔지니어링의 결정판.
2026.01
Claude Cowork 출시
개발자가 아닌 일반 지식 노동자용 AI 동료. 출시 1주일 만에 SaaS 시총 \$285B 증발(SaaSpocalypse).
2026.05.12
Claude for Legal 출시
12개 플러그인 + 20개 MCP 커넥터 + Office 통합. 법률을 첫 본격 산업 OS로 선포.
이 3년 동안 두 개의 큰 흐름이 충돌했다.
흐름 ① — 법률 특화 스타트업 ("위에서 아래로")
Harvey, Hebbia, Legora, Eve, Spellbook
Westlaw·Lexis 데이터 위에 자체 UI 구축
"변호사를 위한 ChatGPT" 포지셔닝
Harvey 평가액 \$11B (2026.03 기준)
흐름 ② — 빅테크 기반 모델사 ("아래에서 위로")
OpenAI, Anthropic, Google
범용 모델을 산업에 직접 침투시키려는 전략
"산업 OS" 포지셔닝
Anthropic 평가액 \$900B (2026.05 기준)
Harvey의 CEO 윈스턴 와인버그(Winston Weinberg)는 발표 당일 인터뷰에서 이를 정확히 짚었다.
"Gabe와 저는 몇 년 전부터 말해왔습니다. 장기적으로는 우리가 모델 회사들과 경쟁하게 될 거라고."
그러면서도 그는 자사의 차별점을 강조했다. 법률 특화성과 채택 지원 — 변호사들이 실제로 쓰게 만드는 노하우다. 한편 Anthropic은 정반대 전략을 택했다. 그들의 무기는 모델 자체와 MCP·Skills·CLAUDE.md라는 세 개의 인프라 기술이다. 이제 그 세 기술의 정체를 살펴보자.
4장. 핵심 기술 ① — MCP: AI의 USB-C

비유: 충전기와 케이블
10년 전 노트북 가방을 떠올려 보자. 맥북 충전기, 아이폰 라이트닝, 안드로이드 마이크로 USB, 카메라 미니 USB, 외장 하드 USB-A… 들고 다니는 케이블만 5~6개였다.
그런데 USB-C가 등장하면서 모든 게 바뀌었다. 단 하나의 케이블이 모든 기기에 꽂힌다. 노트북도, 스마트폰도, 헤드폰도, 모니터도.
MCP(Model Context Protocol)는 AI 세계의 USB-C다.
지금까지는 AI를 외부 시스템(예: Slack, Notion, GitHub, DocuSign)에 연결하려면 각각의 통합을 따로 만들어야 했다. AI 회사가 N개, 도구 회사가 M개라면 통합은 N × M개가 필요했다. 100개 회사가 100개 도구를 지원하려면 무려 1만 개의 커넥터가 필요한 것이다.
MCP는 이 N × M 문제를 N + M으로 줄였다. AI 회사는 MCP 클라이언트만 만들면 되고, 도구 회사는 MCP 서버만 만들면 된다. 그러면 누가 누구와 연결되든 하나의 표준으로 작동한다.
변호사
→
Claude (MCP 클라이언트)
→
JSON-RPC 2.0
Westlaw MCP 서버
→
19억 건 판례
왜 이게 법률 산업에 결정적인가
전형적인 M&A 거래를 떠올려 보자. 변호사 한 명이 하루에 거치는 시스템은 보통 이렇다.
아침
iManage에서 어제 받은 계약 초안 열기
오전
Word에서 redline (수정 표시) 작업, Westlaw로 판례 검색
오후
Datasite VDR에서 실사 자료 다운로드, Excel로 위험 매트릭스 작성
저녁
DocuSign으로 NDA 발송, Outlook으로 클라이언트에게 요약 메일
밤
PowerPoint로 이사회 보고용 슬라이드 정리
이 모든 시스템 사이를 사람이 복사-붙여넣기로 옮겨다니던 게 지금까지의 변호사 업무였다. MCP는 이 과정을 단번에 바꾼다. Claude가 변호사 대신 각 시스템에 직접 접속해 데이터를 가져오고, 작업하고, 결과를 다시 넣는다.
MCP의 진짜 의미: "AI가 마침내 손과 발을 갖게 됐다." 단순히 똑똑한 챗봇이 아니라, 사내 도구들 사이를 자유롭게 오가며 일하는 디지털 동료가 되었다는 뜻이다.
Claude for Legal에 포함된 20개 이상의 MCP 커넥터를 카테고리별로 정리하면 다음과 같다.
| 카테고리 | 연결되는 시스템 | 변호사 입장에서 의미 |
|---|
| 계약 관리(CLM) | Definely · DocuSign · Ironclad | "Claude야, 우리 표준 NDA 양식과 이 거래 조항을 비교해서 차이점 표시해줘" |
| 문서 관리(DMS) | iManage · NetDocuments | "지난 3년간 우리가 작성한 비슷한 계약서 5건만 찾아서 요약해줘" |
| 전자발견 | Consilio · Everlaw · Relativity | "이 1만 건의 이메일에서 합병 의도가 드러나는 핵심 메시지를 골라줘" |
| 법률 조사 | Legal Data Hunter · Midpage · Trellis | "캘리포니아 주법원에서 비슷한 사건 판결 동향을 보여줘" |
| 데이터룸 | Box · Datasite | "VDR에 있는 모든 자료에서 환경 책임 조항만 모아 분석해줘" |
| AI 보조 | Harvey · Solve Intelligence | "Harvey의 분석 결과와 Claude의 추론을 함께 비교해줘" |
특히 주목할 것은 Thomson Reuters와의 연결이다. Thomson Reuters는 CoCounsel Legal이라는 자체 법률 AI를 운영하면서, 동시에 19억 건의 Westlaw 판례 데이터와 14억 건의 KeyCite 유효성 신호를 보유한 회사다. 이 두 회사가 MCP로 손을 잡았다는 것은 — 변호사가 Claude 안에서 일하다가 필요한 순간 권위 있는 출처에 즉시 접근할 수 있게 됐다는 의미다.
Thomson Reuters의 CTO 조엘 흐론(Joel Hron)은 이렇게 표현했다.
"AI의 미래는 일이 어디서 시작되는가가 아니라, 결과물이 신뢰할 만한가로 정의됩니다. 통제점은 시작 위치가 아니라, 출력이 정확하고, 권위 있는 출처에 근거하며, 방어 가능한지에 있습니다."
5장. 핵심 기술 ② — Agent Skills: AI에게 매뉴얼을 쥐여 주다

"신입 변호사 온보딩"의 비유
대형 로펌에 신입이 입사하면 어떤 일이 일어날까? 첫날 그에게는 두꺼운 사내 매뉴얼이 주어진다. "우리 로펌의 표준 NDA 양식은 이렇게 생겼다", "고용 계약 검토 시 반드시 확인할 12개 체크포인트", "고객 서신은 이런 어조로 작성한다", "redline 색상 규칙은 빨강은 삭제, 파랑은 추가."
이 매뉴얼이 없으면, 아무리 뛰어난 신입이라도 "우리 로펌답게" 일할 수 없다. 모든 회사에는 그 회사만의 암묵지(tacit knowledge) 가 있기 때문이다.
Agent Skills는 정확히 이 매뉴얼을 AI에게 쥐여 주는 기능이다.
Anthropic 공식 블로그에 따르면 Agent Skills는 다음과 같이 정의된다.
"Skills는 에이전트가 동적으로 발견하고 로드할 수 있는, 명령·스크립트·자원이 정리된 폴더입니다. 새 직원에게 온보딩 가이드를 만들어 주는 것과 같죠."
SKILL.md의 구조
Skill은 디렉터리이고, 그 안에 반드시 들어가야 할 것은 단 하나 — SKILL.md 파일이다.
hljs language-yaml
---
name: ma-due-diligence
description: 한국법 기준 M&A 실사 체크리스트와 redline 규칙
---
본 스킬을 사용할 때는 반드시 다음 순서를 따른다:
1. 먼저 `checklist.md`를 읽어 12개 체크포인트를 확인한다
2. 위험 조항이 발견되면 `redline-rules.md`의 색상 규칙을 적용한다
3. 보고서 양식은 `report-template.docx`를 사용한다
4. 한국법 특수 조항은 `kr-clauses.md`를 참고한다
Progressive Disclosure — 단계적 공개
여기서 가장 영리한 설계가 등장한다. Anthropic은 이를 Progressive Disclosure(점진적 공개) 라고 부른다.
1단계 (메타데이터)
시스템 프롬프트에는 SKILL.md의 name과 description만 로드됨. 수백 개 스킬이 있어도 컨텍스트 윈도우는 거의 차지하지 않음.
2단계 (본문)
사용자 요청이 특정 스킬과 관련 있으면 그때서야 SKILL.md 본문 전체를 Bash 도구로 읽어 컨텍스트에 올림.
3단계 (참조 파일)
SKILL.md가 또 다른 파일(checklist.md, kr-clauses.md 등)을 가리키면 그 순간 필요한 파일만 추가로 로드. 잘 정리된 백과사전의 목차 → 챕터 → 부록 같은 구조.
결과: 컨텍스트 윈도우 한계와 무관하게 "사실상 무한한" 조직 지식을 AI에 부여할 수 있다.
이 설계가 왜 혁명적인지 비교해 보자.
| 접근 방식 | 한계 | Agent Skills |
|---|
| Fine-tuning | 매번 모델을 다시 학습해야 함. 비용·시간 큼 | 폴더 추가만 하면 즉시 반영 |
| 단일 거대 시스템 프롬프트 | 컨텍스트 윈도우 압박. 중요 지시가 묻힘 | 필요한 것만 로드 |
| RAG (검색 증강) | 의미 검색이 정확하지 않을 수 있음 | 명시적 트리거(description)로 정확히 호출 |
| 하드코딩된 프롬프트 체인 | 코드 변경이 필요 | 마크다운 파일만 수정 |
법률 산업에서의 진가
Anthropic은 이렇게 설명한다.
"각 플러그인은 팀의 특정 플레이북, 에스컬레이션 체인, 위험 평가, 하우스 스타일을 학습하는 설정 인터뷰로 시작합니다."
번역하자면, 같은 "고용 계약 검토" 작업이라도 — Freshfields 식 스타일과 김앤장 식 스타일은 다르고, 각 로펌의 위험 분류 기준도 다르다. Skills는 이 차이를 각 로펌의 폴더에 담아 둔다. 같은 Claude 모델이지만, Freshfields에서는 Freshfields처럼, 김앤장에서는 김앤장처럼 일한다.
Skills의 진짜 의미: AI를 "범용 천재"에서 "우리 회사를 정확히 아는 동료"로 바꾸는 메커니즘. 그리고 그 변환 비용이 — 마크다운 파일 한 장이다.
6장. 핵심 기술 ③ — CLAUDE.md: 회사의 헌법

가장 작지만 가장 중요한 파일
Claude Code(Anthropic의 코딩 에이전트)와 Claude for Legal 모두에서 핵심적인 역할을 하는 또 하나의 파일이 있다 — CLAUDE.md.
이름 그대로 마크다운 파일 한 장이다. 그런데 이 파일은 매 세션이 시작될 때마다 자동으로 Claude의 시스템 프롬프트에 로드된다. 즉, "우리 회사에서 일하기 시작한 모든 AI가 가장 먼저 읽는 안내문" 이다.
Anthropic 공식 가이드는 CLAUDE.md를 이렇게 설명한다.
"CLAUDE.md는 Claude가 대화를 시작할 때마다 읽는 특별한 파일입니다. Bash 명령어, 코드 스타일, 워크플로우 규칙을 포함하세요. 이는 Claude가 코드만 봐서는 알 수 없는 지속적 컨텍스트를 제공합니다."
법률 사무소의 CLAUDE.md 예시
만약 한국의 한 로펌이 Claude for Legal을 도입한다면, 이런 CLAUDE.md를 둘 수 있다.
hljs language-markdown
# 우리 로펌의 작업 규칙
## 문서 작성 스타일
- 모든 클라이언트 서신은 "삼가 알려드립니다"로 시작
- 영문 계약서는 미국식 영어 사용 (color, organization, etc.)
- 숫자는 한글과 아라비아숫자 병기 (예: 일억 원(₩100,000,000))
## Redline 규칙
- 빨강: 삭제 제안
- 파랑: 추가 제안
- 노랑: 협상 여지가 있는 조항
## 위험 분류
- HIGH: 즉시 시니어 파트너에게 보고
- MEDIUM: 24시간 내 검토
- LOW: 다음 정기 회의에서 논의
## 절대 하지 말 것 (IMPORTANT)
- 클라이언트 이름은 외부 시스템(공개 검색 등)에 노출 금지
- 한국 변호사법 위반 가능 행위 자동 거절
- 인용 판례는 반드시 출처 명시 (Westlaw URL 또는 종합법률정보 링크)
## 자주 쓰는 도구
- 표준 NDA 검토: @ndareview 스킬 호출
- 한국 판례 검색: @kr-precedent MCP 서버 사용
- 영문 계약 redline: @redline-en 스킬 호출
이 한 페이지가, 그 로펌의 모든 Claude 인스턴스가 따르는 "디지털 헌법" 이 된다.
Skills와 CLAUDE.md의 차이
처음 보면 비슷해 보이지만 역할이 다르다.
| CLAUDE.md | Agent Skills |
|---|
| 로딩 시점 | 매 세션 자동 로드 | 요청과 관련될 때만 로드 |
| 크기 | 짧고 핵심만 (수십 줄) | 제한 없음 (점진적 공개) |
| 내용 | 회사 전체에 항상 적용되는 규칙 | 특정 업무에만 필요한 절차·자료 |
| 비유 | 회사의 헌법·취업규칙 | 업무 매뉴얼·작업지시서 |
| 예시 | "클라이언트 이름 외부 노출 금지" | "M&A 실사 12단계 체크리스트" |
컨텍스트 엔지니어링의 시대
이 둘은 모두 컨텍스트 엔지니어링(Context Engineering) 이라는 더 큰 패러다임의 일부다. 2025년 6월, 테슬라 AI 출신 안드레이 카르파티(Andrej Karpathy)는 이렇게 적었다.
"+1 for 'context engineering' over 'prompt engineering'. 모든 산업 수준의 LLM 앱에서, 컨텍스트 엔지니어링은 다음 스텝에 적합한 정보로 컨텍스트 윈도우를 채우는 섬세한 예술이자 과학이다."
프롬프트 엔지니어링(prompt engineering)이 "마법의 한 줄을 찾는 일"이었다면, 컨텍스트 엔지니어링은 "AI가 매 순간 정확히 필요한 정보만 보게 만드는 시스템 설계" 다. 그 시스템의 두 가지 큰 축이 바로 CLAUDE.md(상시 컨텍스트)와 Skills(요청 기반 컨텍스트)다.
!
문제 — 환각
LLM은 그럴듯한 거짓말을 자신 있게 만들어 낸다. 법률에서는 치명적.
→
해결 — Grounding
CLAUDE.md로 "반드시 출처 명시", Skills로 "Westlaw에서만 인용", MCP로 "실제 데이터에 직접 접근".
✓
결과 — 신뢰성
존재하지 않는 판례를 만들어 내는 게 구조적으로 불가능해진다. 모든 인용은 클릭 한 번으로 원문 검증 가능.
7장. 12개 플러그인 깊이 들여다보기
이제 Claude for Legal의 12개 실무 플러그인이 각각 무슨 일을 하는지 살펴보자. 단순한 카탈로그가 아니라, 실제 시나리오로 풀어 보는 게 좋겠다.

Commercial Legal
상업·계약 — NDA·MSA·SOW 검토와 협상 지원
Corporate Legal
M&A 실사·종결 체크리스트·이사회 자료
Employment Legal
고용 계약·사직·차별/괴롭힘 조사
Privacy Legal
GDPR · CCPA · 개인정보보호법 매핑
Product Legal
제품 약관·이용약관·서비스 합의서
Regulatory Legal
금융·의료·식약 등 산업 규제 대응
AI Governance
EU AI Act · 한국 AI기본법 · 책임 평가
IP Legal
특허·상표·저작권 — 청구항 작성·거절이유 대응
Litigation Legal
소송 — 증거조사·deposition prep·청구차트
Law Student
로스쿨 학습 — 사례 요약·답안 첨삭
Legal Clinic
공익·법률구조·사법접근성 지원
Legal Builder Hub
로펌이 자체 스킬·플러그인을 만들고 공유
시나리오 1 — Corporate Legal 플러그인이 M&A 실사를 처리하는 과정
가상의 한국 변호사 김 변호사가 클라이언트의 회사 인수 건을 맡았다고 하자.
장면 1 — 의뢰
김 변호사"Claude, 다음 주 Datasite VDR에 올라온 타깃 회사 자료 350건 실사해줘. 우리 표준 위험 매트릭스로 분류."
장면 2 — 자동 워크플로우
Claude는 다음 순서를 자동으로 수행한다:
1. CLAUDE.md를 읽어 로펌의 표준 위험 매트릭스 규칙 확인
2. Corporate Legal 플러그인의 M&A 실사 스킬 트리거
3. Datasite MCP로 350건 문서 직접 접근
4. 각 문서를 12개 체크포인트로 분석
5. 환경 책임·고용 분쟁·미공개 채무 등 위험 조항 추출
6. iManage MCP로 결과 보고서를 폴더에 저장
장면 3 — 결과
Claude"350건 분석 완료. 위험 HIGH 12건, MEDIUM 47건, LOW 291건. 특히 2024년 환경 분쟁 조정합의서(문서 #234)는 우리 표준 매트릭스의 D-3에 해당하므로 즉시 시니어 파트너 보고가 필요합니다. 모든 인용은 원문 페이지 번호와 함께 표시했습니다."
이 작업이 사람으로 치면 변호사 3명이 일주일 걸리는 분량이다. Claude가 30분에 끝낸다.
시나리오 2 — Litigation Legal로 1만 건 이메일 검색
소송 단계에서 가장 고통스러운 일 중 하나가 전자발견(e-discovery) 이다. 상대방이 제출한 수만 건의 이메일·문서 중에서 우리 사건과 관련된 것만 추려야 한다. 전통적으로는 jr 변호사들이 며칠 밤을 새우며 키워드 검색으로 거른다.
Claude의 Litigation 플러그인 + Relativity MCP 조합은 이렇게 작동한다.
SYSTEM (자동 로드)
CLAUDE.md: 모든 인용은 Bates 번호로 표시. 특권 문서(attorney-client privilege)는 자동 분리.
USER
"Relativity에 업로드된 X사 이메일 12,438건에서 합병 의도가 드러나는 문서를 찾아줘. 'merger', 'acquisition' 같은 단순 키워드 매칭이 아니라, 의도가 암시되는 문맥까지 잡아줘. 결과는 신뢰도 순으로 정렬."
SKILL TRIGGER
→ litigation-discovery 스킬 자동 호출
→ relativity MCP 서버 연결
→ 의미 검색 + 추론 결합
결과는 신뢰도 순위가 매겨진 후보 문서 목록 + 각 문서의 핵심 발췌 + Bates 번호 + 특권 가능성 플래그다. 변호사는 후보 100건만 사람 눈으로 검토하면 된다.
시나리오 3 — Privacy Legal로 GDPR 매핑
EU에서 사업하는 한국 기업의 개인정보 정책을 GDPR과 한국 개인정보보호법 양쪽에 모두 맞춰야 한다고 하자.
"우리 정책 v3.2를 GDPR Article 6·7·9, 그리고 한국 PIPA 제15조·제17조와 매핑해줘.
충돌하는 부분은 표시하고, 양쪽을 모두 만족시키는 절충안을 제안해줘."
Privacy Legal 플러그인은 이 요청을 받으면 — 양 법령의 텍스트를 가진 신뢰할 수 있는 출처(EUR-Lex, 국가법령정보센터)에 직접 접근해, 조항별 매핑 표와 함께 충돌 지점을 정리해 준다. 그리고 모든 결론은 원문 링크와 함께 제시한다.
8장. 파트너 생태계 — 누가 무엇을 하고 있는가
이 발표가 단순한 슬라이드가 아니라 이미 작동 중인 시스템임을 보여주는 가장 강력한 증거는 — 실제로 쓰고 있는 회사들의 사례다.
Freshfields — 6주 만에 사용량 500% 증가
영국 매직 서클의 Freshfields는 33개 사무소에 걸쳐 수천 명의 변호사에게 Claude를 배포했다. 결과는 놀라웠다.
~500%
사용량 증가
파트너십 첫 6주 만에
수천 명
활용 변호사 수
파트너 + 어소시에이트
Freshfields Lab의 공동대표 게리트 베크하우스(Gerrit Beckhaus)는 이렇게 말했다.
"Freshfields Lab의 핵심 원칙은 '최고의 기술 위에 우리 것을 짓는다'는 것입니다. Claude의 역량은 우리의 독점 AI 솔루션의 필수 부분이 되었습니다. 이번 협력으로 한 단계 더 나아가, 다단계 법무 작업을 처음부터 끝까지 처리할 수 있는 에이전트형 워크플로우를 공동 개발하고 있습니다."
핵심 키워드는 "end-to-end 에이전트 워크플로우" 다. 더 이상 변호사가 단계마다 AI를 불러서 물어보는 게 아니라, 한 번 일을 맡기면 AI가 끝까지 처리한다는 뜻이다.
Harvey — 90.9%라는 숫자
Harvey의 CEO 윈스턴 와인버그는 발표 당일 인상적인 숫자 하나를 공개했다.
"Claude Opus 4.7은 Harvey의 BigLaw Bench에서 90.9%를 기록했습니다. 모든 Claude 모델 중 최고 점수입니다."
BigLaw Bench는 Harvey가 자체 개발한 법률 AI 평가 벤치마크다. 실제 BigLaw(미국 100대 대형 로펌) 변호사가 다루는 작업들 — 실사, 계약 검토, 메모 작성, 판례 분석 등 — 으로 구성되어 있다. 90.9%라는 점수는 실제 시니어 변호사 수준에 근접한 정확도를 의미한다.
특히 흥미로운 점은 Harvey가 Claude의 경쟁자가 아니라 보완자로 자리 잡았다는 것이다. Harvey 자체도 Claude를 자기 시스템의 핵심 모델 중 하나로 사용한다.
Eve — "법률에서 환각은 무답보다 나쁘다"
Eve의 CEO 제이 마디스와란(Jay Madheswaran)이 한 말은 법률 AI의 본질을 가장 정확히 짚는다.
"우리는 모든 모델을 24개 이상의 법률 특화 평가 항목으로 검증합니다 — 인용 정확성, 근거 없는 판례 인용, 메모리 누수, 거절 정확성. 소송에서는 신빙성 있는 환각이 답이 없는 것보다 더 나쁩니다. Claude는 법무 업무에 중요한 지표, 특히 grounding과 citation faithfulness에서 매번 내부 비교의 우승자입니다."
이 발언의 핵심은 마지막 문장이다. "신빙성 있는 환각이 답이 없는 것보다 더 나쁘다." 일반 챗봇 시장에서는 "잘 모르겠다"보다 "그럴듯한 답"이 더 환영받지만, 법률에서는 정반대다. 차라리 모른다고 말해줘야 변호사가 직접 검증할 수 있다.
Solve Intelligence — 특허 청구항의 미세한 추론
특허 변호사들이 가장 어려워하는 작업 중 하나가 청구항 차트(claim chart) 작성이다. 화학 구조, 회로도, 복잡한 다이어그램을 정확히 해석하고 — 그 위에서 침해 여부를 분석해야 한다.
Solve Intelligence의 최고연구책임자 산즈 아힐란(Sanj Ahilan)은 이렇게 말했다.
"우리는 특허 업무의 가장 어려운 부분에서 모든 모델을 벤치마킹합니다: 장문 기술 문서에 대한 다단계 추론, 화학 구조 인식, 복잡한 다이어그램 해석. Claude Opus 4.7은 명백한 진전입니다 — 초안, 심사, 검색, 소송급 청구 차트 작성 전반에서 수준이 높아졌습니다."
Courtroom5 — 80%의 변호사 없는 시민들
마지막으로 가장 사회적 의미가 큰 사례. 미국 민사 소송의 약 80%는 한쪽 또는 양쪽 당사자가 변호사 없이 진행된다. 시간당 수백 달러의 변호사 비용을 감당할 수 없기 때문이다.
Courtroom5의 CEO 손야 에브론(Sonja Ebron)은 이렇게 말했다.
"대부분의 사람들은 자신의 법적 권리를 늦었을 때서야 알게 됩니다. Claude는 이제 그들을 — 그들이 두렵고 답을 찾고 있는 바로 그 순간에 — 만날 수 있습니다."
Anthropic은 이를 위해 Claude for Nonprofits 프로그램을 통해 법률구조 단체, 공익 변호사, 비영리 법무 조직에 대폭 할인된 가격으로 Claude for Legal을 제공하고 있다. Free Law Project, Justice Technology Association, Courtroom5 같은 기관이 이미 참여 중이다.
9장. Grounding — "법률에서 그럴듯한 거짓말은 무답보다 나쁘다"
환각의 메커니즘
Mata v. Avianca 사건이 발생한 이유는 단순하다. ChatGPT는 법률 데이터베이스에 접근하지 않는다. 학습 데이터에 기반해 "통계적으로 그럴듯한" 텍스트를 생성한다. 판례명도, 인용번호도, 발췌도 — 모두 진짜 판례를 학습한 패턴 위에서 그럴듯하게 만들어 낸다.
이걸 막는 게 Grounding(근거 결합) 이다. AI의 답변을 반드시 검증 가능한 출처에 연결하는 기법이다.
1. 명시적 출처 강제
CLAUDE.md에 "모든 인용은 Westlaw URL 또는 KeyCite ID 필수"를 박아 둠. 출처 없이는 답변 생성 불가.
2. MCP로 실제 데이터 접근
Westlaw·CourtListener·Trellis MCP 서버를 통해 실시간 검증된 판례에서만 인용 가져옴. 모델이 "기억"으로 답하지 않음.
3. KeyCite 유효성 신호
Thomson Reuters의 14억 건 KeyCite 신호로 인용한 판례가 폐기·번복됐는지 자동 검증.
4. Citation Faithfulness 평가
Eve가 사용하는 24개 평가 항목 중 가장 중요한 지표. "AI가 인용한 부분이 원문과 정확히 일치하는가"를 자동 측정.
그래도 환각 사고는 계속된다
흥미로운 점은 — Claude for Legal 출시 발표 당일에도 법원에서는 여전히 AI 환각으로 인한 제재가 이뤄지고 있다는 사실이다. Fortune 기사는 이렇게 적었다.
"Sullivan & Cromwell의 파트너 Andrew Dietderich는 'We deeply regret that this has occurred'라고 서면으로 인정했다. 변호사들은 존재하지 않는 판례 — AI가 만들어 낸 유령 선례(ghost precedents) — 를 인용한 서면을 제출하다가 적발되고 있다. 판사들은 제재를, 변호사회는 경고를 발하고 있다."
이런 사고가 계속되는 이유는 결국 사용 도구의 차이다. ChatGPT 같은 일반 챗봇을 그대로 법률 작업에 쓰면 환각이 나오지만 — Grounding이 설계된 시스템을 쓰면 구조적으로 막을 수 있다. Claude for Legal이 강조하는 것이 바로 이 차이다.
핵심 원리: AI 자체가 환각을 안 하게 만드는 것은 어렵다. 그러나 AI가 환각을 할 수 없는 환경을 만드는 것은 가능하다. CLAUDE.md + MCP + Skills의 3중 결합이 그 환경이다.
10장. 사회 정의 — Justice Gap을 메우는 AI
법률 AI 논의가 보통 빅로펌과 빅테크의 이야기로 흘러가는 것과 달리, Anthropic의 발표에는 눈여겨볼 만한 한 축이 있다 — 사법 접근성(Access to Justice) 이다.
미국 법무부 통계에 따르면 미국 민사 사건의 약 80% 는 적어도 한쪽 당사자가 변호사 없이 출석한다. 이를 Justice Gap이라 부른다. 임대차 분쟁, 가족법 분쟁, 소비자 보호, 이민 — 가장 절실한 사람들이 가장 도움받기 어려운 영역이다.

비영리 파트너들
Anthropic은 다음 비영리 파트너들과 협업해, Claude for Legal을 무료 또는 대폭 할인된 가격으로 제공한다.
Free Law Project
미국 연방·주 판례를 무료로 공개하는 비영리. 31M+ 문서, 160+ 국가 검색.
Justice Tech Association
사법 접근성 향상을 위한 기술 표준 제정 비영리.
Courtroom5
변호사 없이 자기 사건을 진행하는 시민(pro se litigants)을 돕는 도구.
Descrybe
판례를 일반인이 이해할 수 있는 평이한 언어로 요약.
한 사람의 이야기
Anthropic 발표 자료에 인용된 손야 에브론(Sonja Ebron)의 한마디가 이 전체 흐름을 가장 잘 요약한다.
"대부분의 사람들은 자신에게 법적 권리가 있다는 사실을 — 너무 늦었을 때서야 알게 됩니다. Claude는 이제 그들을 만날 수 있습니다. 그들이 두렵고, 답을 찾고 있는, 바로 그 순간에."
물론 AI가 변호사를 대체할 수는 없다. 그러나 변호사를 만날 수 없는 사람에게 첫 도움을 줄 수는 있다. 임대인이 일방 통보로 보증금을 돌려주지 않을 때, 회사가 부당한 사유로 해고할 때, 보험사가 약관을 들어 보상을 거부할 때 — 그 첫 순간에 "당신에게는 이런 권리가 있고, 이런 절차로 다툴 수 있습니다" 를 말해 줄 수 있는 존재. 그게 Claude for Legal의 사회적 야망이다.
11장. 산업 OS의 등장 — 시장 구조의 재편
이번 발표가 가져올 가장 큰 변화는 단순히 "변호사들이 일을 더 잘하게 된다"가 아니다. 법률 산업 전체의 가치사슬이 재구성된다는 것이다.
이전 구조 (2023~2025)
변호사 → Harvey/Eve → OpenAI/Anthropic API
법률 테크 회사가 중간 인터페이스 장악
데이터 회사(Westlaw/Lexis)는 콘텐츠 공급
AI는 보이지 않는 엔진
새로운 구조 (2026~)
변호사 → Claude for Legal → 모든 시스템
AI가 법률 업무의 "운영체제"
Harvey, Westlaw 등은 OS 위의 "앱"이 됨
Office 365가 운영체제로서 가졌던 위상에 가까움
마이크로소프트가 1990년대 윈도우로 PC 산업을 장악하고, Apple이 2007년 iOS로 모바일 시대를 열었듯이 — Anthropic은 산업별 AI OS라는 새로운 카테고리를 만들고 있다. 그 첫 산업이 법률이다.
다음은 어디인가
Anthropic은 명시하지 않았지만, 같은 전략의 다음 표적은 명백하다.
"AI 산업 OS"의 다음 후보 (코어닷투데이 분석)
금융 (Finance)
진행 중
2026 하반기 예상
의료 (Healthcare)
파일럿 단계
규제 장벽 높음
회계 (Accounting)
초기
Big4 협업 시작
건설 (Construction)
탐색
데이터 디지털화 부족
법률이 첫 산업이 된 이유는 — 앞서 살펴봤듯이 — 텍스트 의존도, 워크플로우 표준화, 시간당 단가, 데이터 디지털화의 네 박자가 모두 맞아떨어졌기 때문이다. 다른 산업으로의 확장은 이 네 가지가 충족되는 순서대로 진행될 것이다.
12장. 한국 시장에 의미하는 것
마지막으로 코어닷투데이의 시각에서, 이 발표가 한국 시장에 어떤 함의를 가지는지 정리해 보자.
① 한국 로펌도 곧 같은 압력을 받는다
김앤장, 광장, 태평양, 세종, 율촌 같은 한국의 7대 로펌은 이미 자체 AI 도입을 가속하고 있다. 글로벌 클라이언트가 "Freshfields는 6주에 500% 사용량인데, 너희는?" 이라고 묻기 시작하면 — 도입은 선택이 아닌 필수가 된다.
다만 한국 시장에는 두 가지 변수가 있다.
!
변수 ① — 한글 데이터
Westlaw·CourtListener에 해당하는 대규모 한국 판례 데이터베이스가 부족하다. 종합법률정보·LBOX·로앤비 등이 있지만 MCP 통합은 아직.
→
변수 ② — 변호사법
한국 변호사법은 비변호사의 법률사무 취급을 엄격히 금지한다. AI가 "법률 자문"의 어디까지 할 수 있는지에 대한 해석이 필요.
✓
기회
한국 법률 데이터를 MCP로 표준화하고, 한국 변호사법 가드레일을 CLAUDE.md에 인코딩하는 — 한국형 Claude for Legal을 만들 여지.
② 한국 기업의 in-house 법무팀이 먼저 움직인다
법률시장 개방이 더딘 한국에서는, 오히려 대기업 법무팀이 먼저 도구를 도입할 가능성이 높다. 삼성전자·SK하이닉스·LG에너지솔루션처럼 수만 건의 글로벌 계약을 다루는 회사들은 이미 Harvey, Lexis+, CoCounsel 등을 시범 도입 중이다. Claude for Legal의 12개 플러그인, 특히 Privacy Legal, AI Governance, Regulatory Legal은 한국 대기업의 컴플라이언스 부서와 직접 맞닿아 있다.
③ 컨텍스트 엔지니어링이 새로운 직무가 된다
법률뿐 아니라 모든 산업에서 — CLAUDE.md를 잘 쓰고, Skills를 설계하고, MCP 서버를 운영할 줄 아는 사람이 새로운 핵심 인력이 된다. 이는 코딩 능력이 아니라 조직 지식을 명료하게 글로 풀어쓰는 능력이다. 한국에서 이 직무는 아직 정의조차 되지 않았다. 코어닷투데이는 이 분야를 "AI 컨텍스트 디자이너" 라고 부르며 한국 시장에서 가장 먼저 양성해야 할 직무로 꼽는다.
④ 모델 경쟁이 아니라 OS 경쟁이다
마지막으로 — 가장 중요한 통찰. 더 이상 "어떤 모델이 더 똑똑한가"의 싸움이 아니다. "어떤 산업의 운영체제가 될 것인가" 의 싸움이다.
한국의 LLM 회사들(NAVER HyperCLOVA X, KT 믿음, Kakao Kanana)도 모델 자체의 한국어 성능 경쟁만 해서는 안 된다. 한국 산업의 OS가 되려는 전략 — 한국형 MCP 생태계, 한국형 Skills 마켓플레이스, 한국 기업·관공서·로펌과의 깊은 워크플로우 통합 — 이 다음 5년의 게임을 결정할 것이다.
에필로그: 슈와르츠 변호사의 2026년
다시 처음의 이야기로 돌아가 보자. 2023년 가짜 판례 6건으로 5,000달러 벌금을 받은 스티븐 슈와르츠 변호사. 그는 지금 어떻게 일하고 있을까?
상상해 본다. 2026년 5월의 어느 날, 그가 자기 사무실에서 Claude를 켠다. 그가 묻는다.
"Avianca 사건 같은 항공 인신상해 판례를 5건만 추려줘."
Claude는 이번엔 Westlaw MCP에 직접 접속한다. KeyCite 유효성을 검증한다. 각 인용에 클릭 가능한 URL을 붙인다. 그리고 답한다.
"5건의 판례를 찾았습니다. 모두 Westlaw에서 검증되었으며, 폐기되지 않은 유효 판례입니다. 각 판례의 핵심 쟁점과 본 사건과의 유사도(0~1점)를 함께 표시했습니다. [원문 링크]"
슈와르츠는 클릭한다. 진짜 판례가 열린다. 그는 안도의 한숨을 쉬고, 자기가 직접 읽은 뒤 — 마침내 서면을 작성한다.
이게 2026년의 변호사 업무다. AI가 변호사를 대체한 것이 아니라, 변호사가 자기 일을 더 잘할 수 있게 만든 것. 그것이 — Anthropic이 'Claude for Legal'에서 말하는 진짜 비전이다.
더 읽어볼 자료
코어닷투데이의 시각 — 우리는 2026년이 AI 산업 OS의 원년으로 기록될 것이라 본다. Claude for Legal은 그 첫 신호탄이다. 한국 시장에서도 동일한 흐름이 — 다만 다른 속도로 — 펼쳐질 것이다. 모델 한 줄 더 학습시키는 일보다, 우리 산업의 텍스트와 워크플로우를 AI가 읽을 수 있게 만드는 일이 훨씬 더 중요해질 것이다. 이 글이 그 작업을 시작하려는 모든 분께 도움이 되길 바란다.