만능 선수가 전문가를 이겼다: 범용 LLM이 전문 의료 AI를 압도한 날 — Nature Medicine 2026 완전 해부
‘의료 전용으로 만든 AI가 당연히 더 낫다’ — 60년간 의심받지 않던 이 가정이 처음으로 무너졌다. NYU Langone·UT오스틴 연구진이 *Nature Medicine*(2026.6)에 발표한 독립 검증에서, 범용 프런티어 LLM(GPT-5.2·Gemini 3.1 Pro·Claude Opus 4.6)이 전문 의료 AI(OpenEvidence·UpToDate Expert AI)를 *세 가지 평가 전부*에서 앞섰다. 실제 의사 질문 100개를 *12명이 맹검*으로 채점한 실전 벤치마크(RCQ)에서도 결과는 같았다. 왜 ‘전문가’가 ‘만능 선수’에게 졌을까? RAG가 오히려 독이 되는 이유, USMLE·MedQA·HealthBench의 정체, 그리고 2026년 병원 구매·규제·한국 의료 AI에 던지는 질문까지 — 의학사 60년을 거슬러 쉽고 자세하게 해부한다.