한 줄로 시작하는 이야기
오늘 당신이 쓰는 AI는, 사실 태어난 순간 박제된 존재다. GPT든 Claude든, 출시되는 그 시점의 능력에서 멈춰 있다. 당신이 1년을 함께 일해도 그 모델 자체는 한 톨도 더 똑똑해지지 않는다. 새 능력이 필요하면? 거대한 재훈련을 거쳐 '새 버전'이 나오길 기다려야 한다.
이 정적인 한계를 깨려는 꿈이 자기진화 에이전트(self-evolving agent) 다. 스스로 자기 코드를 고치고, 새 스킬을 만들고, 기억을 다듬으며 — 사람처럼 경험으로 성장하는 AI.

Task-Observer 글에서 우리는 이미 그 씨앗을 봤다 — 스스로 스킬을 개선하는 스킬. 그런데 2026년, 이 꿈에 찬물을 끼얹는 논문이 나왔다. 제목부터 도발적이다. 《자기진화 에이전트는 잊는가?(Do Self-Evolving Agents Forget?)》 답은 — 그렇다. 진화할수록, 예전에 잘하던 것을 까먹는다.
이 글은 자기진화 에이전트가 무엇이고(제1장), 어떻게 설계되며(제2·3장), 왜 '능력 침식'이라는 그늘을 갖는지(제4·5장), 그리고 어떻게 '성장하되 잊지 않을' 수 있는지(제6·7장)를 원문 그림과 함께 풀어낸다.
제1장: 박제된 AI를 깨우다 — 자기진화의 꿈
↓
제2장: 진화의 설계공간 — What·When·How·Where
↓
제3장: 진화의 계보 (2022→2025)
↓
제4장: 불편한 진실 — '능력 침식'
↓
제5장: 네 통로의 망각
↓
제6·7장: 성장하되 잊지 않기 (CPE)와 실무
제1장: 박제된 AI를 깨우다 — 자기진화의 꿈
《A Survey of Self-Evolving Agents》(arXiv 2507.21046)는 자기진화 에이전트를 이렇게 정의한다.
"자기 자신의 궤적이나 피드백 신호에 기반해, 미래 성능 향상을 명시적 목표로, 자신의 내부 파라미터·맥락 상태·도구·아키텍처를 수정하는 에이전트."
핵심은 '미래의 자신을 위해 스스로를 바꾼다'는 것이다. 동기는 분명하다 — 현재 LLM은 "근본적으로 정적이어서, 새로운 과제·변화하는 지식·동적 상황을 만나도 내부를 적응시키지 못한다." 서베이는 자기진화 에이전트를 파운데이션 모델에서 초지능(ASI)으로 가는 다리로 본다.
!
문제: 정적인 AI
출시 순간 능력이 고정. 새 과제·새 지식에 적응하려면 거대한 재훈련이 필요 — 느리고 비싸다
↻
해결: 경험으로 진화
자기 실행 궤적과 피드백으로 워크플로·스킬·기억·모델을 스스로 갱신 — 쓸수록 좋아진다
∞
지향: 평생 학습
한 번 배우고 끝이 아니라, 배포된 채로 계속 성장하는 'lifelong agent'
제2장: 진화의 설계공간 — What·When·How·Where
서베이의 핵심 기여는 자기진화를 네 가지 질문으로 분해한 것이다. 무엇을·언제·어떻게·어디서 진화하는가.
자기진화의 4대 축
What · 무엇을
모델(파라미터)·맥락(메모리·프롬프트)·도구·아키텍처(단일/멀티에이전트)
When · 언제
과제 수행 중(intra-test-time) vs 과제 사이(inter-test-time)
How · 어떻게
보상 기반 · 모방/시연 기반 · 집단/진화 기반(population-based)
Where · 어디서
범용 도메인 vs 전문 도메인(코딩·GUI·금융·의료·교육)
이 프레임의 묘미는, 우리가 시리즈에서 다룬 것들이 모두 '진화의 대상(What)'에 들어간다는 점이다. 스킬을 진화시키면 스킬 진화, 메모리를 진화시키면 메모리 진화, 모델 가중치를 바꾸면 모델 진화다. 자기진화는 이 시리즈 전체를 '시간에 따른 변화'라는 한 축으로 다시 묶는다.
제3장: 진화의 계보 (2022 → 2025)
자기진화는 갑자기 나온 개념이 아니다. 서베이는 2022년부터 2025년까지의 대표 시스템들을 한 장의 '진화 풍경'으로 그렸다. 원문 그림을 그대로 가져온다.

▲ 원문 Fig. 4: Evolutionary landscape of self-evolving agents (arXiv:2507.21046)
2022 · 씨앗
STaR·Self-Instruct — 모델이 스스로 만든 데이터로 자신을 가르치다
2023 · 도구·경험
Voyager(마인크래프트 스킬 축적)·Reflexion·CREATOR — 경험과 반성으로 진화
2024 · 자동 설계
AgentOptimizer·ADAS·EvoAgent — 에이전트가 에이전트의 구조를 최적화
2025 · 자기개선 폭발
Gödel Agent·AlphaEvolve·EvoAgentX — 스스로 알고리즘을 발견·개량
'어떻게 진화하나(How)'는 크게 셋이다. 보상 기반(스칼라 보상·텍스트 피드백·자기반성), 모방/시연 기반(자기생성·교차 에이전트 학습), 집단/진화 기반(여러 후보를 경쟁시켜 선택). DSPy(파이프라인 자기개선), TextGrad(텍스트 그래디언트), Mem0(장기기억) 등이 각 계열의 대표다.
제4장: 불편한 진실 — '능력 침식'
여기까지면 장밋빛이다. 그런데 《Do Self-Evolving Agents Forget?》(arXiv 2605.09315)가 찬물을 끼얹는다. 자기진화에는 '능력 침식(capability erosion)' 이라는 근본적 그늘이 있다는 것.

"시스템이 새로운 과제 분포에 자율적으로 적응할 때, 이전에 통달했던 능력을 점진적으로 잃는다. 적응 메커니즘이 새 요구에만 최적화하고, 망각을 막을 안전장치가 없기 때문이다."
핵심 단어는 비단조성(non-monotonic) 이다. 새 과제 성적은 오르는데, 옛 과제 성적은 내려간다. 즉 진보가 곧 퇴보를 동반한다. 실제 수치가 이를 보여준다.
▪ 일반 진화: 워크플로를 새 과제에 맞추자 단순 과제 능력이 41.8%만 유지 — 절반 넘게 잃었다
▪ CPE 적용: 유지율이 52.8%로 상승(약 11%p 개선), 복잡 과제 적응 성능은 그대로
▪ 메모리 진화도 같은 패턴: 옛 도메인 성능 83.9% → (일반 진화) 81.6% → (CPE) 83.3% 회복
이것은 인간에게도 익숙한 역설이다. 특정 분야 전문가가 될수록 기초를 잊고, 새 습관을 들이면 옛 습관이 무뎌진다. AI도 똑같다 — 특화는 망각을 부른다(specialization without preservation).
제5장: 네 통로의 망각
논문이 날카로운 건, 이 침식이 진화의 네 통로 전부에서 — 각기 다른 메커니즘으로 — 일어난다고 밝힌 점이다.

| 진화 통로 | 망각 메커니즘 |
|---|
| 워크플로 진화 | 복잡한 과제용 파이프라인에 최적화하면, 단순 과제 처리 능력이 침식된다 |
| 스킬 진화 | 새 스킬을 익히는 과정이 기존 스킬의 표현(representation)을 재편하며 망가뜨린다 |
| 모델 진화 | 새 분포로 자기학습하면 모델 파라미터에 파국적 망각(catastrophic forgetting) 발생 |
| 메모리 진화 | 새 맥락을 위한 기억 갱신이 옛 지식의 표현을 덮어쓰거나 희석한다 |
특히 모델 진화의 '파국적 망각'은 신경망의 고전적 난제다. 새것을 배우면 옛 가중치가 덮어써진다. 흥미로운 건, 지난 메모리 글에서 본 '기억의 노화(staleness)'가 여기서 메모리 통로의 침식으로 다시 등장한다는 점이다 — 같은 문제가 진화의 렌즈로 보면 또 다른 얼굴을 한다.
제6장: 성장하되 잊지 않기 — CPE
그렇다면 답은 '진화를 포기하라'인가? 아니다. 논문은 능력 보존 진화(Capability-Preserving Evolution, CPE) 를 제안한다. 원리는 단순하면서도 강력하다.

진화의 목표 함수에 '적응(adaptation)'만이 아니라 '보존(preservation)'을 함께 넣는다. 새것을 배우는 동시에, 옛 능력을 명시적으로 지킨다.
기존 방식
새 과제 성능만 최적화 → 옛 능력은 방치 → 침식
CPE의 전환
'성장'과 '유지'를 이중 목표로. 파괴적 능력 표류(capability drift)를 제약
결과
네 통로 모두에서 적응 성능은 유지하면서 옛 능력 안정성을 높임
논문의 결론은 에이전트 개발의 패러다임을 다시 정의한다. "안정적인 장기 자기진화는 새 능력을 '획득'하는 것만이 아니라, 이전 능력을 '명시적으로 보존'하는 것을 요구한다." 성장은 더 이상 유일한 목표가 아니다. 성장과 보존, 둘 다여야 한다.
잊지 말아야 할 위험: 통제 가능성
진화하는 AI에는 또 다른 그늘이 있다. 안전성과 통제 가능성이다. 스스로 코드와 행동을 바꾸는 시스템은, 예측 못 한 방향으로 표류할 수 있다. 서베이도 "자율 진화의 창발적 위험(emergent risks)" 과 가드레일의 필요성을 핵심 과제로 꼽는다. 우리가 오염된 스킬 글에서 본 위협이, 진화하는 에이전트에서는 스스로 증폭될 수 있다.
제7장: 실무 시사점 — 그리고 시리즈를 닫으며
자기진화는 아직 연구 단계가 많지만, 실무자가 지금 새겨야 할 교훈은 분명하다.
진화하는 에이전트를 다룰 때
① 회귀를 측정하라
새 능력만 보지 말고, '예전에 잘하던 것'의 성능을 반드시 함께 추적. 침식은 조용히 온다
② 보존을 설계에 넣어라
적응 목표 옆에 보존 목표를. 롤백 가능한 버전·스냅샷으로 '되돌릴 권리'를 확보
③ 가드레일을 먼저
자율 진화엔 통제 장치가 필수. 무엇을 바꿔도 되고 안 되는지 경계를 명시
마치며: 다섯 편을 관통하는 한 문장
우리는 이 시리즈에서 사람의 전문성을, 스킬을, 그 보안을, 기억을, 컨텍스트를, 그리고 오늘 그 모든 것의 '시간에 따른 변화'인 자기진화를 다뤘다. 이 여섯 갈래는 결국 하나의 질문으로 모인다.
AI를 더 똑똑하게 만드는 것은 '더 큰 모델'이 아니라, 그 능력을 어떻게 외부화하고·기억하고·진화시키고·지켜내느냐다.
자기진화 에이전트는 그 정점에 있다. 스스로 자라는 AI의 시대에, 진짜 기술은 '어떻게 성장시킬까' 만큼이나 '성장하면서 무엇을 잃지 않을까' 에 있다. 인간이 그러하듯, 잘 진화하는 지능의 비밀은 결국 — 잊지 않는 법에 있다.
참고 자료 / 출처