
관리형 쿠버네티스 완전 가이드: EKS, GKE, AKS — 무엇을 선택할 것인가
쿠버네티스를 직접 운영하는 것은 '집을 짓는 것'이고, 관리형 서비스를 쓰는 것은 '아파트에 입주하는 것'이다. AWS EKS, Google GKE, Azure AKS가 왜 탄생했고, 어떤 차이가 있으며, 당신의 팀에 맞는 선택은 무엇인지를 실전 관점에서 풀어본다.

쿠버네티스를 직접 운영하는 것은 '집을 짓는 것'이고, 관리형 서비스를 쓰는 것은 '아파트에 입주하는 것'이다. AWS EKS, Google GKE, Azure AKS가 왜 탄생했고, 어떤 차이가 있으며, 당신의 팀에 맞는 선택은 무엇인지를 실전 관점에서 풀어본다.
이전 글에서 쿠버네티스가 컨테이너 오케스트레이션의 사실상 표준이라고 설명했다. 하지만 한 가지 빠뜨린 것이 있다 — 쿠버네티스 자체를 운영하는 것이 얼마나 힘든지.
쿠버네티스를 직접 설치하고 운영한다고 상상해 보자:
이것을 Day 2 Operations이라 부른다. 설치(Day 1)보다 운영(Day 2)이 10배는 더 어렵다.
CNCF의 2024년 조사에 따르면, 쿠버네티스 도입의 가장 큰 장애물은 복잡성(36%) 과 숙련된 인력 부족(31%) 이다. 기술 자체보다 운영이 문제인 것이다.
"쿠버네티스의 기능은 쓰고 싶지만, 컨트롤 플레인 운영은 하고 싶지 않다."
이 요구에 대한 답이 관리형 쿠버네티스 서비스(Managed Kubernetes) 다.
2015~2017년, 쿠버네티스가 주목받기 시작하면서 많은 기업이 자체 클러스터를 구축했다. 결과는 대부분 같았다:
Kelsey Hightower (Google의 K8s 에반젤리스트)는 2017년에 이렇게 말했다:
"쿠버네티스는 컨테이너 오케스트레이션 문제를 해결했다. 하지만 쿠버네티스 자체를 운영하는 것이 새로운 문제가 됐다."
클라우드 사업자들은 이 기회를 놓치지 않았다. 컨트롤 플레인의 설치·운영·업그레이드·백업을 대신 해주는 관리형 서비스를 경쟁적으로 출시했다.
비유하면: 관리형 K8s는 아파트에 입주하는 것이다. 건물 구조, 엘리베이터, 배관은 관리 사무소가 알아서 한다. 하지만 실내 인테리어, 가구 배치, 청소는 입주자의 몫이다.
EKS(Elastic Kubernetes Service)는 AWS의 관리형 쿠버네티스 서비스다. 2018년 6월 GA 출시. 컨트롤 플레인을 AWS가 관리하고, 워커 노드는 EC2 인스턴스 또는 Fargate에서 실행된다.
1. AWS 서비스와의 깊은 통합
EKS의 가장 큰 강점은 AWS의 200+ 서비스와 네이티브로 연결된다는 것이다:
2. 다양한 노드 옵션
| 노드 유형 | 관리 수준 | 적합한 경우 |
|---|---|---|
| 자체 관리 EC2 | 사용자가 EC2 직접 관리 | 커스텀 AMI, 특수 인스턴스 필요 시 |
| 관리형 노드 그룹 | AWS가 노드 프로비저닝·업데이트 | 대부분의 표준 워크로드 |
| Fargate | 서버 완전 불필요 | 간헐적 워크로드, 소규모 서비스 |
| Karpenter | AI 기반 자동 노드 프로비저닝 | 동적 워크로드, 비용 최적화 |
3. Karpenter — EKS의 킬러 기능
2021년 AWS가 오픈소스로 공개한 Karpenter는 K8s 노드 프로비저닝의 게임 체인저다. 기존 Cluster Autoscaler가 "미리 정의된 노드 그룹"에서 인스턴스를 추가하는 반면, Karpenter는:
| 항목 | 비용 |
|---|---|
| 컨트롤 플레인 | 73/월) |
| 워커 노드 (EC2) | EC2 인스턴스 비용 |
| 워커 노드 (Fargate) | vCPU/메모리 사용량 기준 |
| 데이터 전송 | AZ 간 $0.01/GB |
| EBS 볼륨 | gp3 $0.08/GB/월 |
GKE(Google Kubernetes Engine)는 K8s를 만든 Google의 관리형 서비스다. 2015년 GA 출시로 최초의 관리형 K8s. K8s의 원조답게 가장 빠르게 새 버전을 지원하고, 가장 진보적인 기능을 제공한다.
1. Autopilot 모드 — "노드도 관리하지 마라"
GKE의 가장 독특한 기능. 2021년 출시된 Autopilot은 노드 프로비저닝, OS 업데이트, 보안 패치까지 Google이 관리한다. 사용자는 Pod만 배포하면 된다.
Autopilot은 AWS Fargate와 비슷하지만, 완전한 K8s API 호환성을 유지한다. Fargate에서 불가능한 DaemonSet, 특정 볼륨 타입 등이 Autopilot에서는 가능하다.
2. AI/ML 워크로드 최적화
Google이 K8s 원조인 동시에 AI 선두주자라는 이점:
3. 컨트롤 플레인 무료
GKE Autopilot에서는 컨트롤 플레인 비용이 무료다. Standard 모드에서도 하나의 존(zonal) 클러스터는 무료이고, 리전(regional) 클러스터만 $0.10/시간이 과금된다.
| 항목 | Standard | Autopilot |
|---|---|---|
| 컨트롤 플레인 (Zonal) | 무료 | 무료 |
| 컨트롤 플레인 (Regional) | $0.10/시간 | 무료 |
| 워커 노드 | GCE 인스턴스 비용 | vCPU/메모리/스토리지 사용량 |
| 커밋 사용 할인 | 최대 57% (CUD) | 최대 57% (CUD) |
AKS(Azure Kubernetes Service)는 Microsoft의 관리형 K8s 서비스다. 2018년 GA. 가장 큰 차별점은 Microsoft 엔터프라이즈 생태계와의 통합이다.
1. Azure AD(Entra ID) 통합
대기업에서 가장 많이 쓰는 ID 시스템인 Azure AD와 K8s RBAC을 직접 연동한다. "마케팅팀의 김 대리는 staging 네임스페이스만 접근 가능" 같은 정책을 기존 AD 그룹으로 관리할 수 있다.
2. Windows 컨테이너 지원
AKS는 Windows Server 컨테이너를 가장 잘 지원하는 관리형 K8s다. .NET Framework 앱을 컨테이너화해야 하는 기업에게는 사실상 유일한 선택지다.
3. 컨트롤 플레인 완전 무료
AKS의 컨트롤 플레인은 무조건 무료다. EKS의 월 73과 달리, AKS는 워커 노드 비용만 지불하면 된다.
| 항목 | AKS Free Tier | AKS Standard | AKS Premium |
|---|---|---|---|
| 컨트롤 플레인 | 무료 | $0.10/시간 | $0.60/시간 |
| SLA | 없음 | 99.95% (멀티AZ) | 99.95% + LTS |
| 장기 지원 | 표준 (14개월) | 표준 | 24개월 LTS |
| 기준 | EKS (AWS) | GKE (Google) | AKS (Azure) |
|---|---|---|---|
| 출시 | 2018.6 | 2015 | 2018 |
| 컨트롤 플레인 비용 | $73/월 | 무료~$73/월 | 무료~$438/월 |
| 노드 자동화 | Karpenter | Autopilot | KEDA + Cluster Autoscaler |
| 서버리스 옵션 | Fargate | Autopilot | ACI(Azure Container Instances) |
| K8s 버전 지원 속도 | 보통 | 가장 빠름 | 보통 |
| AI/ML | SageMaker 연동 | TPU 네이티브, AI Gateway | Azure ML 연동 |
| Windows 컨테이너 | 제한적 | 제한적 | 최고 수준 |
| ID 통합 | IAM + IRSA | Google Workspace | Azure AD (Entra ID) |
| 시장 점유율 | 1위 (~40%) | 3위 (~15%) | 2위 (~25%) |
| 강점 | AWS 생태계, Karpenter | K8s 원조, Autopilot, TPU | 엔터프라이즈, Windows, 무료 CP |
다음 질문에 순서대로 답해보라:
Q1. 이미 주력으로 쓰는 클라우드가 있는가?
있다면 → 그 클라우드의 관리형 K8s를 쓰라. 네트워크, IAM, 스토리지, 모니터링이 모두 네이티브로 통합되어 있어 운영이 압도적으로 편하다. 멀티클라우드 전략이 아닌 이상, 다른 클라우드의 K8s를 일부러 선택할 이유가 없다.
Q2. 클라우드를 새로 시작한다면?
Q3. 팀의 경험은?
Airbnb는 2019~2021년에 걸쳐 EC2 기반 인프라를 EKS로 전환했다. 수천 명의 엔지니어가 사용하는 내부 플랫폼을 K8s 위에 구축했다.
핵심 성과:
이전 글에서 다룬 Spotify의 1,800개 마이크로서비스는 GKE 위에서 돌아간다. Google Cloud와 K8s의 조합을 선택한 이유:
세계 최대 컨테이너 해운 회사 Maersk(진짜 컨테이너를 운반하는 회사!)는 AKS를 사용한다. 전 세계 물류 시스템을 Azure 위의 K8s로 운영한다.
선택 이유: 기존에 Microsoft 365와 Azure AD를 전사적으로 사용하고 있었기 때문에, AKS와의 통합이 자연스러웠다.
이론상으로 K8s는 어디서든 같은 API를 제공한다. 하지만 현실에서 멀티클라우드 K8s는 훨씬 복잡하다:
K8s의 Deployment, Service, Pod 같은 핵심 리소스는 이식 가능하지만, 실제 프로덕션 환경에서 쓰는 클라우드 연동 부분은 이식이 어렵다.
진짜 멀티클라우드가 필요하다면:
GKE Autopilot, EKS Fargate, AKS의 가상 노드 — 모든 사업자가 "워커 노드도 신경 쓰지 마라" 방향으로 진화하고 있다. 2026년의 관리형 K8s는 "컨트롤 플레인 관리형"에서 **"전체 클러스터 관리형"**으로 전환 중이다.
GPU/TPU 스케줄링, 모델 서빙 자동화, 학습 작업 큐잉 — AI 워크로드를 위한 K8s 확장 기능이 빠르게 성숙하고 있다. 모든 3사가 AI를 최우선 투자 영역으로 두고 있다.
K8s에서의 비용 추적이 어렵다는 것이 오랜 과제였다. Kubecost, OpenCost 같은 도구가 Pod/네임스페이스/팀 단위의 비용을 분석해 준다. 모든 관리형 서비스가 비용 분석 기능을 강화하고 있다.
관리형 쿠버네티스 서비스를 선택하는 것은 도구를 고르는 것처럼 보이지만, 실제로는 팀의 역량과 비즈니스 요구에 맞는 추상화 수준을 고르는 것이다.
이 시리즈를 관통하는 선택지를 정리하면:
| 팀 상황 | 추천 | 이유 |
|---|---|---|
| 인프라 인력 0명, 빠르게 시작 | ECS + Fargate | 가장 낮은 운영 부담 |
| AWS 중심, K8s 필요 | EKS + 관리형 노드 + Karpenter | AWS 통합 + 비용 최적화 |
| AI/ML 집약, 최신 K8s | GKE Autopilot | TPU, 자동 노드 관리 |
| .NET/Windows, 엔터프라이즈 | AKS | AD 통합, Windows 지원, 무료 CP |
| 멀티클라우드 필수 | 각 클라우드 관리형 + GitOps | Argo CD로 통합 배포 |
| 온프레미스 필수 | K8s 직접 운영 or Rancher | 규제 요구 충족 |
핵심은 이것이다: **"어떤 K8s가 최고인가?"가 아니라 "우리 팀이 무엇을 만들어야 하고, 인프라에 얼마나 투자할 수 있는가?"**가 올바른 질문이다.
코어닷투데이가 AI 아르스 키오스크를 클라우드와 엣지에 동시에 배포하는 것, Sharp-PINN을 고객사의 다양한 환경에 맞춤 배포하는 것 — 이런 유연한 배포가 가능한 것은, 컨테이너와 오케스트레이션이라는 표준 위에 서 있기 때문이다. 어떤 관리형 서비스를 쓰든, 그 아래의 쿠버네티스가 제공하는 이식성은 동일하다.