TECH BLOG
기술 블로그
AI 기술 인사이트와 엔지니어링 경험을 공유합니다.
ALL POSTS
모든 포스트

NPU 완전 이해: AI가 내 노트북 안으로 들어오다 — GPU도 아닌, CPU도 아닌, 그 세 번째 칩
CPU는 만능이고 GPU는 그래픽이다. 그렇다면 NPU는? AI 연산만을 위해 태어난 세 번째 칩이 왜 2026년 모든 PC에 들어가는지, Google TPU부터 GPT-OSS-120B 로컬 실행까지 — NPU의 모든 것.

AWS CloudTrail 완전 정복: 클라우드의 'CCTV'가 모든 행동을 기록하는 법
누가, 언제, 어디서, 무엇을 했는가 — CloudTrail은 AWS에서 일어나는 모든 API 호출을 기록하는 '블랙박스'다. 보안 사고 추적부터 규제 준수, 비용 분석까지 — CloudTrail이 왜 필수이고 어떻게 활용하는지를 실전 사례와 함께 풀어본다.

LightRAG 완전 가이드: GraphRAG의 1/100 비용으로 지식 그래프 검색을 실현하다
GraphRAG는 강력하지만 비싸다. LightRAG는 커뮤니티 계층을 없애고 듀얼 레벨 검색을 도입하여, 쿼리당 토큰 사용량을 6000배 줄이면서도 유사한 품질을 달성한다. 왜 이런 접근법이 나왔는지, 어떻게 작동하는지, 언제 써야 하는지를 논문과 사례로 풀어본다.

PINN은 왜 자꾸 학습에 실패하는가 — Loss Landscape 관점으로 다시 읽는 훈련의 핵심
PINN은 왜 물리식을 알고도 자주 무너질까? ICML 2024의 대표 논문을 중심으로, Hessian 스펙트럼, ill-conditioning, Adam-L-BFGS-NNCG의 역할, 그리고 2026년 현재 PINN 최적화 문헌사의 흐름까지 깊고 쉽게 해설한다.

GraphRAG 완전 가이드: 문서를 그래프로 바꾸면 AI가 보지 못하던 것을 본다
기본 RAG가 놓치는 '전체 그림'을 어떻게 볼 것인가. Microsoft Research의 GraphRAG 논문을 중심으로, 지식 그래프가 왜 필요한지부터 실전 비용 분석, 선택 가이드까지 — 논문과 실무 사례로 풀어본다.

SLM 완전 가이드: 작은 AI가 큰 AI를 이기는 시대 — 비용 100분의 1, 성능 80%
프로덕션 AI의 80%는 노트북에서 돌리는 작은 모델로 충분하다. 비용은 100분의 1, 프라이버시는 완벽. DistilBERT에서 Phi-4 Mini까지 — SLM이 LLM을 대체하는 이유와 방법.

Advanced RAG: 기본 RAG의 한계를 넘는 실전 개선 기법 7가지
기본 RAG를 실전에 배포하면 마주치는 문제들 — 엉뚱한 문서가 검색되고, 핵심이 잘려나가고, 답변 품질이 들쭉날쭉하다. 청킹 전략부터 하이브리드 검색, 리랭킹까지, 실무에서 바로 적용할 수 있는 개선 기법을 하나씩 풀어본다.

AWS IAM 완전 정복: '누가, 무엇을, 어디서 할 수 있는가'를 결정하는 기술
AWS에서 발생하는 보안 사고의 대부분은 IAM 설정 실수다. '최소 권한 원칙'이 왜 중요하고, 사용자·역할·정책이 어떻게 작동하며, GitHub에 노출된 IAM 키가 어떤 참사를 불러오는지 — 클라우드 보안의 기반인 IAM을 실전 사례와 함께 풀어본다.

8억 명을 감당하는 단 하나의 데이터베이스 — OpenAI는 어떻게 PostgreSQL을 극한까지 밀어붙였나
ChatGPT 8억 사용자를 단일 PostgreSQL 프라이머리로 지탱하는 OpenAI의 아키텍처를 해부합니다. 40년 된 오픈소스 DB가 AI 시대의 최전선에 선 이유를 역사부터 현재까지 풀어냅니다.