#LLM
44개의 포스트

Temperature 특집: AI의 '창의성 다이얼'을 과학적으로 돌리는 법 — TURN 알고리즘과 멀티샘플 추론의 최적 온도
ChatGPT에 같은 질문을 여러 번 하면 매번 다른 답이 나온다. 이 '랜덤함'을 조절하는 핵심 파라미터가 Temperature다. 2025년 ICML에서 발표된 TURN 알고리즘은 라벨 데이터 없이 모델별 최적 Temperature를 자동으로 찾아내는 방법을 제시했다. 요리사의 불 조절처럼, AI도 '딱 맞는 온도'가 있다.

튜닝할 것인가, 말 것인가: LLM에 내 데이터를 연결하는 완전 가이드
프롬프트 엔지니어링, RAG, SFT, RLHF, 증류 — LLM에 내 데이터를 연결하는 5가지 방법의 역사부터 2026년 현재의 활용법까지. 셰익스피어의 질문을 빌려, AI 시대의 가장 실용적인 선택지를 정리한다.

TurboQuant 특집: AI의 기억을 6배로 압축하는 수학의 마법
Google Research가 ICLR 2026에서 발표한 TurboQuant — AI 모델의 메모리를 6배 줄이면서 정확도 손실은 제로에 가까운 압축 알고리즘의 원리를 역사적 맥락부터 수학적 증명까지 풀어본다.

EventRAG 완전 해부 — AI가 '사건의 흐름'을 이해하는 법 (ACL 2025)
전통 RAG는 왜 뉴스, 역사, 법률 문서를 제대로 이해하지 못하는가? ACL 2025에서 발표된 EventRAG는 이벤트 지식 그래프(EKG)로 이 문제를 해결한다. 사건의 시간 순서, 인과 관계, 다중 문서 추론까지 — '사건 중심' RAG의 모든 것.

논문을 특허로 바꾸는 AI — FlowPlan-G2P 논문 완전 해부
매년 350만 건의 특허가 출원되지만, 한 건당 수천만 원의 변리사 비용이 든다. FlowPlan-G2P는 논문을 특허 명세서로 변환하는 3단계 구조적 프레임워크로, Llama-4급 오픈 모델이 Claude-4.5를 2배 이상 압도하는 성과를 냈다. 핵심 아이디어부터 '메트릭 패러독스'까지, 이 논문이 왜 중요한지 완전히 해부한다.

Scaling Laws 특집: AI에 돈을 쏟으면 얼마나 똑똑해질까 — 예측 가능해진 AI의 성장 법칙
AI 모델에 10배의 자원을 투입하면 성능이 얼마나 오를까? 2020년 Kaplan의 법칙은 '모델을 키워라'고 답했고, 2022년 Chinchilla는 '데이터를 키워라'로 뒤집었다. 수십억 달러 투자를 좌우하는 두 법칙의 탄생, 충돌, 그리고 2026년의 새로운 스케일링까지를 추적한다.

AI에게 스킬이 필요한 이유: 논문에서 프로토콜까지, 도구를 쥔 AI의 진화
수학 올림피아드를 푸는 AI가 오늘 날씨를 모른다. LLM의 구조적 한계에서 출발해, Toolformer·ReAct·Voyager 등 핵심 논문의 원리를 풀어보고, Function Calling에서 MCP·스킬 시스템까지 이어지는 산업의 대응을 추적한다.

MCP(Model Context Protocol) 완전 이해 — AI 세계의 USB-C (Part 1)
AI가 외부 세계와 소통하는 표준 규격, MCP. 왜 이런 개념이 등장했고, 왜 지금 중요한지를 USB-C 비유와 풍부한 사례로 쉽게 설명합니다.

RAG 완전 이해: LLM은 왜 거짓말을 하고, 검색은 어떻게 이를 바로잡는가
1000권을 외운 천재가 왜 어제 환율을 틀리는지, 그리고 '답하기 전에 먼저 찾아봐'라는 단순한 아이디어가 어떻게 AI의 가장 중요한 아키텍처 패턴이 되었는지를 논문과 사례로 풀어본다.

Amazon Bedrock 완전 정복: AI 모델을 '골라 쓰는' 시대의 시작
GPU를 사서 모델을 학습시키던 시대에서, API 한 줄로 세계 최고의 AI 모델을 바로 쓰는 시대로. Bedrock이 왜 탄생했고, 어떤 모델을 제공하며, 직접 호스팅·OpenAI API·Azure OpenAI와 무엇이 다른지를 실전 관점에서 풀어본다.

AutoHarness 논문 해설 — AI가 스스로 '규칙 위반 방지 코드'를 만든다
Gemini-2.5-Flash 체스 대회 패배의 78%가 '반칙'이었다. Google DeepMind의 AutoHarness 논문은 LLM이 스스로 규칙 검증 코드를 작성해 이 문제를 해결한다. 작은 모델이 큰 모델을 이기는 역전극의 비밀.

Transformer 특집: 순서를 기억하는 기계에서 모든 것을 한눈에 보는 기계로
RNN의 순차 처리 한계에서 Attention의 탄생, 그리고 'Attention Is All You Need' 한 편의 논문이 GPT, BERT, 오늘의 LLM 시대 전부를 만들어낸 이야기를 수식과 사례로 풀어본다.