#LLM

45개의 포스트

2026.04.07

RAFT 특집: 시험 공부하듯 AI를 훈련시키는 법 — RAG와 파인튜닝의 황금 교차점

RAG만으로는 부족하고, 파인튜닝만으로는 한계가 있다. UC Berkeley가 제안한 RAFT는 '오픈북 시험 준비'라는 직관적 비유로 두 기법을 결합한다. 7B 모델이 GPT-3.5를 이기는 비결, 방해 문서 훈련과 인용 기반 추론의 원리를 파헤친다.

코어닷투데이51분

Temperature 특집: AI의 '창의성 다이얼'을 과학적으로 돌리는 법 — TURN 알고리즘과 멀티샘플 추론의 최적 온도

인사이트TemperatureTURN

2026.04.07

Temperature 특집: AI의 '창의성 다이얼'을 과학적으로 돌리는 법 — TURN 알고리즘과 멀티샘플 추론의 최적 온도

ChatGPT에 같은 질문을 여러 번 하면 매번 다른 답이 나온다. 이 '랜덤함'을 조절하는 핵심 파라미터가 Temperature다. 2025년 ICML에서 발표된 TURN 알고리즘은 라벨 데이터 없이 모델별 최적 Temperature를 자동으로 찾아내는 방법을 제시했다. 요리사의 불 조절처럼, AI도 '딱 맞는 온도'가 있다.

코어닷투데이48분

기술LLMRAG

2026.04.07

튜닝할 것인가, 말 것인가: LLM에 내 데이터를 연결하는 완전 가이드

프롬프트 엔지니어링, RAG, SFT, RLHF, 증류 — LLM에 내 데이터를 연결하는 5가지 방법의 역사부터 2026년 현재의 활용법까지. 셰익스피어의 질문을 빌려, AI 시대의 가장 실용적인 선택지를 정리한다.

코어닷투데이60분

기술TurboQuant벡터양자화

2026.04.05

TurboQuant 특집: AI의 기억을 6배로 압축하는 수학의 마법

Google Research가 ICLR 2026에서 발표한 TurboQuant — AI 모델의 메모리를 6배 줄이면서 정확도 손실은 제로에 가까운 압축 알고리즘의 원리를 역사적 맥락부터 수학적 증명까지 풀어본다.

코어닷투데이38분

EventRAG 완전 해부 — AI가 '사건의 흐름'을 이해하는 법 (ACL 2025)

기술EventRAGRAG

2026.04.03

EventRAG 완전 해부 — AI가 '사건의 흐름'을 이해하는 법 (ACL 2025)

전통 RAG는 왜 뉴스, 역사, 법률 문서를 제대로 이해하지 못하는가? ACL 2025에서 발표된 EventRAG는 이벤트 지식 그래프(EKG)로 이 문제를 해결한다. 사건의 시간 순서, 인과 관계, 다중 문서 추론까지 — '사건 중심' RAG의 모든 것.

코어닷투데이30분

논문 리뷰FlowPlan-G2P특허 자동 생성

2026.03.22

논문을 특허로 바꾸는 AI — FlowPlan-G2P 논문 완전 해부

매년 350만 건의 특허가 출원되지만, 한 건당 수천만 원의 변리사 비용이 든다. FlowPlan-G2P는 논문을 특허 명세서로 변환하는 3단계 구조적 프레임워크로, Llama-4급 오픈 모델이 Claude-4.5를 2배 이상 압도하는 성과를 냈다. 핵심 아이디어부터 '메트릭 패러독스'까지, 이 논문이 왜 중요한지 완전히 해부한다.

코어닷투데이45분

Scaling Laws 특집: AI에 돈을 쏟으면 얼마나 똑똑해질까 — 예측 가능해진 AI의 성장 법칙

인사이트Scaling LawsKaplan

2026.03.20

Scaling Laws 특집: AI에 돈을 쏟으면 얼마나 똑똑해질까 — 예측 가능해진 AI의 성장 법칙

AI 모델에 10배의 자원을 투입하면 성능이 얼마나 오를까? 2020년 Kaplan의 법칙은 '모델을 키워라'고 답했고, 2022년 Chinchilla는 '데이터를 키워라'로 뒤집었다. 수십억 달러 투자를 좌우하는 두 법칙의 탄생, 충돌, 그리고 2026년의 새로운 스케일링까지를 추적한다.

코어닷투데이58분

AI에게 스킬이 필요한 이유: 논문에서 프로토콜까지, 도구를 쥔 AI의 진화

인사이트AI 스킬Tool Use

2026.03.14

AI에게 스킬이 필요한 이유: 논문에서 프로토콜까지, 도구를 쥔 AI의 진화

수학 올림피아드를 푸는 AI가 오늘 날씨를 모른다. LLM의 구조적 한계에서 출발해, Toolformer·ReAct·Voyager 등 핵심 논문의 원리를 풀어보고, Function Calling에서 MCP·스킬 시스템까지 이어지는 산업의 대응을 추적한다.

코어닷투데이62분

MCP(Model Context Protocol) 완전 이해 — AI 세계의 USB-C (Part 1)

기술MCPAI

2026.03.11

MCP(Model Context Protocol) 완전 이해 — AI 세계의 USB-C (Part 1)

AI가 외부 세계와 소통하는 표준 규격, MCP. 왜 이런 개념이 등장했고, 왜 지금 중요한지를 USB-C 비유와 풍부한 사례로 쉽게 설명합니다.

코어닷투데이34분

RAG 완전 이해: LLM은 왜 거짓말을 하고, 검색은 어떻게 이를 바로잡는가

기술RAGLLM

2026.03.04

RAG 완전 이해: LLM은 왜 거짓말을 하고, 검색은 어떻게 이를 바로잡는가

1000권을 외운 천재가 왜 어제 환율을 틀리는지, 그리고 '답하기 전에 먼저 찾아봐'라는 단순한 아이디어가 어떻게 AI의 가장 중요한 아키텍처 패턴이 되었는지를 논문과 사례로 풀어본다.

코어닷투데이35분

Amazon Bedrock 완전 정복: AI 모델을 '골라 쓰는' 시대의 시작

기술BedrockAWS

2026.03.01

Amazon Bedrock 완전 정복: AI 모델을 '골라 쓰는' 시대의 시작

GPU를 사서 모델을 학습시키던 시대에서, API 한 줄로 세계 최고의 AI 모델을 바로 쓰는 시대로. Bedrock이 왜 탄생했고, 어떤 모델을 제공하며, 직접 호스팅·OpenAI API·Azure OpenAI와 무엇이 다른지를 실전 관점에서 풀어본다.

코어닷투데이30분

AutoHarness 논문 해설 — AI가 스스로 '규칙 위반 방지 코드'를 만든다

AI 논문AutoHarnessAI 에이전트

2026.02.27

AutoHarness 논문 해설 — AI가 스스로 '규칙 위반 방지 코드'를 만든다

Gemini-2.5-Flash 체스 대회 패배의 78%가 '반칙'이었다. Google DeepMind의 AutoHarness 논문은 LLM이 스스로 규칙 검증 코드를 작성해 이 문제를 해결한다. 작은 모델이 큰 모델을 이기는 역전극의 비밀.

코어닷투데이46분