#LLM 추론

4개의 포스트

기술Test-Time ComputeProcess Verifier

2026.02.01

불완전한 검증자 길들이기: 백트래킹이 AI 추론을 구하는 법

AI가 한 단계씩 추론할 때, 불완전한 검증자의 작은 오류가 눈덩이처럼 불어나는 문제를 어떻게 해결할까? 1989년 이론 컴퓨터과학의 아이디어가 2025년 LLM 디코딩에서 부활한 이야기.

코어닷투데이45분

추측 디코딩 완전 정복 — EAGLE-3, SSD, 그리고 LLM 추론 가속의 최전선

인사이트추측 디코딩Speculative Decoding

2025.12.27

추측 디코딩 완전 정복 — EAGLE-3, SSD, 그리고 LLM 추론 가속의 최전선

LLM은 왜 느린가? 98%의 시간을 메모리 전송에 낭비하기 때문이다. 추측 디코딩은 '작은 모델이 초안을 쓰고 큰 모델이 한꺼번에 검증'하여 출력 품질 손실 없이 2~6배 속도를 달성한다. EAGLE-3, Mirror-SD, Saguaro까지 — 2026년 LLM 추론 가속의 모든 것.

코어닷투데이26분

LLM + 시맨틱 웹: AI의 '감'을 '논리'로 바꾸는 법 — Structured Decomposition 논문 해부

기술LLM 추론시맨틱 웹

2025.12.06

LLM + 시맨틱 웹: AI의 '감'을 '논리'로 바꾸는 법 — Structured Decomposition 논문 해부

GPT-5도 규칙을 일관되게 적용하지 못한다. 이 논문은 LLM을 '온톨로지 채우기 엔진'으로 재정의하고, SWRL 추론기가 규칙을 결정론적으로 적용하는 신경-상징 통합 프레임워크를 제안한다. 법률, 의학, 과학 3개 도메인에서 11개 모델로 검증한 결과를 해부한다.

코어닷투데이30분

AI 법률 추론의 미래 — SOLAR: 검증 가능한 법률 추론을 위한 멀티 에이전트 프레임워크

기술법률 AI멀티에이전트

2025.12.05

AI 법률 추론의 미래 — SOLAR: 검증 가능한 법률 추론을 위한 멀티 에이전트 프레임워크

GPT-4o가 세금 계산 문제에서 18.8%의 정확도를 보이는 동안, 추론 모델 o4-mini는 91.7%를 기록한다. 하지만 비용이 수십 배 비싸다. SOLAR 프레임워크는 저비용 모델의 정확도를 76.4%로 끌어올려, 이 격차를 68.2%에서 5.9%로 줄인다.

코어닷투데이30분