블로그로 돌아가기

#AWQ

1개의 포스트

양자화(Quantization) 완전 해부: 70B 모델을 내 노트북에서 돌리는 마법의 원리

기술양자화Quantization

양자화(Quantization) 완전 해부: 70B 모델을 내 노트북에서 돌리는 마법의 원리

280GB짜리 AI 모델을 35GB로 줄이면서 성능은 97%를 유지한다. 어떻게? FP32에서 INT4까지, BinaryConnect에서 BitNet까지 — 양자화의 역사, 원리, 실전 기법, 그리고 안전성 문제까지 총정리.

코어닷투데이24분