coredot.today
블로그로 돌아가기

#트랜스포머

5개의 포스트

Attention Is Not What You Need: 어텐션 없이도 AI가 '생각'할 수 있다면?
기술어텐션트랜스포머
2026.03.24

Attention Is Not What You Need: 어텐션 없이도 AI가 '생각'할 수 있다면?

2017년, 구글은 'Attention Is All You Need'로 AI 혁명을 열었다. 2025년 12월, 한 연구자가 같은 구조에 정면으로 반기를 든다 — 'Attention Is Not What You Need.' 어텐션 없이 기하학적 다양체 위에서 추론하는 새로운 시퀀스 모델링 패러다임을 해부한다.

코어닷투데이37
RT-DETR 완전 이해: DETR가 YOLO를 이긴 날 — 실시간 트랜스포머 검출의 혁명
기술객체 검출논문 리뷰
2025.11.04

RT-DETR 완전 이해: DETR가 YOLO를 이긴 날 — 실시간 트랜스포머 검출의 혁명

NMS 없이 실시간으로 — YOLO의 왕좌에 도전한 최초의 실시간 엔드투엔드 트랜스포머 검출기 RT-DETR가 어떻게 탄생했고, 왜 객체 검출의 패러다임을 바꾸고 있는지를 두 편의 논문과 함께 풀어본다.

코어닷투데이53
셀프 어텐션의 모든 것: 단어들이 서로를 바라보는 법
기술셀프 어텐션트랜스포머
2025.08.12

셀프 어텐션의 모든 것: 단어들이 서로를 바라보는 법

2016년 '같은 문장 안에서 단어끼리 서로를 바라보게 하자'는 아이디어가 등장했다. 1년 뒤 트랜스포머가 이를 핵심 엔진으로 삼았고, GPT부터 AlphaFold까지 모든 현대 AI의 심장이 되었다. 셀프 어텐션의 탄생, 작동 원리, 변형, 그리고 미래를 추적한다.

코어닷투데이26
Attention의 모든 것: '집중'이 AI의 역사를 바꾸기까지
기술어텐션트랜스포머
2025.08.05

Attention의 모든 것: '집중'이 AI의 역사를 바꾸기까지

2014년, 한 박사과정생이 '신경망에게 집중력을 주자'는 아이디어로 번역의 벽을 넘었다. 3년 뒤, 8명의 구글 연구자가 '집중만 있으면 된다'고 선언했다. Attention 메커니즘의 역사, 직관적 이해, 그리고 트랜스포머 혁명의 전 과정을 추적한다.

코어닷투데이30
Mixture of Experts 완전 해부: 1.8조 파라미터인데 왜 빠른가
기술MoEMixture of Experts
2025.07.15

Mixture of Experts 완전 해부: 1.8조 파라미터인데 왜 빠른가

GPT-4는 1.8조 파라미터지만 추론 시 222B만 활성화된다. 어떻게 가능한가? 1991년 MIT에서 시작된 '전문가 혼합' 아이디어가 34년 뒤 모든 프론티어 AI 모델의 핵심 아키텍처가 되기까지 — Expert의 정체, 라우팅의 작동 원리, 실전 사례와 논란까지 완전 해부한다.

코어닷투데이29