coredot.today
블로그로 돌아가기

#객체 검출

12개의 포스트

이미지 객체 인식 완전 가이드: 컴퓨터에게 '보는 법'을 가르친 25년 — 공장에서 자율주행까지
기술객체 검출컴퓨터 비전
2026.04.06

이미지 객체 인식 완전 가이드: 컴퓨터에게 '보는 법'을 가르친 25년 — 공장에서 자율주행까지

얼굴 검출에서 시작해 반도체 결함 검사까지 — 이미지 객체 인식의 역사, 네 가지 핵심 태스크, 그리고 제조·자동차·식품 산업에서의 실전 활용법을 풍부한 사례와 함께 완전 해설한다.

코어닷투데이34
EdgeCrafter 완전 이해: 작은 ViT의 반란 — 태스크 특화 증류로 엣지에서 검출·분할·포즈를 동시에
기술객체 검출논문 리뷰
2026.04.02

EdgeCrafter 완전 이해: 작은 ViT의 반란 — 태스크 특화 증류로 엣지에서 검출·분할·포즈를 동시에

범용 사전학습이 소형 ViT에게는 독이 된다? — DINOv3를 태스크 특화 교사로 변환하여 10M 파라미터 ViT가 검출 51.7%, 분할 43.0%, 포즈 68.9% AP를 달성한 EdgeCrafter의 이야기.

코어닷투데이32
DEIMv2 완전 이해: DINOv3와 만난 실시간 검출 — 0.5M에서 50M까지, 하나의 프레임워크
기술객체 검출논문 리뷰
2026.03.24

DEIMv2 완전 이해: DINOv3와 만난 실시간 검출 — 0.5M에서 50M까지, 하나의 프레임워크

0.49M 파라미터의 초소형 Atto부터 57.8% AP의 거대 X까지 — DINOv3의 강력한 표현력을 STA로 실시간에 녹여낸 DEIMv2가 8개 스케일로 GPU, 엣지, 모바일을 동시에 정복한 이야기.

코어닷투데이32
멀티모달 AI 완전 가이드: 텍스트·이미지·음성·영상을 동시에 이해하는 AI의 모든 것
기술멀티모달 AICLIP
2026.03.19

멀티모달 AI 완전 가이드: 텍스트·이미지·음성·영상을 동시에 이해하는 AI의 모든 것

CLIP이 이미지와 텍스트를 하나의 공간에 넣었고, GPT-4V가 LLM에 눈을 달았고, RT-2가 로봇에게 손을 줬다. 2026년, AI는 인간처럼 보고 듣고 말하고 행동한다 — 멀티모달 AI의 역사, 원리, 그리고 현재.

코어닷투데이22
CNN 완전 이해: 고양이 한 마리가 바꾼 컴퓨터 비전의 역사
기술CNN딥러닝
2026.02.26

CNN 완전 이해: 고양이 한 마리가 바꾼 컴퓨터 비전의 역사

고양이 뉴런 실험에서 자율주행까지 — 합성곱 신경망이 어떻게 탄생했고, 왜 작동하며, 2026년에도 여전히 중요한지를 논문과 사례로 풀어본다.

코어닷투데이85
RT-DETRv4 완전 이해: 거인의 지혜를 빌리다 — 비전 파운데이션 모델이 실시간 검출을 바꾸는 법
기술객체 검출논문 리뷰
2026.02.10

RT-DETRv4 완전 이해: 거인의 지혜를 빌리다 — 비전 파운데이션 모델이 실시간 검출을 바꾸는 법

추론 비용 0으로 DINOv3의 지혜를 실시간 검출기에 주입하다 — Deep Semantic Injector와 Gradient-guided Adaptive Modulation으로 YOLO13, D-FINE, DEIM을 모두 넘어선 RT-DETRv4의 이야기.

코어닷투데이38
SAM 2 완전 해부: 이미지를 넘어 영상 분할까지 — 자율주행·의료·VFX의 혁명
기술SAM 2Segment Anything
2025.12.20

SAM 2 완전 해부: 이미지를 넘어 영상 분할까지 — 자율주행·의료·VFX의 혁명

클릭 한 번으로 이미지의 모든 것을 분할하던 SAM이, 이제 영상의 모든 프레임을 관통한다. SAM 2의 메모리 아키텍처, 50.9K 비디오 데이터셋, 그리고 자율주행·의료·VFX까지 — 비디오 이해 AI의 모든 것.

코어닷투데이32
D-FINE 완전 이해: 바운딩 박스를 '확률 분포'로 다듬다 — 실시간 검출의 새로운 경지
기술객체 검출논문 리뷰
2025.12.18

D-FINE 완전 이해: 바운딩 박스를 '확률 분포'로 다듬다 — 실시간 검출의 새로운 경지

고정된 좌표 대신 확률 분포를 반복 정제하고, 깊은 층의 지혜를 얕은 층에 전수하는 자기 증류까지 — D-FINE이 YOLO와 RT-DETR를 모두 넘어서며 실시간 객체 검출의 새로운 기준을 세운 이야기.

코어닷투데이44
EfficientNet 완전 이해: 작은 것이 아름답다 — AI 효율 혁명의 시작
기술EfficientNet모델 스케일링
2025.11.11

EfficientNet 완전 이해: 작은 것이 아름답다 — AI 효율 혁명의 시작

'더 크게'가 아니라 '더 똑똑하게' — 모델 크기를 키우는 세 가지 차원을 동시에 최적화하는 Compound Scaling이 어떻게 AI 효율 혁명을 일으켰는지를 논문과 사례로 풀어본다.

코어닷투데이80
RT-DETR 완전 이해: DETR가 YOLO를 이긴 날 — 실시간 트랜스포머 검출의 혁명
기술객체 검출논문 리뷰
2025.11.04

RT-DETR 완전 이해: DETR가 YOLO를 이긴 날 — 실시간 트랜스포머 검출의 혁명

NMS 없이 실시간으로 — YOLO의 왕좌에 도전한 최초의 실시간 엔드투엔드 트랜스포머 검출기 RT-DETR가 어떻게 탄생했고, 왜 객체 검출의 패러다임을 바꾸고 있는지를 두 편의 논문과 함께 풀어본다.

코어닷투데이53
YOLO 완전 이해: 한 번만 봐! — 실시간 객체 검출의 혁명
기술객체 검출논문 리뷰
2025.09.15

YOLO 완전 이해: 한 번만 봐! — 실시간 객체 검출의 혁명

'느리지만 정확하게'가 아니라 '한 번에 전부' — 객체 검출을 회귀 문제로 재정의하여 실시간 처리를 가능하게 한 YOLO가 어떻게 탄생했고, 왜 10년이 지난 지금도 세상을 바꾸고 있는지를 논문과 사례로 풀어본다.

코어닷투데이69
CLIP 논문 해부: 이미지와 언어를 잇는 다리를 놓다
기술CLIP멀티모달 AI
2025.07.15

CLIP 논문 해부: 이미지와 언어를 잇는 다리를 놓다

4억 장의 이미지-텍스트 쌍으로 학습하고, 한 번도 본 적 없는 ImageNet을 76.2% 정확도로 분류한 모델. DALL-E, Stable Diffusion, Midjourney — 모든 이미지 생성 AI의 눈이 된 CLIP 논문을 해부한다.

코어닷투데이25