블로그로 돌아가기

#AI 안전성
2개의 포스트

기술기계적 해석가능성Mechanistic Interpretability
2026.02.08기계적 해석가능성 특집: AI의 '블랙박스'를 열어본 과학자들 — MIT 2026 10대 기술의 이유
MIT가 2026 10대 기술로 선정한 '기계적 해석가능성'은 AI의 블랙박스를 열고 내부 회로를 추적하는 기술이다. 금문교에 반한 Claude, 거짓말하는 AI를 잡아내는 법, 환각의 메커니즘까지 — AI를 MRI 찍듯 들여다보는 시대가 열리고 있다.
코어닷투데이32분

인사이트Constitutional AIAI 안전성
2025.11.17Constitutional AI: AI에게 '헌법'을 주면 스스로 착해질 수 있을까?
인간 수만 명이 AI 답변을 채점하는 대신, AI에게 '헌법'을 주고 스스로 개선하게 한다면? Anthropic의 Constitutional AI가 AI 안전성의 패러다임을 바꾼 이야기.
코어닷투데이31분