PINNFP64Scientific MLPDEL-BFGSPhysics-Informed Learning과학 AI

FP64 is All You Need — PINN 실패 모드를 다시 생각하다

모두가 BF16과 FP8을 외치는 시대에, 한 논문은 정반대로 말한다. PINN의 유명한 실패 모드는 로컬 최솟값보다 '정밀도가 부족한 조기 정지'에 더 가깝다는 것. 이 도발적인 논문을 출발점으로, PINN의 역사와 실패 사례, FP64의 의미, 그리고 2026년 과학 AI에서 이 기술의 자리를 쉽고 깊게 풀어본다.

코어닷투데이2026-03-1340분

들어가며 — 모두가 숫자를 줄일 때, 이 논문은 숫자를 늘리라고 말했다

요즘 AI 업계의 분위기는 명확합니다. FP32도 무겁다, BF16으로 가자. 가능하면 FP8까지 내려가자. 대규모 언어모델도, 비전 모델도, 추론 시스템도 대체로 그 방향으로 발전해 왔습니다. 숫자를 덜 정밀하게 표현해도 성능이 크게 무너지지 않는 경우가 많았기 때문입니다.

그런데 2025년 NeurIPS에 채택된 한 논문은 완전히 반대 방향으로 외칩니다.

FP64 is All You Need: Rethinking Failure Modes in Physics-Informed Neural Networks

제목부터 도발적입니다. "정말 FP64만 있으면 되는 거야?"라는 반문이 먼저 나옵니다. 그런데 논문을 읽다 보면, 저자들이 단순히 "더 정밀하게 계산하면 좋다"는 상식적 이야기를 하는 게 아니라는 걸 알게 됩니다. 이들은 PINN(Physics-Informed Neural Network)의 유명한 실패 모드 자체를 다시 정의하자고 주장합니다.

기존 해석:

PINN은 종종 가짜 해(local minimum) 에 갇힌다.
그래서 더 좋은 아키텍처, 더 영리한 샘플링, 더 복잡한 가중치 조절이 필요하다.

이 논문의 해석:

많은 실패 모드는 새로운 골짜기에 갇힌 것이 아니라,
사실은 같은 골짜기 안에서 너무 일찍 멈춘 것일 수 있다.
그리고 그 조기 정지의 핵심 원인 중 하나가 FP32의 수치 정밀도 부족이다.

이 한 문장이 왜 큰 파장을 만드는지 이해하려면, 먼저 PINN이 왜 등장했고 왜 이렇게 많은 사람이 매달렸는지부터 봐야 합니다.

정밀도 스위치를 FP32에서 FP64로 올리는 순간, 안개 속에 가려진 PDE 해가 또렷해지는 과학 AI 편집 일러스트

이 글의 핵심 질문: PINN의 실패는 정말 "아이디어의 한계"일까요, 아니면 우리가 너무 빨리 "수렴했다"고 착각한 것일까요?

1장. 왜 사람들은 PINN에 그렇게 열광했을까?

편미분방정식(PDE)은 세상의 거의 모든 연속 현상을 설명합니다. 열이 퍼지고, 유체가 흐르고, 재료가 갈라지고, 전자기장이 변하고, 오염 물질이 확산하는 문제는 결국 PDE로 갑니다.

전통적으로는 FEM(유한요소법), FDM(유한차분법), FVM(유한체적법) 같은 수치해석 도구가 이 일을 맡았습니다. 이들은 강력하고 신뢰할 만하지만, 다음과 같은 대가가 있습니다.

메시를 짜야 한다.
기하 구조가 복잡해질수록 구현이 어려워진다.
역문제(inverse problem)나 파라미터 추정에서는 계산 비용이 폭증한다.
센서 데이터가 드문 현실 문제와 바로 결합하기가 번거롭다.

PINN이 매력적이었던 이유는 여기에 있습니다. 신경망을 함수 근사기로 쓰되, 손실함수 안에 물리 법칙을 직접 넣자는 발상이었기 때문입니다.

\mathcal{L}_{\text{PINN}} = \lambda_r \mathcal{L}_{\text{residual}} + \lambda_b \mathcal{L}_{\text{boundary}} + \lambda_d \mathcal{L}_{\text{data}}

쉽게 말하면:

데이터가 있으면 데이터도 맞추고
경계조건도 맞추고
PDE 잔차도 작게 만들어서
"겉으로만 맞는 함수"가 아니라 "물리적으로도 말이 되는 함수"를 배우자는 것입니다.

역사 한눈에 보기

PINN의 아이디어는 사실 2019년에 갑자기 하늘에서 떨어진 것이 아닙니다.

1998

Lagaris et al. — 신경망으로 미분방정식을 푸는 초기 아이디어 제시. 하지만 당시에는 자동미분과 GPU 생태계가 없어서 확장성이 약했다.

2017

Raissi et al. preprint — 현대 딥러닝 프레임워크 위에서 physics-informed deep learning을 체계화한다.

2019

Raissi, Perdikaris, Karniadakis — JCP 논문으로 PINN이 사실상 하나의 분야 이름이 된다.

2020~2026

성공 사례만큼이나 실패 사례와 개선 기법이 폭발적으로 늘어난다. adaptive weighting, causal training, domain decomposition, operator learning, hybrid solver가 이어진다.

여기서 중요한 enabling factor는 자동미분(autodiff) 입니다. 미분방정식을 신경망에 넣으려면 $\partial u/\partial x$ , $\partial^2 u/\partial x^2$ 같은 항을 계산해야 하는데, 2010년대 후반의 딥러닝 프레임워크는 이걸 비교적 자연스럽게 해냈습니다. 그래서 PINN은 "오래된 아이디어가 시대를 잘 만난 사례"에 가깝습니다.

왜 그렇게 유망해 보였나

PINN은 특히 다음 같은 문제에서 매력적이었습니다.

센서가 적은 역문제: 벽 내부 열전도율, 배터리 내부 확산계수, 지하 매질의 투수계수 추정
시뮬레이터-인더-루프 최적화: 설계 변수를 바꾸며 PDE를 반복적으로 풀어야 하는 문제
메시 생성이 귀찮거나 비싼 문제: 복잡한 기하와 moving boundary
데이터가 비싸고 물리는 아는 문제: 실험은 적고 지배 방정식은 분명한 경우

PDE를 푸는 세 가지 감각

전통 수치해석 FEM / FDM / FVM 정확도와 안정성은 강하다.
하지만 메시와 선형대수 비용이 크다.

순수 데이터 기반 DL Black-box Regressor 빠를 수 있다.
하지만 물리 위반을 막기 어렵다.

PINN Physics + NN 데이터가 적어도 물리를 넣을 수 있다.
문제는 훈련이 생각보다 자주 무너진다는 점이다.

문제는 마지막 줄입니다. PINN은 아이디어가 너무 예뻐서, 실제 훈련의 잔혹함이 늦게 보였다는 점입니다.

2장. PINN의 악명 높은 실패 모드란 무엇인가?

2021년 Krishnapriyan et al.이 유명하게 정리했듯, PINN은 종종 아주 이상한 방식으로 실패합니다.

PDE residual loss는 매우 작다.
경계조건도 어느 정도 맞는 것처럼 보인다.
그런데 실제 해와 비교하면 엉뚱하게 틀리다.

이건 학생이 시험지에 답을 다 쓴 것처럼 보이는데, 채점해 보면 논리 전개가 전부 틀린 상황과 비슷합니다. 더 정확히 말하면, PINN은 '문제의 분위기'는 맞추는데 '정답의 구조'는 놓치는 경우가 많다는 뜻입니다.

이게 왜 무서운가

일반적인 지도학습이라면 검증 오차가 바로 경고를 줍니다. 그러나 PINN은 종종 잔차 손실이 낮다는 이유로 안심하기 쉽습니다. 특히 ground truth가 없는 실제 공학 문제에서는 더욱 그렇습니다.

예를 들어 봅시다.

배터리 열관리 열 방정식을 PINN으로 풀고 있다고 합시다. 잔차는 작아 보이지만 내부 hotspot 위치가 조금만 틀려도 안전 여유 계산이 바뀝니다.
지하 유동 역문제 센서가 몇 개 안 되는 상황에서 투수계수를 추정하는 PINN이 잘못된 smooth solution으로 가라앉으면, 시추 위치나 주입 전략이 잘못될 수 있습니다.
재료 균열·상전이 균열 끝이나 상 경계는 고주파 성분과 급격한 변화가 많습니다. PINN이 여길 뭉개면, 전체적으로는 그럴듯해 보여도 핵심 물리는 놓칩니다.

왜 이런 일이 생긴다고 생각했나

PINN 문헌에서 널리 퍼져 있던 직관은 대략 이랬습니다.

손실 경관이 매우 험하다.
실패 모드는 잘못된 로컬 최솟값이다.
진짜 해로 가는 길 사이에 loss barrier가 있다.
따라서 더 좋은 architecture, 더 좋은 sampling, 더 좋은 weighting이 필요하다.

이 가설은 나름 설득력이 있었습니다. 실제로 이후 문헌은 이 방향으로 폭발했습니다.

adaptive weighting
gradient pathology 완화
causal training
resampling
PINNsFormer, PINNMamba, PirateNet 같은 구조적 유도 편향

문제는, 이번 FP64 논문이 이 전제를 정면으로 흔든다는 점입니다.

핵심 전환: 이 논문은 "실패 모드가 별도 골짜기일 것"이라는 가정을 버리고, 실패와 성공이 같은 basin 안에 있을 수 있다고 주장합니다.

3장. 이 논문이 던지는 도발 — 실패와 성공은 같은 골짜기에 있을지 모른다

논문의 가장 중요한 철학적 전환은 여기 있습니다.

기존 해석	이 논문의 해석	무슨 의미인가
Loss-Barrier Hypothesis 실패와 성공은 다른 basin에 있다	Same-Basin Hypothesis 실패와 성공은 같은 basin의 다른 위치다	문제는 탈출이 아니라 계속 전진하느냐일 수 있다
optimizer가 가짜 해에 갇힌다	optimizer가 너무 일찍 멈춘다	정밀도, stop criterion, optimizer 구현이 연구 주제로 올라온다
특화 아키텍처가 새로운 길을 만든다	특화 아키텍처가 기존 길을 더 오래 가게 해줄 수도 있다	architecture innovation을 다시 해석하게 만든다

이 가설을 뒷받침하기 위해 논문은 세 가지 단서를 제시합니다.

단서 1. 초기값을 아무리 바꿔도 계속 실패한다

논문은 convection 문제에서 2000개의 랜덤 초기화를 시도했는데, 계속 실패 패턴이 나타났다고 보고합니다. 만약 성공 basin과 실패 basin이 정말 분리되어 있다면, 운 좋게라도 성공 basin에 떨어지는 경우가 좀 나와야 합니다. 그런데 거의 항상 비슷한 실패가 반복됩니다.

이건 "운이 나빴다"보다 애초에 optimization이 중간에서 멈춘다는 해석 쪽에 더 잘 맞습니다.

단서 2. FP32 실패 지점에서 FP64로 바꾸고 계속 학습하면, 갑자기 살아난다

이 대목이 논문의 하이라이트입니다. 저자들은 FP32로 학습하다 실패한 파라미터에서 출발해, 정밀도만 FP64로 바꾸고 학습을 이어갑니다. 그러자 loss가 아주 조금 더 내려가고, 그 작은 추가 이동이 오차(error)의 급락으로 이어집니다.

즉, 높은 barrier를 뛰어넘은 게 아니라, 같은 평지 위에서 조금 더 걸어간 것처럼 보인다는 뜻입니다.

단서 3. loss는 평평한데 error는 가파르다

논문이 그리는 그림은 이렇습니다.

loss landscape: 생각보다 평평하고 연결돼 있다
error landscape: 진짜 해 근처에서 훨씬 가파르다

즉, 파라미터가 조금만 더 움직이면 error는 크게 줄 수 있는데, loss만 보고 있으면 "거의 변한 게 없는 것처럼" 보일 수 있습니다.

넓고 평평한 손실 평원 위에서 FP32 탐사선은 멈추고, FP64 탐사선은 좁은 성공 지점까지 더 전진하는 same-basin 비유 일러스트

이 비유는 아주 중요합니다. PINN 실패를 "벽에 막힘"이 아니라 "미세 이동을 못 읽어서 주행 종료"로 보면, 우리가 봐야 할 것은 아키텍처 이전에 수치 정밀도와 종료 조건이 됩니다.

4장. 이 논문이 제안한 PINN 훈련의 세 단계

논문은 PINN의 훈련을 세 단계로 나눕니다.

PINN의 세 단계 훈련 동역학

1단계Un-converged — loss도 크고 error도 큰 초기 상태. 아직 아무것도 제대로 모양이 안 잡힌다.

2단계Failure phase — loss는 거의 낮아졌는데 error는 여전히 크다. 가장 위험한 착시 구간이다.

3단계Success phase — loss와 error가 모두 낮아진다. 진짜 해에 가까워지는 구간이다.

중요한 포인트는 이것입니다.

성공하는 모델도 실패 phase를 통과할 수 있다.

즉, failure phase는 "영원한 종착역"이 아니라 지나가는 구간일 수 있습니다. 문제는 FP32 학습이 그 지점에서 멈춰 버린다는 것입니다.

이걸 직관적으로 이해하려면, 산을 오르는 게 아니라 긴 터널을 통과한다고 생각하면 쉽습니다.

입구는 혼란스럽다: un-converged
중간은 어두운데 꽤 조용하다: failure phase
출구 직전에서 갑자기 빛이 보인다: success

FP32는 터널 중간에서 "여기쯤이면 끝난 것 같은데?" 하고 멈추고, FP64는 조금 더 가서 출구를 본다는 그림입니다.

이 세 단계 관점은 이후 문헌을 읽는 방식도 바꿉니다. 예전에는 "왜 이 구조가 loss barrier를 넘게 만들지?"라고 생각했다면, 이제는 "왜 이 방법이 failure phase를 더 잘 통과하게 만들지?"로 질문이 바뀝니다.

5장. 그런데 왜 하필 FP32에서 멈출까?

여기서 논문은 더 구체적으로 들어갑니다. 많은 PINN 실험은 여전히 L-BFGS를 사용합니다. 이유는 간단합니다.

PDE residual에는 고차 미분 항이 들어간다.
그 결과 Hessian이 매우 ill-conditioned해지기 쉽다.
Adam 같은 1차 방법은 stiff direction에서 잘 안 나아간다.
L-BFGS는 curvature 정보를 간접적으로 써서 이 문제를 완화한다.

즉, PINN은 CV/NLP 모델처럼 "대충 Adam으로 오래 돌리면 된다"는 감각과 다릅니다. 애초에 수치해석 냄새가 강한 최적화 문제입니다.

논문이 짚는 메커니즘

저자들은 PyTorch류의 L-BFGS 구현에서 optimizer.step(closure) 내부에 inner loop가 있고, 이 inner loop가 gradient norm이나 parameter change 기준으로 멈춘다고 설명합니다.

논문에서 핵심으로 보는 지점은 이 부분입니다.

\varepsilon = \min\{\varepsilon > 0 \mid 1 + \varepsilon \neq 1\}

이 값이 바로 machine epsilon입니다.

FP32의 machine epsilon: 약 1.19 × 10⁻⁷
FP64의 machine epsilon: 약 2.22 × 10⁻¹⁶

논문은 자신들의 PINN 설정에서 tolerance_change = 1e-7이 FP32 정밀도와 충돌하고, 가중치 norm은 커지고 gradient norm은 작아지면서 업데이트가 사실상 underflow에 가까워진다고 해석합니다.

쉬운 비유로 바꿔보겠습니다.

비유 1. 자가용 계기판이 너무 거칠다

차는 아주 천천히 앞으로 움직이고 있다.
그런데 계기판이 1km 단위로만 표시된다.
200m, 300m, 400m 이동은 전부 "0km 이동"처럼 보인다.
그러면 운전자는 "더 안 움직이네, 도착했나 보다"라고 착각할 수 있다.

FP32는 이 계기판이 너무 거친 상황에 가깝습니다.

비유 2. 디지털 저울의 분해능이 부족하다

밀가루를 0.01g 단위로 재야 하는데
저울은 1g 단위까지만 읽힌다

무게가 실제로 바뀌어도, 숫자는 안 바뀝니다. 그 순간 멈춘 것처럼 보이는 착시가 생깁니다.

논문이 보여준 실제 수치

논문 Table 2에 따르면, 같은 vanilla PINN이라도 FP32와 FP64의 차이는 극단적입니다.

PDE	FP32 rRMSE	FP64 rRMSE	속도 변화	메모리 변화
Convection	0.7640	0.0072	0.29s → 0.32s / iter	1609MB → 2441MB
Reaction	0.9778	0.0502	0.26s → 0.29s / iter	1629MB → 2481MB
Wave	0.2837	0.0081	0.47s → 0.61s / iter	2295MB → 3845MB
Allen-Cahn	0.9662	0.0545	0.40s → 0.48s / iter	1975MB → 3167MB

숫자를 보면 메시지는 분명합니다.

오차는 엄청나게 줄었다.
속도는 10~30% 정도만 느려졌다.
메모리는 꽤 늘었다.

즉, 적어도 H100급 하드웨어에서는 "FP64는 너무 느려서 못 쓴다"는 통념이 이 논문 맥락에서는 성립하지 않습니다.

미세한 업데이트가 계기판 분해능 아래로 사라져 FP32 학습이 멈추는 장면을 그린 카툰 스타일 과학 일러스트

중요한 뉘앙스: 이 논문은 특정 optimizer 구현과 종료 기준이 정밀도와 어떻게 상호작용하는지를 보여준다. 따라서 제목을 문자 그대로 "무조건 FP64만 쓰면 끝"이라고 읽기보다는, 정밀도와 convergence criterion을 함께 설계하라는 메시지로 읽는 편이 더 정확하다.

6장. 결과는 얼마나 강력했나, 그리고 어디까지 믿어야 하나

이 논문이 화제를 모은 이유는 단순히 아이디어가 새로워서가 아니라, 결과가 너무 강했기 때문입니다. 저자들은 convection, reaction, wave, Allen-Cahn 네 가지 대표 failure-mode 문제에서 vanilla PINN + FP64가 크게 개선된다고 보입니다.

하지만 여기서 한 걸음 더 들어가 보면, 더 재밌는 이야기가 나옵니다.

"FP64면 최신 구조가 다 필요 없는가?"

논문 본문은 꽤 강하게 말합니다. 그러나 Table 1을 자세히 보면, 항상 모든 특화 구조를 이기는 것은 아닙니다.

예를 들어 reaction 문제에서는:

vanilla PINN + FP64의 rRMSE: 0.0502
PINNMamba의 rRMSE: 0.0213
PINNsFormer의 rRMSE: 0.0296

즉, reaction에서는 여전히 특화 구조가 더 좋습니다. 반대로 convection, wave, Allen-Cahn에서는 FP64 vanilla PINN이 압도적으로 좋아집니다.

이건 오히려 논문의 메시지를 더 흥미롭게 만듭니다.

이 논문은 "architecture는 무의미하다"를 증명한 것이 아니라, "precision은 architecture보다 훨씬 더 근본적인 변수일 수 있다"는 걸 보여준 것에 가깝다.

논문 이후 우리가 더 정직하게 말할 수 있는 것

PINN failure literature의 상당 부분은 수치 정밀도 문제를 과소평가했을 수 있다.
그렇다고 해서 모든 개선 기법이 무의미한 것은 아니다.
오히려 앞으로는
- 정밀도
- optimizer
- stopping criterion
- architecture
- sampling
- loss weighting

를 한 묶음의 시스템 설계 문제로 봐야 한다.

7장. 왜 이 개념이 중요한지, 사례로 체감해 보자

논문을 읽고 나면 많은 사람이 이렇게 생각합니다.

"그래서 그냥 FP64 켜면 되는 거네?"

그렇게 끝나면 이 논문을 반밖에 이해하지 못한 것입니다. 진짜 중요한 건 PINN의 실패를 바라보는 눈이 바뀌었다는 데 있습니다.

사례 1. 센서가 몇 개 없는 배터리 열문제

배터리 팩 내부의 온도장은 직접 다 측정하기 어렵습니다. 그래서 몇 개 센서와 열 방정식을 함께 써서 내부 분포를 복원하려는 유혹이 큽니다. 이때 PINN이 failure phase에서 멈추면 무슨 일이 생길까요?

PDE residual은 낮아 보인다.
센서 위치 근처는 얼추 맞는다.
하지만 hotspot의 위치나 peak temperature는 틀릴 수 있다.

배터리 안전 설계에서 이건 꽤 치명적입니다. 문제는 결과가 너무 매끈해서 오히려 믿기 쉽다는 것입니다.

사례 2. 지하 유동과 저수지 추정

시추공 데이터는 비싸고 드뭅니다. 반면 Darcy flow나 확산 계열 PDE는 알고 있습니다. 그래서 PINN은 역문제에 매력적입니다. 하지만 투수계수나 경계 유량을 잘못 추정하면, 생산 계획 자체가 틀어질 수 있습니다.

이 논문이 중요한 이유는 이런 상황에서 연구자에게 이렇게 말해주기 때문입니다.

"loss가 낮다고 안심하지 마라. optimizer가 진짜로 더 갈 수 있는지부터 보라."

사례 3. 상전이, 부식, 균열처럼 sharp structure가 있는 문제

Allen-Cahn, phase-field fracture, corrosion front 같은 문제는 얇고 날카로운 구조가 핵심입니다. 여기서는 전체 field가 좀 틀린 게 아니라, 경계면 위치가 조금만 틀려도 해석 전체가 달라집니다.

이런 문제에서 FP32가 failure phase에 오래 머무르면, 넓게 보면 그럴듯하지만 실제로 중요한 interface physics는 놓칠 수 있습니다. 그래서 이 논문은 단순한 "optimizer tips"가 아니라, 과학 AI의 신뢰성 문제로 읽혀야 합니다.

사례 4. 2026년의 AI 문화와 정면 충돌

지금의 AI 문화는 압축과 저정밀도에 익숙합니다.

학습은 BF16
추론은 FP8/INT8
메모리는 줄이고 처리량은 올리자

그런데 과학 AI에서는 종종 정반대입니다. PDE를 푼다는 건 결국 수치해석 문제를 신경망 도구로 다시 푸는 것이기 때문입니다. 이 논문은 이 사실을 매우 선명하게 드러냅니다.

8장. 그렇다면 2026년에 PINN과 FP64의 역할은 무엇인가

2026년 시점에서 PINN을 둘러싼 풍경은 훨씬 성숙해졌습니다. Grossmann et al. (2024)은 여러 PDE에 대해 PINN과 FEM을 체계적으로 비교했고, 시간과 정확도 측면에서 PINN이 FEM을 전반적으로 이기지 못했다고 보고합니다. 반면 2025년 리뷰는 PINN이 여전히 열전달, 균열, 결함 탐지, inverse design, multiscale 재료 해석 등에서 활발히 쓰이고 있음을 보여줍니다.

즉, 결론은 "PINN 끝"도 아니고 "PINN 만능"도 아닙니다.

2026년 기준으로 보면

도구	잘 맞는 문제	약한 지점	FP64 논문이 준 교훈
Vanilla PINN	희소 데이터 역문제, parameter identification, differentiable scientific ML	고주파/다중 스케일 forward solve, 대규모 many-query	정밀도와 종료 기준을 무시하면 결과 전체를 오판할 수 있다
FP64 PINN	failure phase를 통과해야 하는 stiff PDE, trustworthy baseline 구축	메모리 비용 증가, 고급 GPU 의존	"먼저 깨끗한 baseline을 세운 뒤" 다른 개선을 얹어라
Neural Operator	많은 조건에 대한 빠른 반복 추론, operator learning, surrogate modeling	문제별 물리 제약 주입, sparse inverse problem 직결성	PINN을 대체한다기보다, 다른 종류의 문제에 더 자연스럽다
Hybrid PINN + FEM	multiscale, domain decomposition, engineering workflow 통합	시스템 복잡도 증가	정밀도는 이제 hybrid stack에서도 독립 변수로 다뤄야 한다

지금 실제로 강해지는 방향

2026년의 흐름을 넓게 보면 다음 네 방향이 두드러집니다.

정밀도 재평가 FP64 논문 덕분에, PINN 실험에서 dtype을 "부차 옵션"으로 넘기는 태도가 설득력을 잃었습니다.
Hybridization 리뷰 문헌이 보여주듯, PINN-enhanced multiscale FEM, domain decomposition, physics-informed operator learning이 활발합니다. "전통 수치해석 vs 신경망"의 싸움보다는 둘을 섞는 방향이 강합니다.
Task specialization forward solve 전체를 대체하려는 시도보다, inverse problem, parameter inference, simulator calibration 같은 PINN이 원래 잘하는 자리로 수렴하고 있습니다.
Numerical literacy의 복귀 딥러닝 엔지니어도 이제
- condition number
- stopping criterion
- tolerance
- floating-point format
- Hessian stiffness
같은 단어를 다시 배워야 하는 시대가 됐습니다.

2026 scientific ML 풍경 속에서 PINN, neural operator, FEM, hybrid solver가 각자 다른 역할을 맡는 지도를 그린 에디토리얼 일러스트

9장. 이 논문을 읽고 나면 반드시 남겨야 할 다섯 문장

작은 residual loss는 정답의 보증서가 아니다.
PINN의 failure mode는 영원한 함정이 아니라, 지나가야 하는 phase일 수 있다.
정밀도와 종료 기준은 optimizer 밖의 잡다한 설정이 아니라, 핵심 알고리즘의 일부다.
특화 architecture는 여전히 중요하지만, 그 전에 baseline의 numeric hygiene를 확인해야 한다.
2026년의 PINN은 만능 PDE solver가 아니라, inverse problem과 hybrid scientific ML에서 특히 강한 도구다.

마치며 — 이 논문이 진짜로 바꾼 것

이 논문이 말하는 가장 중요한 사실은 "FP64가 무조건 만능이다"가 아닙니다.

그보다 더 큰 전환은 이것입니다.

PINN의 실패를 신경망의 신비한 local minimum으로만 보지 말고, 수치해석 관점의 조기 정지와 정밀도 문제로 다시 보자.

이건 생각보다 훨씬 큰 변화입니다. 왜냐하면 질문이 바뀌면, 그다음 2년의 연구 방향도 바뀌기 때문입니다.

예전 질문:

왜 이 네트워크는 충분히 똑똑하지 않을까?
더 복잡한 구조가 필요하지 않을까?

바뀐 질문:

우리는 정말 끝까지 최적화했는가?
현재 dtype과 tolerance 조합은 믿을 만한가?
loss와 error를 같은 것으로 착각한 건 아닌가?

과학 AI에서 중요한 것은 "그럴듯한 그림"이 아니라 신뢰할 수 있는 수치입니다. 그리고 이 논문은 그 당연한 사실을, 가장 딥러닝다운 언어로 다시 상기시켜 줍니다.

참고문헌

특집2026.03.06

FP64 is All You Need — PINN 실패 모드를 다시 생각하다

들어가며 — 모두가 숫자를 줄일 때, 이 논문은 숫자를 늘리라고 말했다

1장. 왜 사람들은 PINN에 그렇게 열광했을까?

역사 한눈에 보기

왜 그렇게 유망해 보였나

2장. PINN의 악명 높은 실패 모드란 무엇인가?

이게 왜 무서운가

왜 이런 일이 생긴다고 생각했나

3장. 이 논문이 던지는 도발 — 실패와 성공은 같은 골짜기에 있을지 모른다

단서 1. 초기값을 아무리 바꿔도 계속 실패한다

단서 2. FP32 실패 지점에서 FP64로 바꾸고 계속 학습하면, 갑자기 살아난다

단서 3. loss는 평평한데 error는 가파르다

4장. 이 논문이 제안한 PINN 훈련의 세 단계

5장. 그런데 왜 하필 FP32에서 멈출까?

논문이 짚는 메커니즘

비유 1. 자가용 계기판이 너무 거칠다

비유 2. 디지털 저울의 분해능이 부족하다

논문이 보여준 실제 수치

6장. 결과는 얼마나 강력했나, 그리고 어디까지 믿어야 하나

"FP64면 최신 구조가 다 필요 없는가?"

논문 이후 우리가 더 정직하게 말할 수 있는 것

7장. 왜 이 개념이 중요한지, 사례로 체감해 보자

사례 1. 센서가 몇 개 없는 배터리 열문제

사례 2. 지하 유동과 저수지 추정

사례 3. 상전이, 부식, 균열처럼 sharp structure가 있는 문제

사례 4. 2026년의 AI 문화와 정면 충돌

8장. 그렇다면 2026년에 PINN과 FP64의 역할은 무엇인가

2026년 기준으로 보면

지금 실제로 강해지는 방향

9장. 이 논문을 읽고 나면 반드시 남겨야 할 다섯 문장

마치며 — 이 논문이 진짜로 바꾼 것

함께 읽으면 좋은 글

참고문헌

관련 포스트

PINN은 왜 자꾸 학습에 실패하는가 — Loss Landscape 관점으로 다시 읽는 훈련의 핵심

PINNacle 완전 해부 — Physics-Informed Neural Networks는 왜 기대만큼 쉽지 않았나

PINN은 왜 시간 문제에서 자꾸 무너질까 — causal training으로 다시 읽는 학습 실패의 구조

PINN은 왜 자꾸 딴길로 샐까 — Gradient Alignment와 2차 최적화로 다시 읽는 물리 AI