
금속이 녹아가는 과정을 AI로 예측한다 — Sharp-PINNs 완전 해부
결합된 편미분방정식을 동시에 학습하면 그래디언트가 충돌한다. Sharp-PINNs는 '교대 학습 + 경성 제약'이라는 우아한 해법으로 이 난제를 돌파하고, 3D 부식 시뮬레이션에서 FEM 대비 10배 빠른 속도를 달성했다.

결합된 편미분방정식을 동시에 학습하면 그래디언트가 충돌한다. Sharp-PINNs는 '교대 학습 + 경성 제약'이라는 우아한 해법으로 이 난제를 돌파하고, 3D 부식 시뮬레이션에서 FEM 대비 10배 빠른 속도를 달성했다.
석유화학 플랜트의 배관, 해양 구조물의 철골, 원자력 발전소의 냉각 계통 — 금속으로 된 모든 것은 결국 부식(corrosion) 과 싸운다. 특히 공식 부식(pitting corrosion) 은 금속 표면의 작은 점에서 시작해 깊이 방향으로 빠르게 파고드는 국지적 부식으로, 육안으로 발견되기 전에 치명적 손상을 일으킬 수 있다.
부식의 진행을 예측하려면 상장 모델(phase field model) 이라는 수학적 프레임워크가 필요하다. 금속(고체상)과 전해질(액체상) 사이의 경계면이 시간에 따라 어떻게 이동하는지를 편미분방정식으로 기술하는 방법이다.
문제는 이 방정식 시스템이 악명 높게 풀기 어렵다는 것이다. 두 개의 강하게 결합된 PDE — Allen-Cahn 방정식과 Cahn-Hilliard 방정식 — 를 동시에 풀어야 하며, 3차원으로 가면 유한요소법(FEM)으로도 한 케이스에 수 시간이 걸린다.
PINN으로 풀면 되지 않을까? 시도해 보면 안다. 두 방정식의 손실을 동시에 최소화하려 하면, 그래디언트가 서로 반대 방향을 가리키며 충돌한다. 한쪽을 개선하면 다른 쪽이 악화되는 딜레마. 일반 PINN은 이 문제 앞에서 좌절한다.
2025년, Tongji University와 Yale University의 연구팀이 이 난제에 대한 우아한 해법을 제시했다.
Sharp-PINNs: Staggered Hard-constrained Physics-Informed Neural Networks — Nanxi Chen, Chuanjie Cui, Rujin Ma, Airong Chen, Sifan Wang Computer Methods in Applied Mechanics and Engineering (2025)
Sharp은 단순한 형용사가 아니라 Staggered HARd-constrained Physics-informed Neural Networks의 약어다. 이름 자체가 두 가지 핵심 혁신을 담고 있다: 교대 학습(Staggered) 과 경성 제약(Hard-constrained).
Sharp-PINNs를 이해하려면 먼저 상장 방법(phase field method) 을 알아야 한다. 어렵지 않다.
금속이 부식되면, 원래 금속이었던 영역이 점차 전해질(녹은 금속 이온)로 바뀐다. 이 금속-전해질 경계면이 시간에 따라 이동하는 것이 부식의 본질이다.
경계를 추적하는 전통적 방법은 경계면을 직접 따라가는 것이다 — 레벨셋(Level Set), ALE(Arbitrary Lagrangian-Eulerian) 같은 방법. 하지만 부식 피트(pit)가 여러 개 생기고, 서로 합쳐지고, 형태가 복잡해지면 경계면의 위상(topology)이 변한다. 이를 추적하는 것은 악몽이 된다.
상장 방법은 완전히 다른 접근을 취한다.
경계면을 직접 추적하는 대신, 연속적인 필드 변수 를 도입해 각 점이 금속인지 전해질인지를 나타낸다.
상장 방법의 장점은 결정적이다: 부식 피트가 합쳐지든, 갈라지든, 형태가 어떻게 변하든 별도의 위상 처리 없이 PDE의 자연스러운 진화로 포착된다.
부식의 상장 모델은 Kim-Kim-Suzuki(KKS) 모델이라는 열역학적 프레임워크를 기반으로, 두 개의 PDE로 구성된다.
1. Allen-Cahn(AC) 방정식 — 상 변수 의 진화:
이 방정식은 "금속-전해질 경계면이 어떻게 이동하는가" 를 기술한다. 은 계면 이동 속도, 는 이중 우물 퍼텐셜 높이, 는 계면 에너지 계수다.
2. Cahn-Hilliard(CH) 방정식 — 농도 의 확산:
이 방정식은 "금속 이온의 농도가 어떻게 분포·확산하는가" 를 기술한다. 은 화학적 이동도(mobility), 는 에너지 파라미터다.
두 방정식은 강하게 결합(strongly coupled) 되어 있다. AC 방정식의 변화가 CH 방정식의 농도 분포에 영향을 미치고, 농도 변화가 다시 계면 이동에 영향을 미친다. 이 양방향 결합이 문제를 어렵게 만드는 핵심이다.
여기서 는 보간 함수로:
그리고 KKS 모델에서 전체 농도는 고체상과 액체상 농도의 가중 혼합이다:
일반 PINN은 모든 손실 항을 하나의 손실함수에 넣고 동시에 최소화한다:
문제는 와 의 그래디언트 방향이 충돌한다는 것이다.
Chen et al.은 논문에서 두 손실의 그래디언트 사이의 코사인 유사도(cosine similarity) 를 측정했다:
결과는 충격적이었다. 학습 초기 몇 에폭 이후, 코사인 유사도가 지속적으로 음수(negative) 가 된다. 즉, AC 손실을 줄이는 방향과 CH 손실을 줄이는 방향이 반대인 것이다.
비유: 두 사람이 하나의 자동차 핸들을 잡고 각자 원하는 방향으로 돌리는 것과 같다. 결과적으로 차는 제대로 가지 못한다.
이것이 결합 PDE 시스템에서 PINN이 실패하는 근본 원인이다. 개별 PDE 각각은 풀 수 있지만, 결합된 시스템을 동시에 풀려 하면 최적화가 교착 상태에 빠진다.
일반 PINN에서 물리적 제약(예: , KKS 열역학 관계)은 손실함수에 패널티 항으로 추가된다. 하지만 패널티는 "제안"일 뿐 "강제"가 아니다. 최적화 과정에서 네트워크가 이나 같은 물리적으로 불가능한 값을 출력할 수 있다.
이것은 "운전면허 없이 운전하면 벌금"이라는 규칙이 있어도 실제로 무면허 운전이 발생하는 것과 같다. 구조적으로 불가능하게 만들지 않으면, 위반은 반드시 일어난다.
Sharp-PINNs의 첫 번째 혁신은 두 PDE를 동시에 풀지 않는 것이다.
대신, AC 방정식과 CH 방정식을 교대로 학습한다:
왜 이것이 작동하는가?
동시 학습에서는 AC와 CH의 그래디언트가 정면 충돌한다. 하지만 교대 학습에서는 한 시점에 하나의 방정식만 최적화하므로, 그래디언트 충돌이 구조적으로 해소된다. 각 Stage에서 네트워크는 해당 방정식에 "집중"할 수 있고, 다른 방정식의 정보는 현재 네트워크 상태에 암묵적으로 반영된다.
Chen et al.의 분석에 따르면, 교대 학습에서 AC-CH 그래디언트의 코사인 유사도는 학습 초기에 양수를 유지하며, 후기에도 음수로 급격히 떨어지지 않는다. 충돌 대신 상호 독립적 최적화가 이루어지는 것이다.
비유: 두 사람이 핸들을 동시에 잡는 대신, 교대로 운전한다. A가 5분 운전하고, B가 5분 운전하고, 를 반복하면 목적지에 훨씬 효율적으로 도달한다.
이 아이디어는 수치해석의 연산자 분리법(operator splitting) — Strang splitting, Lie splitting — 과 깊이 연결된다. 복잡하게 결합된 연산자를 개별 연산자로 분리해 순차적으로 적용하는 고전적 전략의 딥러닝 버전이다.
Sharp-PINNs의 두 번째 혁신은 KKS 열역학 모델을 네트워크 출력 구조에 직접 내장하는 것이다.
일반 PINN이라면 네트워크가 와 를 직접 출력하고, 이나 KKS 관계를 손실함수의 패널티로 강제할 것이다. Sharp-PINNs는 다르다.
네트워크가 출력하는 것은 와 — 제약 없는 자유 변수다. 여기에 다음의 변환을 적용한다:
의 출력 범위는 이므로, 는 구조적으로 안에 갇힌다. 네트워크가 어떤 값을 출력하든, 물리적으로 불가능한 이나 은 원천 차단된다.
마찬가지로 액체상 농도도:
그리고 고체상 농도 와 전체 농도 는 KKS 모델의 열역학적 관계에서 자동으로 유도된다:
비유: 연성 제약은 "과속하면 벌금"이고, 경성 제약은 "자동차의 최고 속도를 물리적으로 제한" 하는 것이다. 후자가 훨씬 확실하다.
경성 제약의 추가적 장점: 최적화기가 을 배우는 데 에너지를 쓸 필요가 없어진다. 제약 조건에 쓰이던 학습 용량이 해방되어 실제 물리 해를 배우는 데 집중할 수 있다.
Sharp-PINNs의 전체 네트워크 아키텍처는 세 모듈의 합성으로 표현된다.
신경망의 스펙트럼 편향 — 저주파를 먼저 배우고 고주파는 느리게 배우는 경향 — 은 상장 모델에서 치명적이다. 금속-전해질 경계면은 가 0에서 1로 급격히 변하는 고주파 구조이기 때문이다.
Random Fourier Features(RFF) 는 입력 좌표 를 고차원 주파수 공간으로 임베딩하는 기법이다. Tancik et al. (2020)의 "Fourier Features Let Networks Learn High Frequency Functions in Low Dimensional Domains" 이후 표준적으로 사용되는 방법이다.
여기서 는 가우시안 분포에서 샘플링한 주파수 행렬이다. 이 임베딩을 통해 네트워크는 입력 좌표에서 직접 보기 어려운 고주파 패턴을 훨씬 쉽게 학습할 수 있다.
중간 모듈은 수정된 MLP(Multi-Layer Perceptron)로, 표준 MLP에 아키텍처 개선을 추가한 것이다. 논문에서는 문제 차원에 따라 128200개 은닉 노드, 46층의 구성을 사용했다.
출력 모듈은 앞서 설명한 경성 제약을 구현한다. 자유 변수 , 을 물리적으로 유효한 , , , 로 변환하며, KKS 열역학 관계를 네트워크 구조에 하드코딩한다.
추가적으로 Sharp-PINNs는 Grad-Norm 기반의 동적 가중치 조절을 사용한다. 각 손실 항의 그래디언트 노름(크기)을 모니터링해, 특정 항이 최적화를 독점하지 않도록 가중치를 자동 조절한다. 큰 그래디언트를 가진 항의 가중치를 줄이고, 작은 그래디언트를 가진 항의 가중치를 높인다.
Chen et al.은 2D와 3D 부식 시뮬레이션에서 Sharp-PINNs를 FEM과 정밀하게 비교했다.
2D에서는 FEM이 여전히 빠르다. 이것은 솔직한 결과다 — 2D 문제는 격자 크기가 작아 FEM의 강점이 유지된다.
3D에서 Sharp-PINNs는 FEM 대비 6.3배~10.7배 빠르다. 정확도는 L2 오차 기준 수준으로 경쟁력 있다.
이 결과는 핵심적인 스케일링 특성을 보여준다. FEM의 계산 비용은 메시 크기에 비례하고, 메시 크기는 3D에서 세제곱으로 증가한다. 반면 Sharp-PINNs는 메시가 없으므로(mesh-free) 차원 증가에 대한 비용 증가가 훨씬 완만하다.
부식 피트가 2개로 늘어나면 FEM은 197분으로 거의 두 배가 되지만, Sharp-PINNs는 17분에서 18분으로 미미하게 증가한다. 이는 상장 방법 자체가 다중 피트의 합병을 위상 변화 없이 처리하기 때문이다.
가장 기본적인 벤치마크에서 Sharp-PINNs는 금속 표면의 단일 부식 피트가 시간에 따라 깊어지고 넓어지는 과정을 시뮬레이션한다.
상 변수 의 시간 진화를 보면:
Sharp-PINNs의 예측은 FEM 참조 해(reference solution)와 시각적으로 거의 구분이 불가능한 수준의 일치를 보였다.
더 흥미로운 것은 복수의 피트가 성장하면서 서로 합쳐지는 과정이다. 이것은 실제 산업 부식에서 매우 흔한 현상이며, 구조적 위험성이 급증하는 순간이기도 하다.
상장 방법의 장점이 여기서 빛난다: 두 피트의 경계면이 접근해 하나로 합쳐지는 위상 전이(topological transition) 가 PDE의 자연스러운 진화로 포착된다. 별도의 합병 판정이나 재메시가 필요 없다.
이 합병 과정에서 국소적 부식 속도가 급증하기 때문에, 이를 정확히 예측하는 것은 구조물 안전 평가의 핵심이다.
Sharp-PINNs 외에도, 불연속이나 급격한 변화를 PINN으로 다루려는 연구가 활발하다. 주요 접근법을 조망하자.
Li Liu 등이 Journal of Scientific Computing에 발표. 불연속면 근처에서 네트워크의 표현을 의도적으로 약화시키는 그래디언트 가중 전략과, 보존 법칙의 Rankine-Hugoniot 조건을 추가 손실 항으로 부과한다. 버거스 방정식과 오일러 방정식의 충격파 포착에 적용됐다.
CMAME에 발표된 이 방법은, 날카로운 인터페이스(sharp interface)로 분리된 부분 영역에 서로 다른 활성화 함수를 가진 별도 네트워크를 배치한다. 기존 PINN과 XPINN 대비 RMSE가 2자릿수 개선되면서 계산 비용은 1/10로 줄었다고 보고했다.
Karniadakis 그룹의 연구. DeepONet을 매끄러운 문제에서 사전 학습한 뒤, PINN과 통합해 날카로운 해를 분해(resolve)하는 방법. 고레이놀즈 수 나비에-스토크스 방정식의 급격한 구조를 포착하는 데 적용됐다.
CMAME에 발표된 최신 연구. 손실 항을 미분 차수(derivative order) 별로 분리해, 저차 미분 항을 먼저 학습하고 고차 미분 항을 나중에 학습하는 다단계 전략을 사용한다. FEM 대비 최대 87배 정밀한 응력 집중 재구성을 달성했다.
각 방법은 "sharp" 문제의 다른 측면을 공략한다. 충격파, 재료 인터페이스, 급격한 해, 결합 PDE — 문제의 성격에 따라 최적의 접근이 다르다. Sharp-PINNs의 고유한 기여는 강하게 결합된 다중 PDE 시스템(특히 상장 모델)에 대한 교대 학습과 경성 제약의 조합이다.
Sharp-PINNs의 교대 학습 전략은 부식 상장 모델에 국한되지 않는다. 그래디언트가 충돌하는 결합 PDE 시스템은 과학·공학 전반에 편재한다:
이 모든 시스템에서 각 방정식의 손실이 그래디언트 공간에서 충돌할 가능성이 있다. Sharp-PINNs의 교대 학습은 이 문제에 대한 일반적 처방전이 될 수 있다.
경성 제약의 아이디어 — 열역학적 관계를 네트워크 구조에 하드코딩 — 도 일반화 가능하다. 에너지 보존, 질량 보존, 양의 정부호 조건 같은 물리적 제약을 손실함수의 패널티가 아닌 아키텍처의 구조로 보장하는 접근은, PINN의 신뢰성을 근본적으로 높이는 방향이다.
Sharp-PINNs 벤치마크의 가장 중요한 교훈은 3D에서의 스케일링이다. 2D에서는 FEM에 뒤지지만, 3D에서 역전된다. 현실 세계의 부식은 3D 현상이다. 그리고 산업 규모의 문제는 거의 항상 3D다.
FEM의 계산 비용이 차원에 따라 기하급수적으로 증가하는 반면, 메시프리인 Sharp-PINNs는 이 "차원의 저주"를 훨씬 완만하게 겪는다. 문제가 복잡하고 클수록 Sharp-PINNs의 상대적 이점은 커진다.
Sharp-PINNs 논문에서 가장 인상적인 것은 결과의 정직함이다. 2D에서 FEM보다 느리다는 사실을 숨기지 않았다. 대신 3D로 가면 판세가 뒤집히는 이유를 명확히 설명했다.
이 정직함이 연구의 신뢰를 높인다. 모든 문제에서 만능인 방법은 없다. 중요한 것은 어디서 강하고, 어디서 약하며, 왜 그런지를 아는 것이다.
Sharp-PINNs가 보여준 두 가지 혁신 — 교대 학습으로 그래디언트 충돌을 해소하고, 경성 제약으로 열역학을 구조적으로 보장하는 것 — 은 부식 시뮬레이션을 넘어, 강하게 결합된 다중 물리 시스템을 PINN으로 풀려는 모든 시도에 영감을 줄 것이다.
금속이 녹아가는 과정을 밀리미터 정밀도로, 분 단위 속도로 예측할 수 있다면, 우리는 사고가 일어나기 전에 대응할 수 있다. 이것이 Sharp-PINNs가 궁극적으로 추구하는 가치다.