
ESCHER 완전 해부 — 하이퍼그래프가 바꾸는 네트워크 분석의 미래
그래프 이론의 한계를 넘어 '그룹 관계'를 표현하는 하이퍼그래프, 그리고 이를 GPU 위에서 실시간으로 진화시키는 ESCHER 데이터 구조를 완전 해부한다. 오일러의 다리 문제부터 2026년 AI 네트워크 분석까지.

그래프 이론의 한계를 넘어 '그룹 관계'를 표현하는 하이퍼그래프, 그리고 이를 GPU 위에서 실시간으로 진화시키는 ESCHER 데이터 구조를 완전 해부한다. 오일러의 다리 문제부터 2026년 AI 네트워크 분석까지.
2026년, 우리는 하루에도 수십 번 그룹 관계 속에서 살아간다.
슬랙 채널에서 5명이 동시에 논의하고, 논문을 4명이 공저하고, 카카오톡 단체 대화방에서 30명이 정보를 주고받는다. 넷플릭스는 "이 드라마를 같이 본 사람들"의 패턴을 분석하고, 제약회사는 하나의 약물이 여러 단백질에 동시에 작용하는 관계를 추적한다.
그런데 지금까지 네트워크 과학의 핵심 도구였던 그래프(graph)는 이런 관계를 제대로 표현할 수 없었다. 왜? 그래프의 간선(edge)은 딱 두 개의 노드만 연결하기 때문이다.

이 글은 그 한계를 돌파하는 하이퍼그래프(hypergraph)의 세계, 그리고 2025년 12월 공개된 논문 ESCHER가 제시하는 혁신적 해법을 다룬다. 오일러의 다리 문제부터 GPU 위의 실시간 네트워크 진화까지 — 네트워크 분석의 300년 역사를 함께 여행하자.
모든 것은 산책 문제에서 시작됐다.
18세기 프로이센의 도시 쾨니히스베르크(현재 러시아 칼리닌그라드)에는 프레겔 강 위에 7개의 다리가 있었다. 시민들 사이에서 한 가지 퍼즐이 유행했다:
"7개의 다리를 모두 한 번씩만 건너서 출발점으로 돌아올 수 있을까?"
레온하르트 오일러(Leonhard Euler)는 1736년, 이 문제를 풀기 위해 전혀 새로운 사고방식을 도입했다. 그는 섬과 강변을 점(vertex)으로, 다리를 선(edge)으로 추상화했다. 지도의 구체적인 형태는 무시하고, 연결 관계만 남긴 것이다.
오일러의 증명은 단순하면서도 강력했다. 각 정점에 연결된 다리(간선)의 수가 홀수인 정점이 0개 또는 2개여야만 모든 다리를 한 번씩 건널 수 있다. 쾨니히스베르크의 4개 정점은 모두 홀수 차수였으므로, 불가능하다.
이것이 그래프 이론의 탄생 순간이었다. 이후 290년 동안, 그래프는 수학, 컴퓨터 과학, 물리학, 생물학, 사회학의 핵심 도구가 되었다.
그래프 이론은 20세기 후반 폭발적으로 성장했다:
하지만 이 화려한 역사의 이면에, 한 가지 근본적인 한계가 숨어 있었다.
앨리스, 밥, 찰리, 다이애나 — 네 명이 함께 논문 한 편을 썼다고 하자.
일반 그래프로 이 관계를 표현하면? A-B, A-C, A-D, B-C, B-D, C-D라는 6개의 간선을 그려야 한다. 이것은 "네 명이 함께 하나의 논문을 쓴 것"이 아니라 "모든 쌍이 각각 관계가 있다"는 의미가 된다.
여기서 문제가 터진다. 만약 앨리스와 밥이 별도로 다른 논문을 썼다면? 그래프에서는 A-B 간선이 이미 있으므로, 공저 논문의 구분이 불가능하다.
| 비교 항목 | 일반 그래프 | 하이퍼그래프 |
|---|---|---|
| 간선이 연결하는 노드 수 | 정확히 2개 | 1개 이상 무제한 |
| "A, B, C가 함께" 표현 | 3개 간선 필요 (정보 손실) | 하이퍼엣지 1개 |
| 그룹 소속 구분 | 불가능 | 각 하이퍼엣지가 독립 그룹 |
| 실세계 적합성 | 쌍별 관계만 | 다자간 상호작용 |
아래 인터랙티브 시각화에서 직접 비교해 보자. 일반 그래프 탭에서는 4인 공저 관계가 6개의 간선으로 분해되는 모습을, 하이퍼그래프 탭에서는 각 논문이 독립 그룹으로 유지되는 모습을 확인할 수 있다. 하이퍼엣지 위에 마우스를 올려 보자.
이 문제를 수학적으로 해결한 사람은 프랑스 수학자 클로드 베르주(Claude Berge)였다. 1973년 저서 Graphs and Hypergraphs에서 그는 하이퍼그래프를 공식적으로 정의했다:
하이퍼그래프 H = (V, E)에서 V는 정점 집합, E는 하이퍼엣지 집합이다. 각 하이퍼엣지 e ∈ E는 V의 비어 있지 않은 부분집합이다.
핵심은 간단하다. 일반 그래프에서 간선(edge)은 항상 |e| = 2이지만, 하이퍼그래프에서 하이퍼엣지(hyperedge)는 |e| ≥ 1이다. 즉, 하나의 간선이 2개, 3개, 100개, 1000개의 노드를 동시에 연결할 수 있다.

이 단순한 일반화가 열어준 가능성은 엄청났다:
1908년, 독일 사회학자 게오르크 짐멜(Georg Simmel)이 흥미로운 관찰을 했다. 두 사람의 관계(dyad)와 세 사람의 관계(triad)는 질적으로 완전히 다르다는 것이다.
두 사람이 싸우면 관계가 끝나지만, 세 명이면 중재자가 등장한다. 두 사람의 비밀은 비밀이지만, 세 사람의 비밀은 사회적 규범이 된다.
1973년, 사회학자 마크 그라노베터(Mark Granovetter)는 이 아이디어를 발전시켜 트라이어드 폐합(triadic closure)이라는 개념을 만들었다:
A와 B가 친구이고, A와 C가 친구이면, B와 C도 친구가 될 가능성이 높다.
이것이 바로 소셜 네트워크에서 "알 수도 있는 사람" 추천의 수학적 기초다. 페이스북, 링크드인의 친구 추천 알고리즘은 모두 트라이어드 폐합의 변형이다.
일반 그래프에서 삼각형(triangle)은 세 개의 노드와 세 개의 간선으로 이루어진 가장 작은 완전 순환 구조다. 삼각형 개수를 세는 것은 네트워크 분석의 기본이다 — 커뮤니티 탐지, 이상 탐지, 네트워크 건강도 측정 등에 쓰인다.
하이퍼그래프에서는 이것이 훨씬 풍부해진다. 세 개의 하이퍼엣지가 겹치는 방식에 따라 26가지 서로 다른 트라이어드 패턴이 존재한다!
지금까지의 하이퍼그래프 분석 도구는 대부분 정적(static)이었다. 즉, 특정 시점의 스냅샷을 찍어 분석하는 방식이었다.
하지만 현실의 네트워크는 끊임없이 변한다:
매번 네트워크가 바뀔 때마다 전체를 다시 계산하는 것은 비현실적이다. 하이퍼엣지가 수백만 개인 네트워크에서 트라이어드를 다시 세려면 시간이 너무 오래 걸린다.
하이퍼그래프 분석 분야의 기존 도구들은 각각 큰 제약이 있었다:
| 도구/알고리즘 | 장점 | 한계 |
|---|---|---|
| MoCHy (2020) | 병렬화, 근사/정확 모두 지원 | 정적 전용, 하이퍼엣지 트라이어드만 |
| THyMe+ (2021) | 시간적 모티프 96종 분류 | 순차 처리, GPU 미지원 |
| StatHyper | 입사 정점 기반 트라이어드 | 정적, 순차 처리 |
| Hornet (2018) | GPU 동적 그래프 | 일반 그래프 전용 (하이퍼그래프 미지원) |
정리하면:
바로 이 공백을 ESCHER가 채운다.
ESCHER = Efficient and Scalable Computing for Hypergraph Evolution Representation
네덜란드 화가 M. C. 에셔(Escher)의 작품처럼, 복잡한 구조를 우아하게 다룬다는 의미도 담겨 있다.
ESCHER는 세 가지 핵심 구성요소로 이루어진다:
하이퍼그래프에서는 양방향 조회가 필요하다:
ESCHER는 이 세 가지 뷰를 동시에 관리하면서, 수직 업데이트(하이퍼엣지 추가/삭제)와 수평 업데이트(정점 추가/삭제)를 모두 지원한다.
GPU의 핵심은 워프(warp) 단위 병렬 처리다. NVIDIA GPU에서 32개의 스레드가 하나의 워프를 이루어 동시에 실행된다. ESCHER는 이 특성을 최대한 활용한다:
모든 하이퍼엣지의 정점 리스트를 하나의 1차원 배열에 펼쳐 놓고, 각 블록의 시작 주소만 관리한다. 블록이 넘치면? 체인(chain)으로 다음 블록에 연결한다 — 마치 해시 테이블의 오버플로 처리처럼.
완전 이진 탐색 트리(Complete Binary Search Tree)를 사용하여 블록을 관리한다. 각 노드에는:
이 트리 덕분에:
핵심 트릭: 삭제해도 트리를 재구성하지 않는다. 노드를 남겨두고 "비어 있음"으로 표시만 하면, 나중에 삽입할 때 그 자리를 재활용할 수 있다.
삽입은 세 가지 경우로 나뉜다:
ESCHER의 진짜 강점은 데이터 구조 자체가 아니라, 이를 활용한 증분 업데이트(incremental update) 전략이다.
네트워크에서 하이퍼엣지 몇 개가 추가/삭제되었다고 하자. 트라이어드 개수를 갱신하려면 전체를 다시 셀 필요가 없다. 변경된 하이퍼엣지의 1~2홉 이웃만 다시 세면 된다.
이 전략의 핵심 공식:
count_new = count_old − count_Del + count_Ins
전체 하이퍼그래프가 아닌 변경 영향 부분그래프에서만 연산하므로, 계산량이 극적으로 줄어든다.
| 데이터셋 | 하이퍼엣지 수 | 정점 수 | 최대 카디널리티 |
|---|---|---|---|
| Coauth (공저자) | 2,599,087 | 1,924,991 | 280 |
| Tags (태그) | 5,675,497 | 49,998 | 4 |
| Orkut (소셜) | 6,288,363 | 3,072,441 | 27,000 |
| Threads (포럼) | 9,705,709 | 2,675,955 | 67 |
| Random (합성) | 15,000,000 | 5,000,000 | 10,000 |
Type 3(세 정점 쌍이 모두 서로 다른 하이퍼엣지에 속하는 패턴)에서 속도 향상이 가장 큰 이유는, 정적 알고리즘이 이 유형을 처리할 때 매우 비싼 전체 재계산을 해야 하기 때문이다. ESCHER의 증분 업데이트 전략이 이 비용을 극적으로 줄인다.
ESCHER를 더 깊이 이해하려면, GPU 기반 동적 그래프 처리의 역사를 알아야 한다.
ESCHER 논문은 정직하게 Hornet과의 비교도 제시한다:
| 상황 | Hornet 유리 | ESCHER 유리 |
|---|---|---|
| 간선 카디널리티 변동 | 작을 때 (모두 2) | 클 때 (수십~수천) |
| 메모리 효율 | 더 효율적 | 고차 상호작용에 추가 메모리 필요 |
| 하이퍼그래프 지원 | 불가 | 네이티브 지원 |
| 트라이어드 분석 | 삼각형만 | 26종 + Type 1~3 + 96종 시간적 |
2026년 현재, AI 에이전트들이 협업하는 시대가 도래했다. 여러 AI 에이전트가 동시에 작업하고, 데이터를 공유하고, 결과를 병합하는 과정은 본질적으로 하이퍼그래프 구조다 — 하나의 작업에 여러 에이전트가 동시에 참여하기 때문이다.
ESCHER는 단순한 데이터 구조가 아니다. 이것은 실시간 하이퍼그래프 분석의 기반 인프라다:
ESCHER의 블록 관리자는 왜 하필 완전 이진 탐색 트리(CBT)를 사용할까?
| 연산 | 시간 복잡도 | 설명 |
|---|---|---|
| 초기화 | O(|E|/p · log|E|) | p = GPU 스레드 수 |
| 하이퍼엣지 삭제 | O(|Del|/p · log|E| + log|E|) | 표시 + avail 전파 |
| 하이퍼엣지 삽입 | O(|Ins|/p · log|E| · c_max) | c_max = 최대 카디널리티 |
| 정점 수정 | O(χ/p · log|E| · c_max) | χ = 수정 대상 수 |
| 하이퍼엣지 검색 | O(log|E|) | 이진 탐색 |
시간적 하이퍼그래프에서 트라이어드가 유효하려면:
t_k − t_i ≤ t_δ
여기서 t_i는 가장 이른 하이퍼엣지의 타임스탬프, t_k는 가장 늦은 하이퍼엣지의 타임스탬프, t_δ는 시간 창(time window)이다. 즉, 세 하이퍼엣지가 충분히 가까운 시간 안에 발생했을 때만 의미 있는 트라이어드로 인정한다.
이 제약이 있기 때문에 시간적 트라이어드는 96가지나 되는 모티프를 만들어낸다 — 공간적 겹침 패턴 × 시간 순서 조합.
260만 개의 논문(하이퍼엣지)과 192만 명의 저자(정점). 한 논문에 최대 280명이 공저하는 대규모 물리학 공저자 네트워크다.
트라이어드 분석이 알려주는 것:
628만 개의 그룹(하이퍼엣지)과 307만 명의 사용자(정점). 하이퍼엣지 크기가 최대 27,000 — 대규모 온라인 커뮤니티의 전형적인 패턴이다.
ESCHER의 활약:
970만 개의 스레드(하이퍼엣지)와 267만 명의 참여자(정점). Reddit이나 포럼 사이트에서의 토론 참여 패턴이다.
발견할 수 있는 것:
ESCHER도 완벽하지는 않다:
오일러가 다리 문제에서 "관계의 추상화"를 발명한 이래 290년, 우리는 드디어 다자간 관계를 제대로 다룰 수 있는 도구를 갖게 되었다.
ESCHER는 단순한 기술 논문이 아니다. 이것은 네트워크 과학의 패러다임 전환을 위한 기반 인프라다:
세상의 관계는 "둘"이 아니라 "여럿"이다. ESCHER는 그 사실을 수학적으로 표현하고, 공학적으로 처리하고, 과학적으로 분석할 수 있게 해주는 첫 번째 통합 플랫폼이다.
"The map is not the territory, but a good map changes how you see the territory."
좋은 지도는 영토를 바꾸지 않지만, 영토를 보는 방식을 바꾼다. 하이퍼그래프는 세상을 바꾸지 않지만, 세상을 이해하는 방식을 바꾼다. 그리고 ESCHER는 그 지도를 실시간으로 그릴 수 있게 해준다.