전 세계 80개 이상 신규 과학 시스템에 AI 가속 지원하는 NVIDIA

NVIDIA는 지난 1년간 전 세계 총 4,500 엑사플롭스의 AI 성능에 기여한 NVIDIA 가속 플랫폼의 성과를 발표했습니다
by NVIDIA Korea

지난 1년 동안 전 세계 곳곳에서 NVIDIA 가속 컴퓨팅 플랫폼을 기반으로 한 새로운 과학 연구용 시스템이 80개 이상 공개되었습니다. 이들 시스템이 더해낸 AI 성능은 총 4,500엑사플롭스에 달합니다.

그 중 가장 최근 선보인 것은 미국 최대 규모의 학술용 슈퍼컴퓨터인 텍사스 첨단 컴퓨팅 센터(Texas Advanced Computing Center, TACC)의 300 페타플롭스급 호라이즌(Horizon) 시스템인데요.

호라이즌은 NVIDIA GB200 NVL4와 NVIDIA Vera CPU 서버로 구동되며, NVIDIA Quantum-X800 InfiniBand 네트워킹으로 상호 연결될 예정이죠. 호라이즌은 2026년 가동 시 과학, 공학 분야의 획기적인 발전을 가속화할 것으로 기대됩니다. 그리고 미국 연구 커뮤니티에 발견과 혁신을 위한 전례 없는 컴퓨팅 역량을 제공할 전망이죠.

이 시스템은 NVIDIA 가속 슈퍼컴퓨터의 최신 사례로, 의료, 기상, 기후 모델링, 로보틱스, 제조, 양자 컴퓨팅 연구, 재료 과학 등 다양한 분야에서 국가와 민간 기업의 글로벌 연구를 촉진합니다.

NVIDIA의 풀스택 가속 컴퓨팅 플랫폼은 GPU, CPU, DPU, NIC, 스케일아웃 스위치, CUDA-X 라이브러리, NVIDIA AI Enterprise 소프트웨어를 포괄합니다. 이로써 시스템이 과학을 지속 가능하고 전례 없는 속도로 발전시키는 데 필요한 통합 아키텍처, 확장성, 효율성을 제공하죠.

TACC를 위한 호라이즌의 과학적 혁신

4,000개의 NVIDIA Blackwell GPU를 탑재한 호라이즌 슈퍼컴퓨터는 FP4 정밀도에서 최대 80 엑사플롭의 AI 컴퓨팅 성능을 지원합니다. 이 시스템은 아래와 같은 특정 과학적 모델링과 시뮬레이션 애플리케이션을 지원하도록 설계됐습니다.

  • 질병의 역학 시뮬레이션: 연구자들은 분자 역학 소프트웨어와 AI 강화 시뮬레이션을 활용해 바이러스를 연구할 계획입니다.
  • 우주 전역의 별과 은하 모델링: 천체물리학자들은 별과 은하의 형성 과정을 탐구하고, 제임스 웹 우주 망원경(James Webb Space Telescope)의 최근 발견으로 밝혀진 먼 은하들을 시뮬레이션할 예정입니다.
  • 원자 규모 신소재 연구: 과학자들은 난류, 복잡한 결정 구조를 가진 고체 물질, 양자 물질의 전도성을 연구할 계획입니다.
  • 지진 대비를 위한 지진파 매핑: 연구자들은 지진 위험 지도를 개선하고, 지진 발생 시 단층이 어떻게 파열되는지 시뮬레이션할 계획입니다.

TACC의 고성능 컴퓨팅 디렉터인 John Cazes는 “호라이즌은 과학자들이 전례 없는 규모로 야심찬 과학 연구를 수행할 수 있게 할 것입니다. 이 새로운 시스템은 연구 커뮤니티가 바이러스 감염의 분자 역학을 해독하고, 먼 은하계의 데이터를 탐구하며, 수십 년 후의 지진 활동을 시뮬레이션하는 등 AI 기반 연구를 추진하는 방식을 혁신할 것”이라고 말했습니다.

 

아르곤 국립연구소와 로스앨러모스 국립연구소, 신규 AI 슈퍼컴퓨터 구축

미국 에너지부(Department of Energy, DOE)는 최근 일리노이주 아르곤 국립연구소(Argonne National Laboratory, ANL)와 뉴멕시코주 로스앨러모스 국립연구소(Los Alamos National Laboratory, LANL)에 7대의 신규 AI 슈퍼컴퓨터를 구축하기 위해 NVIDIA와 협력 관계를 체결했다고 발표했습니다.

ANL에서는 NVIDIA Blackwell GPU와 NVIDIA 네트워킹을 탑재한 두 대의 AI 슈퍼컴퓨팅 시스템을 DOE의 과학 기기∙데이터 자산 네트워크와 연결할 예정인데요. 이는 연구진이 과학과 에너지 응용 분야를 위한 강력한 AI 모델을 개발할 수 있도록 지원합니다.

연구소 단지 내 최대 규모 시스템인 솔스티스(Solstice)는 10만 개의 NVIDIA Blackwell GPU를 탑재할 예정입니다. NVIDIA GB200 NVL72 시스템을 탑재한 솔스티스는 훈련 시 무려 1,000 엑사플롭스에 달하는 AI 훈련 컴퓨팅 성능을 낼 수 있죠. 이는 2025년 6월 기준 TOP500 전체 목록의 AI 훈련 컴퓨팅 성능 합계인 약 650 엑사플롭스보다 50% 이상 높은 수치입니다.

또 다른 ANL 시스템인 ‘이퀴녹스(Equinox)’는 1만 개의 NVIDIA Blackwell GPU로 구동될 예정입니다. 연구소의 NVIDIA 가속 시스템인 ‘미네르바(Minerva)’, ‘야누스(Janus)’, ‘타라(Tara)’는 AI 추론과 인력 개발을 지원하죠.

LANL에서 휴렛팩커드 엔터프라이즈(Hewlett Packard Enterprise, HPE)가 구축, 공급할 미션(Mission)과 비전(Vision) 시스템은 NVIDIA Vera Rubin 플랫폼과 NVIDIA Quantum-X800 InfiniBand 네트워킹 플랫폼으로 구동될 예정입니다. 미션 시스템은 미국 국가핵안보실(National Nuclear Security Administration, NNSA)의 기밀 연구 및 핵심 애플리케이션을 처리하는 데 사용되며, 비전 시스템은 파운데이션 모델, 에이전틱 AI 등을 포함한 오픈 과학 연구 전반을 지원해 과학자들이 보다 빠르게 새로운 발견을 이끌 수 있도록 설계되었습니다.

두 시스템 모두 2027년 가동될 것으로 예상됩니다.

이 일곱 개의 DOE 시스템은 과학적 발견을 위한 슈퍼컴퓨터인 ‘다우드나(Doudna)‘에 이은 올해의 발표인데요. 다우드나는 로렌스 버클리 국립연구소(Lawrence Berkeley National Laboratory)와 함께 발표한 슈퍼컴퓨터로, 2026년 가동 예정입니다. NVIDIA Vera Rubin 아키텍처와 NVIDIA Quantum-X800 InfiniBand로 구동되는 다우드나는 핵융합 에너지, 재료 과학, 신약 개발, 천문학 분야의 11,000명 이상 연구자들의 작업을 지원할 예정입니다.

유럽 율리히 슈퍼컴퓨터, 린팩(Linpack) 벤치마크에서 엑사플롭 성능 돌파

유럽에서는 스위스 국립 슈퍼컴퓨팅 센터와 이탈리아 시네카(CINECA) 슈퍼컴퓨팅 센터의 시스템을 포함한 NVIDIA 가속 슈퍼컴퓨터들이 유럽 전역의 과학 연구를 주도하고 있습니다.

독일 율리히(Jülich) 슈퍼컴퓨팅 센터의 주피터(JUPITER) 시스템은 이중 정밀도(FP64) 컴퓨팅 성능을 측정하는 HPL 벤치마크에서 초당 1경(10의 18승) 부동소수점 컴퓨팅을 수행하는 엑사플롭 성능을 달성했죠.

주피터 랙 내부의 컴퓨트 블레이드(compute blade) (자료제공: 율리히 연구센터)

올해 9월에 가동을 시작한 주피터는 유럽 최초의 엑사스케일 컴퓨터로, NVIDIA Quantum-2 InfiniBand로 상호 연결된 24,000개의 NVIDIA GH200 Grace Hopper 슈퍼칩을 탑재하고 있습니다. 이는 고해상도 세계 기후 시뮬레이션을 비롯한 다양한 응용 분야에 활용되고 있습니다.

율리히 슈퍼컴퓨팅 센터 책임자인 Kristel Michielsen은 “주피터의 1 엑사플롭 이상의 컴퓨팅 성능을 통해 이제 킬로미터 단위 해상도로 세계 규모 시뮬레이션을 실행할 수 있게 됐습니다. 이러한 컴퓨팅 능력의 도약으로 유럽 연구진은 과학 분야 전반에 걸쳐 복잡성, 규모, 범위 측면에서 새로운 차원의 AI 모델과 시뮬레이션을 수행할 수 있게 되었습니다”라고 말했습니다.

지난 1년간 공개된 유럽의 주요 슈퍼컴퓨터는 다음과 같습니다.

  • 블루 라이온(Blue Lion): 독일 라이프니츠 슈퍼컴퓨팅 센터(Leibniz Supercomputing Centre)의 시스템으로, 2027년 초 가동을 목표로 한다. NVIDIA Vera Rubin 플랫폼으로 구동돼 기후, 난류, 물리학, 머신러닝 연구를 지원하는 역할을 할 예정입니다.
  • 게피온(Gefion): 덴마크 최초의 AI 슈퍼컴퓨터로, 덴마크 AI 혁신 센터(Danish Center for AI Innovation, DCAI)에서 운영하며 NVIDIA DGX SuperPOD 시스템을 기반으로 합니다. 양자 컴퓨팅, 청정 에너지, 생명공학 등 분야의 연구 발전을 위해 덴마크 혁신가들에게 소버린 AI 역량을 제공합니다.
  • 이삼바드-AI(Isambard-AI): 영국 브리스톨 대학에 위치한 영국 최고 성능의 AI 슈퍼컴퓨터다. 영국 국가보건서비스(National Health Service, NHS) 데이터로 훈련된 멀티모달 기초 모델인 나이팅게일(Nightingale) AI와 웨일스어, 기타 영국 언어에 대한 고품질 AI 추론을 가능하게 하는 UK-LLM 프로젝트 등에 활용되고 있습니다.
게피온은 덴마크 최초의 AI 슈퍼컴퓨터로, NVIDIA DGX SuperPOD와 NVIDIA Quantum-2 InfiniBand 네트워킹으로 구성됩니다. (자료제공: DCAI)

한국일본대만 슈퍼컴퓨터, 산업 전반 연구 촉진

소버린 AI 투자와 민간 부문 이니셔티브를 통해, NVIDIA 가속 AI 인프라는 한국, 일본, 대만의 과학 연구를 지원하고 있습니다.

한국 정부는 소버린 클라우드와 AI 팩토리에 5만 대 이상의 NVIDIA GPU를 배치할 계획인데요. 삼성(Samsung), SK그룹(SK Group), 현대자동차그룹(Hyundai Motor Group) 등 업계 선도 기업들도 NVIDIA Blackwell GPU를 활용한 AI 팩토리를 구축해 연구와 생산 가속화를 추진하고 있습니다.

일본 최고 연구 기관인 리켄(RIKEN, 이화학연구소)은 SC25에서 과학 연구용 AI를 위한 1,600-GPU급 시스템과 양자 컴퓨팅을 위한 540-GPU급 시스템에 중점을 둔 두 대의 신규 슈퍼컴퓨터에 NVIDIA GB200 NVL4 시스템을 통합한다고 발표했습니다.

리켄은 일본에서 구축 중인 두 개의 신규 슈퍼컴퓨터에 NVIDIA Blackwell을 도입하고 있습니다. 하나는 과학 연구용 AI, 다른 하나는 양자컴퓨팅을 위해 설계된 시스템입니다.

리켄은 후지쯔(Fujitsu), NVIDIA와 협력해 글로벌 시스템 모델링, 신약 개발 연구, 첨단 제조 애플리케이션을 구동할 슈퍼컴퓨터 ‘후가쿠NEXT(FugakuNEXT, 개발 코드명)’를 공동 설계 중인데요. 이 시스템은 NVLink Fusion을 통해 NVIDIA 기술과 연동 가능한 후지쯔 모나카-X(FUJITSU-MONAKA-X) CPU를 탑재할 예정입니다.

도쿄 공과대학(Tokyo University of Technology)은 100개 미만의 GPU로 2 엑사플롭스의 FP4 이론적 컴퓨팅 성능을 달성할 수 있는 NVIDIA DGX B200 시스템 기반 AI 슈퍼컴퓨터를 구축했습니다. 이 시스템은 대규모 언어 모델 개발과 디지털 트윈 구축에 활용돼, 차세대 AI 인재 양성을 위한 핵심 인프라 역할을 할 예정입니다.

일본 산업기술종합연구소(National Institute of Advanced Industrial Science and Technology, AIST)는 최근 2,000개 이상의 NVIDIA H100 GPU를 탑재한 세계 최대 규모의 양자컴퓨팅 연구용 슈퍼컴퓨터 ABCI-Q를 공개했습니다.

NVIDIA는 세계 최대 규모의 양자컴퓨팅 연구용 슈퍼컴퓨터 ABCI-Q를 지원하고 있습니다. (자료제공: AIST G-QuAT)

대만에서는 NVIDIA가 폭스콘 혼하이 테크놀로지(Foxconn Hon Hai Technology) 그룹과 협력해 1만 개의 NVIDIA Blackwell GPU를 탑재한 AI 팩토리 슈퍼컴퓨터를 구축 중입니다. 이 슈퍼컴퓨터는 연구자, 스타트업, 산업 전반에 걸친 혁신을 촉진할 예정이죠.

NVIDIA 가속 슈퍼컴퓨팅에 대해 자세히 알아보고, NVIDIA 하이퍼스케일과 고성능 컴퓨팅(HPC) 부문 부사장 Ian Buck의 SC25 파이어사이드 챗을 시청하세요.