엔비디아가 생성형 AI를 통해 HPC 작업을 가속화하며 △코드 생성 △기상 △유전학 △재료 과학 분야의 연구를 지원하고 있다고 16일 밝혔다.
코드 생성·기상·유전학·재료 과학서 HPC 지원
엔비디아가 생성형 AI를 통해 HPC 작업을 가속화하며 △코드 생성 △기상 △유전학 △재료 과학 분야의 연구를 지원하고 있다고 16일 밝혔다.
샌디아 국립 연구소(Sandia National Laboratories)는 세계 최대 규모의 슈퍼컴퓨터에서 사용하도록 설계된 병렬 프로그래밍 언어인 코코스(Kokkos)로 코드를 자동으로 생성하는 시도를 하고 있다. 여러 국립 연구소의 연구진들이 개발한 이 특수 언어는 수만 대의 프로세서에서 작업을 수행하는 데 필요한 미묘한 부분까지도 처리할 수 있다.
샌디아 국립 연구소의 연구진들은 검색 증강 생성(retrieval-augmented generation, RAG)을 사용해 코코스 데이터베이스를 생성하고 AI 모델과 연결하고 있다. 다양한 RAG 접근 방식을 실험하면서 초기 테스트에서 긍정적인 결과를 보여줬다고 전했다.
샌디아 국립 연구소의 익스트림 스케일 컴퓨팅(extreme scale computing) 수석 매니저인 로버트 훅스트라(Robert Hoekstra)는 “엔비디아는 HPC 소프트웨어 개발자의 작업을 획기적으로 가속화하는 데 필요한 다양한 툴 세트를 제공한다”고 말했다.
연구진들은 궁극적으로 기후, 생물학, 재료 과학과 같은 분야의 과학 데이터로 훈련된 파운데이션 모델의 활용을 목표로 하고 있다.
■ 기후 변화에 대한 선제적 대응
일기 예보 분야의 연구원과 기업들은 기상, 기후 연구를 위한 서비스와 소프트웨어 세트인 엔비디아 어스-2(Earth-2)의 생성형 AI 모델인 코디프(CorrDiff)를 채택하고 있다.
코디프는 기존 대기 모델의 25km 해상도를 2km까지 조정할 수 있다. 또한, 결합할 수 있는 예측 수를 100배 이상 확장해 예측 신뢰도를 향상시켰다.
자체 소형 위성 네트워크에서 데이터를 수집하는 미국 기업 ‘스파이어’의 머신러닝 및 모델링 책임자 톰 고완은 “생성형 AI를 통해 더 빠르고 정확한 예보가 가능해지고 있다”면서 “엔비디아와의 파트너십으로 훈련과 추론에 엔비디아 GPU를 이용하고 있다”고 말했다.
스위스 기업인 메테오매틱스(Meteomatics)도 최근 자사의 일기 예보 사업에도 엔비디아의 생성형 AI 플랫폼을 사용할 계획이라고 밝힌 바 있다.
■ 의료 서비스 개선을 위한 유전자 생성
아르곤 국립 연구소(Argonne National Laboratory)의 과학자들은 AI 기술을 사용해 코로나19의 원인이 되는 바이러스를 더 잘 이해하도록 돕는 유전자 염기서열을 생성하고 있다. GenSLM 모델은 실제 SARS-CoV-2 변종과 매우 유사한 시뮬레이션을 생성했다.
아르곤 국립 연구소의 수석 연구원인 아르빈드 라마나단(Arvind Ramanathan)은 블로그에서 “게놈의 여러 부분이 어떻게 공진화하는지 이해하면 바이러스가 새로운 취약성이나 새로운 형태의 저항성을 개발할 수 있는 단서를 얻을 수 있다”고 전했다.
GenSLM은 엔비디아 A100 텐서 코어 GPU 기반 슈퍼컴퓨터를 통해 1억 1천만 개 이상의 게놈 서열을 훈련했다. 이러한 슈퍼컴퓨터에는 아르곤 국립 연구소의 폴라리스 시스템, 미국 에너지부의 펄머터, 엔비디아의 셀레네 등이 있다.
■ MS의 신소재 제안
마이크로소프트의 매터젠(MatterGen) 모델은 원하는 특성을 나타내는 새롭고 안정적인 물질을 생성한다. 이 접근 방식을 통해 화학, 자기, 전자, 기계 등의 기타 원하는 특성을 지정할 수 있다.
마이크로소프트 연구팀은 엔비디아 A100 GPU를 사용해 애저(Azure) AI 인프라에서 매터젠을 훈련했다.
카본3D(Carbon3D)와 같은 기업들은 상업용 3D 프린팅 작업에서 재료 과학에 생성형 AI를 적용하며 기회를 찾고 있는 것으로 전해졌다.