2026 Physical AI Conference
반도체 AI 보안 인더스트리 4.0 SDV 스마트 IoT 컴퓨터 통신 특수 가스 소재 및 장비 유통 e4ds plus

엔비디아, 맞춤형 AI 시대 가속화…네모트론 3 오픈 모델 공개

기사입력2025.12.16 11:47


 
네모트론 3, 하이브리드 MoE 아키텍처 기반 효율성·정확성 동시 확보
언슬로스, LLM 미세 조정 성능 2.5배 향상·엔비디아 하드웨어서 최적

AI 컴퓨팅 분야의 글로벌 선두주자인 엔비디아(NVIDIA)가 새로운 오픈 모델 제품군 네모트론 3(Nemotron 3)를 공개하며, 맞춤형 AI 시대를 가속화한다.

엔비디아는 네모트론 3(Nemotron 3) 공개하고, 오픈소스 프레임워크 언슬로스(Unsloth)를 통해 거대 언어 모델(LLM) 미세 조정을 한층 더 빠르고 효율적으로 지원한다고 16일 밝혔다.

이번 발표는 RTX AI PC와 초소형 슈퍼컴퓨터 DGX 스파크(DGX Spark)를 기반으로, 학습·업무·창작 프로젝트에 최적화된 맞춤형 AI 어시스턴트 구축을 가능하게 한다는 점에서 큰 의미를 가진다.

네모트론 3는 나노(Nano), 슈퍼(Super), 울트라(Ultra) 세 가지 모델로 구성된다.

모두 하이브리드 전문가 혼합(Mixture-of-Experts, MoE) 아키텍처를 기반으로 설계돼 효율성과 정확성을 동시에 확보했다.

네모트론 3 나노 30B-A3B는 가장 컴퓨팅 효율이 높은 모델로, 소프트웨어 디버깅, 콘텐츠 요약, AI 어시스턴트 워크플로우에 최적화됐다.

추론 토큰을 최대 60% 줄여 비용을 절감하고, 100만 토큰 컨텍스트 윈도우를 지원해 장시간·다단계 작업에서도 높은 정확도를 유지한다.

네모트론 3 슈퍼는 멀티 에이전트 애플리케이션을 위한 고정밀 추론 모델, 울트라는 복잡한 AI 애플리케이션을 위한 모델로 2026년 상반기 출시 예정이다.

엔비디아는 이와 함께 개방형 훈련 데이터세트와 강화학습 라이브러리를 공개해, 개발자들이 다양한 환경에서 네모트론 3를 활용할 수 있도록 했다.

언슬로스는 세계적으로 널리 사용되는 LLM 미세 조정 프레임워크로, 엔비디아 GPU 환경에서 허깅페이스 트랜스포머 라이브러리 성능을 최대 2.5배 향상시킨다.

미세 조정 방식은 크게 세 가지로 나뉜다.

파라미터 효율적 미세 조정(LoRA, QLoRA)은 모델 일부만 업데이트해 빠르고 저비용으로 성능을 개선하는 방식이다.

완전 미세 조정은 모든 매개변수를 업데이트해 특정 형식이나 스타일을 따르도록 모델을 훈련하는 데 적합하다.

강화 학습은 피드백을 통해 모델의 행동을 조정하는 고급 방식으로, 법률·의학 등 전문 분야에서 정확도를 높이는 데 활용된다.

언슬로스는 GPU 메모리 사용을 최소화해 RTX 데스크톱·노트북, RTX PRO 워크스테이션, DGX 스파크 등 다양한 엔비디아 하드웨어에서 최적화된 성능을 제공한다.

엔비디아는 그레이스 블랙웰(Grace Blackwell) 아키텍처 기반의 DGX 스파크를 통해 로컬 미세 조정을 지원한다.

DGX 스파크는 최대 1페타플롭(FP4) AI 성능과 128GB 통합 메모리를 제공해, 300억개 이상의 파라미터를 가진 대형 모델도 안정적으로 처리할 수 있다.

완전 미세 조정과 강화학습 기반 워크플로우를 빠르게 실행하며, 클라우드 대기 없이 로컬에서 제어 가능하다는 점이 강점이다.

또한 고해상도 확산 모델도 단 몇 초 만에 1천 개 이미지를 생성할 수 있어, 창의적 작업이나 멀티모달 파이프라인에서도 높은 처리량을 유지한다.

엔비디아의 이번 발표는 생성형 AI와 에이전틱 AI(agentic AI)의 가능성을 현실화하는 중요한 전환점이다.

제품 지원 챗봇, 개인 일정 관리 비서 등 다양한 맞춤형 AI 어시스턴트 구축이 가능해지며, 기업과 개인 모두에게 새로운 기회를 제공한다.

네모트론 3와 언슬로스, 그리고 DGX 스파크의 결합은 AI 미세 조정의 효율성과 접근성을 크게 높여, 연구자와 개발자 커뮤니티가 더욱 쉽게 AI 혁신을 실현할 수 있도록 한다.