넷앱, 고성능의 GPU 의존 없이 빠르게 AI 추론 인프라 구축

[IT 인사이트] 넷앱, “고성능의 GPU 의존 없이 빠르게 AI 추론 인프라 구축”

기사입력2026.04.29 15:49

▲테라텍의 데이터센터 내에 넷앱의 ‘NetApp AIPod Mini with Intel’이 설치돼 있다.

검증된 인프라로 수일 내 구축, 쿠버네티스·대시보드 기반 관리
SK네트웍스서비스·테라텍 통해 국내 공급, 지원 서비스도 제공

넷앱(NetApp)이 인텔, 테라텍, SK네트웍스서비스와 협력해 ‘NetApp AIPod Mini with Intel’을 한국 시장에 출시하며, 고성능의 GPU를 갖춘 AI 데이터 센터에 의존하지 않고서도 CPU 기반 추론을 통해 사내 부서 또는 규제 산업에서 빠르게 AI 추론 인프라를 구축할 수 있도록 적극 나섰다.

넷앱은 29일 열린 출시 기자간담회를 통해 ‘NetApp AIPod Mini with Intel’이 “과도한 인프라 투자 없이 기업이 AI 추론을 빠르게 도입할 수 있도록, 비용·복잡성 장벽을 낮춘 통합형 레퍼런스 시스템”이라고 밝혔다.

NetApp AIPod Mini는 인텔 제온 6 기반 x86 서버와 네트워크 스위치, 넷앱 올플래시 스토리지(ONTAP 기반)를 한 묶음으로 구성하고, 인텔이 주도하는 OPEA(Open Platform for Enterprise AI) 소프트웨어 스택을 올린 ‘패키지형 AI 추론 인프라’다.

RAG(검색증강생성) 또는 LLM 워크플로를 기반으로 기업의 데이터 자산을 AI가 활용하도록 해, 생성형 AI가 ‘사내 데이터에서 맥락 있는 답’을 찾도록 돕는 것이 핵심 목표다.

기존 AI 데이터센터가 대규모 GPU 클러스터 중심으로 설계돼 초기비용과 운영 난도가 높았다면, AIPod Mini는 ‘GPU 없이도 가능한 영역의 추론 워크로드’를 CPU 기반으로 최적화한 점을 전면에 내세운다.

▲조민성 인텔코리아 상무가 발표하고 있다.

조민성 인텔코리아 상무는 모델 크기를 세 구간으로 나누며 “7B∼8B 수준의 스몰 언어모델(SLM)은 GPU 도움 없이도 CPU만으로 프로덕션 환경에서 수행 가능하다”고 강조했다.

‘AI=GPU’라는 고정관념 대신, 워크로드 성격에 맞춰 CPU 추론이라는 선택지를 제시한 셈이다.

성능 근거로는 제온 6에 탑재된 인텔 AMX(행렬 연산 가속)와 메모리 대역폭 강화를 위한 MRDIMM, 그리고 oneAPI·OpenVINO 등 소프트웨어 최적화 스택이 언급됐다.

조민성 상무는 AMX가 코어 단위로 포함돼 행렬곱 연산을 가속하고, 메모리 대역폭 확대가 AI 성능에 중요한 역할을 한다고 설명했다.

또 다른 차별점은 ‘도입 속도’다.

▲김기석 넷앱 상무가 ‘NetApp AIPod Mini with Intel’를 소개하고 있다.

김기석 넷앱 상무는 엔터프라이즈 환경에서 RAG 프로젝트가 데이터 수집부터 환경 구성, 모델 선정, 사내 데이터 결합과 튜닝까지 이어지며 통상 수개월이 걸릴 수 있다고 짚었다.

반면 AIPod Mini는 검증된 레퍼런스 디자인(서버·스위치·스토리지)과 패키지 형태의 설계를 통해 ‘불필요한 기술 복잡성’을 낮추고 구축 시간을 단축하는 방향으로 설계됐다는 설명이다.

넷앱과 인텔이 반복해 강조한 타깃은 대기업의 ‘전사 AI 데이터센터’가 아니라, 특정 업무를 빠르게 자동화해야 하는 부서·지점 단위 조직이다.

김기석 넷앱 상무는 부서·지점 수준에서 AI 추론을 구축할 때 “기업 AI 인프라가 너무 크고 불필요하게 복잡해 요구와 불일치가 발생한다”고 지적하며, 이를 해결하기 위한 런타임 AI 솔루션으로 AIPod Mini를 제시했다.

구체적 사용처로는 법무의 계약·문서 업무, 소매의 재고·개인화, 제조의 예측 유지보수 등이 대표 사례로 제시됐다.

특히 외부 클라우드에 데이터를 올리기 어렵거나 인터넷 환경이 제한된 산업·공공 부문처럼 ‘로컬(온프레미스)에서 데이터와 AI를 함께 다뤄야 하는’ 수요가 핵심 고객군으로 거론됐다.

김기석 넷앱 상무는 특정 부서 또는 인터넷 환경이 법률·산업 규제로 제약되는 곳에 쓰기 위해 디자인했다고 밝혔고, 조민성 인텔 상무도 공공 부문이 온프레미스 형태의 프라이빗 인스턴스를 선호하는 사례를 들어 활용 가능성을 설명했다.

구축 파트너로 참여한 테라텍은 “데이터 사이언티스트나 R&D 조직이 없어도 빠르게 구축 가능한 형태”를 내세웠다.

▲강유진 테라텍 수석이 데모를 통해 ‘NetApp AIPod Mini with Intel’의 운영 방법을 설명하고 있다.

강유진 테라텍 수석은 검증된 인프라 구조 위에 OPEA 오픈소스를 올리면 “수일 내 시스템 구축”이 가능하다고 설명했다.

기본 구성은 스토리지·스위치·관리 서버·애플리케이션 서버로 이어지며, 애플리케이션 서버는 인텔 제온 6 기반으로 구성된다.

데모 환경의 예로, 애플리케이션 서버 2대(각 2소켓) 기준 총 344 코어, 1TB 메모리 구성이 언급됐다.

운영 측면에서는 대시보드를 통해 관리자/사용자 계정을 분리하고, 챗 Q&A 화면을 포함해 문서 요약, 오디오 Q&A 등 기능을 오픈소스를 내려받아 배포할 때 선택적으로 탑재 할 수 있다고 설명했다.

또한 프롬프트 템플릿, 리트리버/재정렬 파라미터, 가드레일, LLM 응답 파라미터(예: temperature·토큰 제한 등)를 UI에서 조정할 수 있다는 점도 강조됐다.

AIPod Mini의 핵심 메시지 중 하나는 ‘로컬 AI’의 보안·거버넌스다.

김기석 상무는 온프레미스 환경에서 데이터를 처리하고, ONTAP의 접근 제어·버저닝·추적성 기능으로 AI 워크플로 전반에 보안과 거버넌스를 적용할 수 있다고 밝혔다.

또한 ONTAP의 강력한 ACL과 메타데이터 기반 거버넌스, 그리고 FIPS 140-2/140-3 등 인증을 언급하며 민감 데이터 보호를 강조했다.

즉 ‘사내 데이터가 밖으로 나가지 않게’ 하면서도 RAG 기반으로 업무 정확도를 높이려는 기업 수요를 정면으로 겨냥한 셈이다.

테라텍은 CPU 추론의 체감 성능을 ‘TTFT(첫 토큰 출력 시간)’와 동시 사용자 확장성 관점에서 제시했다.

강유진 수석은 벤치마크 결과 동시 사용자 30∼50명 수준에서는 TTFT와 토큰 처리량이 크게 변하지 않았다고 설명하며, 현 구성에서 추천 사용자 수치를 제시했다.

사용자가 더 늘면 애플리케이션 서버를 확장하는 방식으로 대응할 수 있다는 취지다.

넷앱 측도 “대상 사용자가 500명, 1,000명, 1,500명 수준으로 늘 경우 서버를 추가해 배포하면 그만큼 성능을 낼 수 있다”는 확장 방향을 언급했다.

행사에서 3사가 공통으로 제시한 시장 전망은 ‘추론(inferencing) 중심 성장’이다.

김기석 상무는 AI 프로젝트가 모델 트레이닝 중심에서 추론·운영·배포 중심으로 이동하고 있으며, 고성능 GPU 일변도에서 최적화된 환경에서 CPU 기반으로 돌리는 흐름이 커지고 있다고 진단했다.

OPEA 생태계 역시 제품 확산의 촉매로 거론됐다.

조민성 상무는 OPEA가 엔터프라이즈 AI 도입을 쉽게 하기 위한 오픈소스 커뮤니티 프로젝트이며, 필요한 파이프라인 모듈을 ‘레고 블록’처럼 제공해 고객이 커스터마이징하거나 엔드투엔드 스택을 바로 가져다 쓸 수 있다고 설명했다.

넷앱은 “생성형 AI가 범용 솔루션으로 주목받지만 프롬프트 해석 정확도 문제로 기대 성과를 못 얻는 경우가 많다”는 점을 짚으며, AIPod Mini가 고유 데이터를 비즈니스 성과로 전환하도록 돕겠다는 메시지도 내놨다.

공급 측면에선 4월29일 기준 SK네트웍스서비스와 테라텍을 통해 국내 공급될 예정이며, 고객의 AI 활용 사례에 맞춘 구축·운영 지원 서비스도 함께 제공된다.

#데이터센터 #AI 추론 #NetApp AIPod Mini #CPU 기반 #GPU 의존 #OPEA #인텔 제온 6 #통합형 레퍼런스 시스템 #로컬 AI #보안 및 거버넌스

배종인 기자jongin@e4ds.com

기사 전체보기

관련뉴스

“지능형 데이터 인프라는 데이터를 실시간으로 AI 성과로 연결하는 플랫폼”

넷앱(NetApp)이 3일 웨스틴 서울 파르나스에서 ‘NetApp INSIGHT Xtra’ 행사를 개최하고, AI 시대에서 성공을 위한 데이터 전략을 공유했다. 이날 기조연설을 맡은 조지 쿠리안(George Kurian) 넷앱 CEO는 “AI의 성패는 모델이 아니라 데이터 인프라에서 결정된다”며, 분산형 아키텍처 기반의 ‘넷앱 데이터 플랫폼(NetApp Data Platform)’을 중심으로 한 기술 로드맵을 발표했다.

2026-02-03 11:10:26by 배종인 기자

“AI 성공 핵심, 인프라보다 데이터 전략 먼저 세우는데 있다”

지난 3일 웨스틴 서울 파르나스에서 열린 ‘NetApp INSIGHT Xtra’ 행사에서는 ‘현장에서 답을 찾다: AI 전환의 현실과 리스크 관리’를 주제로 국내 AI 산업 현장의 고민과 해법을 짚는 패널 토론이 진행됐다. 패널 토론에서는 김은섭 넷앱(NetApp) 상무가 좌장을 맡고, 서영민 DS&G 전무, 김자현 업스테이지 AI 이사가 패널로 참여해 기업들의 AI 도입 과정에서 마주하는 오해와 한계를 짚었다.

2026-02-03 13:13:23by 배종인 기자

“데이터 인프라는 AI 혁신을 이끄는 엔진”

글로벌 데이터 인프라 기업 넷앱(NetApp)은 3일 웨스턴 서울 파르나스에서 기자간담회를 갖고 한국 진출 25주년을 맞아 AI 시대를 대비한 데이터 플랫폼 전략을 공개했다. 이날 발표를 담당한 헨리 코(Henry Kho) 넷앱 GCASK(중국·아세안·한국) 부사장과 강연식 전무는 “AI의 성패는 알고리즘이 아니라 데이터를 어떻게 관리하고 활용하느냐에 달려 있다”며 지능형 데이터 플랫폼의 중요성을 강조했다.

2026-02-03 15:39:32by 명세환 기자

넷앱, 슈퍼볼 LX 데이터 운영 공식 지원…리바이스 스타디움 인프라 구축

지능형 데이터 인프라 기업 넷앱이 NFL 슈퍼볼 LX의 데이터 운영을 공식 지원한다. 넷앱은 샌프란시스코 포티나이너스 및 NFL과의 협력을 통해 리바이스 스타디움에 엔터프라이즈급 데이터 플랫폼을 구축했다. 경기 중 생성되는 선수 동작 추적 데이터와 고해상도 영상, 실시간 팬 반응 등 대규모 데이터를 안정적으로 처리·관리하는 환경을 마련하는 것이 핵심이다. NFL이 글로벌 시장 확대에 나서는 가운데, 데이터 기반 운영은 경기 품질과 팬 경험을 좌우하는 요소로 부각되고 있다. 넷앱의 인프라는 슈퍼볼 LX 개최 과정에서 경기 운영 효율성을 높이고, 지역과 환경에 관계없이 일관된 디지털 서비스를 제공하는 데 활용될 예정이다.

2026-02-10 10:06:43by 명세환 기자

넷앱, 엔비디아와 AI 데이터 플랫폼 공동 설계…분산 데이터 관리 겨냥

넷앱이 엔비디아와 공동 설계한 AI 데이터 플랫폼 ‘NetApp AI Data Engine(AIDE)’을 공개했다. 이 플랫폼은 기업 내 분산된 데이터를 이동하지 않고 분석해 메타데이터를 확장하고, 검색·선별·변환·제공 등 AI 데이터 파이프라인 전반을 지원하는 데 초점을 맞췄다. 넷앱은 주요 고객과 파트너를 대상으로 우선 공급을 시작한 뒤 올해 8월 전후 본격 상용화를 추진할 계획이다. 향후 하이브리드 클라우드, 멀티모달 데이터, 에이전틱 AI 지원도 확대할 방침이다.

2026-03-24 13:41:24by 배종인 기자

넷앱·컴볼트, 하이브리드 환경 사이버 복원력 강화 맞손

지능형 데이터 인프라 기업 넷앱과 엔터프라이즈 데이터 보호 전문 기업 컴볼트가 손잡고 기업의 사이버 복원력 강화를 위한 통합 솔루션을 선보인다.

2026-03-30 16:56:02by 배종인 기자