인피니언 StrongIRFET™
반도체 AI 보안 인더스트리 4.0 SDV 스마트 IoT 컴퓨터 통신 특수 가스 소재 및 장비 유통 e4ds plus

클라우데라, 엔비디아 기반 온프레미스 AI 추론 기능 공개

기사입력2026.02.10 13:27


데이터센터에서 LLM·이상 탐지 배포 지원…트리노 기반 데이터 웨어하우스·시각화도 확장


클라우데라가 엔비디아(NVIDIA) 기술로 구동되는 온프레미스 AI 추론 기능을 발표하며, 데이터센터에서 AI 모델 배포와 분석·시각화까지 묶는 확장 전략을 제시했다.

클라우데라는 2026년 2월 10일 서울에서 ‘클라우데라 AI 인퍼런스(Cloudera AI Inference)’와 트리노(Trino) 기반 데이터 웨어하우스의 온프레미스 확장을 공개했다고 밝혔다.

기업들이 AI 실험 단계를 넘어 운영 단계로 전환하면서, 데이터가 저장된 위치와 무관하게 AI가 안전하게 접근하도록 하는 요구가 커지고 있다는 게 회사 측 설명이다. 클라우데라는 자사 보고서를 인용해 전체 기업의 약 42%가 데이터를 데이터 웨어하우스에 저장하고 있다고 덧붙였다.

온프레미스 환경에서 제공되는 클라우데라 AI 인퍼런스는 기업이 데이터센터 내에서 LLM, 이상 거래 탐지, 컴퓨터 비전, 음성 AI 등 모델을 배포·확장할 수 있도록 설계됐다. 회사는 최신 엔비디아 네모트론(Nemotron) 오픈 모델을 포함해 다양한 모델을 지원한다고 밝혔다.

클라우데라는 해당 기능이 엔비디아 AI 스택과 블랙웰(Blackwell) GPU, 다이나모-트리톤(Dynamo-Triton) 추론 서버, NIM 마이크로서비스로 가속된다고 설명했다. 이를 통해 클라우드 비용 변동성을 피하고 지연 시간, 규제 준수, 데이터 프라이버시를 통제하는 데 초점을 맞췄다고 했다.

트리노 기반 클라우데라 데이터 웨어하우스는 데이터센터 지원 확대로 중앙화된 보안·거버넌스·가시성을 제공하고, AI 기반 분석·시각화 기능을 통합해 인사이트 접근을 높인다고 밝혔다.

데이터 비주얼라이제이션은 차트·시각 자료 요약을 자동 생성하는 ‘AI 어노테이션’, AI 쿼리 로깅·추적, SSO 기반 설정을 포함한 관리 기능 개선 등을 업데이트 항목으로 제시했다. 클라우데라는 이번 확장이 데이터 이동 없이 데이터센터에서 AI와 분석을 운영하는 시나리오를 염두에 둔 것이라고 설명했다.