노타, 퀄컴 엣지 AI 디바이스서 VLA 모델 최적화

기사입력2026.05.29 15:11

▲VLA 데모 화면(사진 : 노타)

NPU 기반 연산 최적화 적용, 피지컬 AI 동작 생성 시간 85% 감소

노타가 퀄컴 엣지 AI 환경에서 피지컬 AI용 모델을 최적화해 성능 개선 결과를 공개했다. 고연산 모델을 디바이스 수준에서 구동하면서 속도를 높이고 안정성을 유지하는 데 초점을 맞춘 사례로, 로봇 등 산업 현장에서의 온디바이스 AI 적용 가능성을 시사한다.

노타는 29일 퀄컴 엣지 AI 디바이스 ‘드래곤윙(Dragonwing) IQ-9075’ 환경에서 비전·언어·행동 통합 모델(VLA)을 최적화해 실행 속도를 개선했다고 밝혔다. 해당 모델은 ‘스몰VLA(SmolVLA) 0.45B’로, 실시간 동작 생성을 포함한 피지컬 AI 환경을 고려해 구현됐다.

VLA 모델은 이미지 인식, 언어 이해, 행동 생성 과정을 동시에 처리하는 구조로 구성된다.

일반적으로 서버 기반에서 구동되는 경우가 많으며, 단일 엣지 디바이스에서 실시간 실행 사례는 제한적인 것으로 알려졌다.

노타는 모델 전체를 축소하기보다 성능 개선 효과가 큰 구간을 중심으로 최적화를 적용했다고 설명했다. 특히 인식·이해 단계는 유지하고, 로봇 동작을 생성하는 단계에 집중했다.

적용된 주요 기술은 △반복 연산을 줄이는 ‘실시간 추론 최적화(Real-time Inference Optimization)’ △하드웨어 환경에 맞춰 연산 흐름을 조정하는 ‘NPU 기반 그래프 최적화(NPU-aware Graph Optimization)’ 등이다.

이 결과 동작 생성 단계 처리 시간은 218ms에서 31ms로 줄어 약 85.8% 감소했으며, 전체 추론 시간도 505ms에서 310ms로 단축된 것으로 나타났다. 작업 성공률은 기존 86%에서 85%로 큰 차이 없이 유지됐다고 회사 측은 밝혔다.

노타는 해당 기술을 미국 산타클라라에서 열린 ‘임베디드 비전 서밋 2026’에서 공개했다.

현장에서는 관람객이 물품을 선택하면 모델이 이를 인식하고 로봇팔 동작을 생성하는 방식의 시연이 진행됐다.

이번 데모는 입력에 따라 AI가 상황을 판단하고 행동을 생성하는 형태로 구성됐으며, 엣지 환경에서의 피지컬 AI 동작 과정을 확인할 수 있도록 설계됐다.

피지컬 AI는 센서를 통해 환경을 인식하고, 명령과 상황을 해석해 실제 동작으로 연결하는 기술을 의미한다. 로봇, 제조, 물류 등 분야에서 활용 가능성이 확대되면서 관련 모델과 실행 기술의 중요성도 커지고 있다.

노타는 향후 다양한 엣지 및 임베디드 환경에서 AI 모델 최적화 기술을 고도화할 계획이라고 밝혔다. 또한 반도체 및 디바이스 생태계와의 협력을 기반으로 온디바이스 AI 적용 범위를 확대한다는 방침이다.

#노타

배종인 기자jongin@e4ds.com

기사 전체보기

노타, 퀄컴 엣지 AI 디바이스서 VLA 모델 최적화

관련뉴스