노타, ICML 2026 워크샵서 MoE 양자화 연구 2건 발표

기사입력2026.06.11 10:32

DREAM-MoE·SRA-MoE 논문 채택, 대규모 AI 모델 추론 효율화 기술 제시

AI 모델 경량화 및 최적화 기술 기업 노타가 ICML 2026의 ‘Resource-Adaptive Foundation Model Inference(AdaptFM)’ 워크샵에서 MoE(Mixture-of-Experts) 모델 양자화 관련 논문 2편을 발표한다.

노타는 오는 7월 6일부터 11일까지 서울 코엑스에서 열리는 ICML 2026 기간 중 AdaptFM 워크샵에서 DREAM-MoE와 SRA-MoE 연구를 발표할 예정이다. ICML은 머신러닝 분야 주요 국제 학회 중 하나이며, AdaptFM은 제한된 컴퓨팅 자원에서 파운데이션 모델을 효율적으로 실행하기 위한 추론·압축·최적화 기술을 다루는 워크샵이다.

MoE는 여러 전문가 모델 가운데 필요한 일부를 선택해 사용하는 AI 모델 구조다. 모델 전체를 매번 모두 활용하지 않아도 돼 연산 효율을 높일 수 있지만, 전문가 선택 과정이 포함돼 일반적인 모델과 다른 최적화 방식이 필요하다.

노타에 따르면 DREAM-MoE는 모델을 여러 구간으로 나눠 양자화할 때 발생할 수 있는 전문가 선택 변화를 줄이는 방법을 제안한다. 양자화는 AI 모델의 수치 표현을 낮은 정밀도로 변환해 메모리 사용량과 연산 부담을 줄이는 기술이다.

SRA-MoE는 모델 결과에 더 큰 영향을 주는 입력을 선별해 우선적으로 보호하는 방식이다. 모든 입력을 동일하게 처리하기보다 중요한 입력에서 전문가 선택이 크게 달라지지 않도록 설계해, 제한된 자원에서도 모델 품질을 유지하는 데 초점을 맞췄다.

회사 측은 두 연구가 기존 MoE 특화 양자화 기법보다 높은 성능을 보였다고 밝혔다. 이번 연구는 대규모 AI 모델 운영에 필요한 메모리와 연산 자원을 줄이면서 품질 저하를 완화하는 데 활용될 수 있다.

노타는 앞서 엔비디아 네모트론 해커톤에서 데이터 기반 MoE 양자화 기법으로 트랙 우승과 종합우승을 차지한 바 있다. 회사는 업스테이지 컨소시엄의 독자 파운데이션 모델 과제에서도 Solar MoE 등 대규모 모델 최적화 연구를 추진하고 있다고 밝혔다.

한편 노타는 ICML 2026 기간 중 서울 코엑스에서 ‘Nota AI - Korea Efficient Days’를 열고, 관련 연구와 적용 사례를 소개할 예정이다.

#노타 #AI 모델 #양자화 #MoE #최적화 #ICML 2026 #DREAM-MoE #SRA-MoE #효율화 #파운데이션 모델

명세환 기자daniel@e4ds.com

기사 전체보기

관련뉴스

노타, 1분기 매출 36억 전년比 53배 성장

AI 경량화·최적화 기술 기업 노타가 2026년 1분기 연결 기준 매출 35억8,000만원을 기록하며, 사업 확대 흐름을 이어갔다. 수주잔고 증가와 적용 영역 확장이 향후 실적에 영향을 미칠 것으로 보인다.

2026-05-18 11:33:08by 배종인 기자

노타, 직무발명제도 우수 지재처장 표창

노타가 직무발명제도 운영 우수사례 공모전에서 최우수상인 지식재산처장 표창을 받았다. 이번 수상은 임직원의 발명 성과를 체계적으로 보상하고, 이를 특허 자산과 사업 경쟁력으로 연결해 온 운영 방식이 평가받은 결과다. 노타는 2026년 5월 기준 AI 모델 최적화·경량화와 영상 AI 분야를 중심으로 국내외 특허 227건을 확보했다.

2026-05-28 10:32:41by 배종인 기자

노타, 퀄컴 엣지 AI 디바이스서 VLA 모델 최적화

노타가 퀄컴 엣지 AI 디바이스 ‘드래곤윙(Dragonwing) IQ-9075’ 환경에서 비전·언어·행동 통합 모델(VLA)을 최적화해 실행 속도를 개선했다고 밝혔다. 해당 모델은 ‘스몰VLA(SmolVLA) 0.45B’로, 실시간 동작 생성을 포함한 피지컬 AI 환경을 고려해 구현됐다.

2026-05-29 15:11:24by 배종인 기자

노타, 엔비디아 VSS 적용 영상관제 솔루션 현장 구축

노타가 엔비디아의 영상 검색·요약 기술(VSS)을 적용한 영상관제 솔루션 NVA의 현장 적용 사례를 공개했다. 대전지방국토관리청 교통관제 시스템과 코오롱인더스트리 김천2공장에 적용된 NVA는 CCTV 영상에서 사고, 위험 상황 등을 분석하고 관제자가 필요한 정보를 자연어로 검색·요약할 수 있도록 지원한다.

2026-06-01 11:06:03by 명세환 기자

노타, 엔비디아 APAC 행사 참가 엣지 AI 역할 공유

노타가 엔비디아 아시아태평양 파트너 행사에서 피지컬 AI 확산에 따른 엣지 AI 최적화 기술의 필요성을 공유했다. AI가 도시와 산업 현장 등 물리 공간에서 실시간으로 작동하기 위해서는 클라우드 의존도를 낮추고 현장 가까이에서 데이터를 처리하는 기술이 중요하다는 취지다. 노타는 온디바이스 AI 최적화 기술을 기반으로 스마트시티, 교통, 산업 현장 등에서 작동하는 AI 에이전트의 적용 방향을 설명했다.

2026-06-02 14:09:20by 명세환 기자

노타, GPU·NPU 분산 추론으로 AI PC LLM 효율 개선

노타가 AI PC에서 GPU와 NPU를 함께 활용해 대규모언어모델(LLM) 추론 효율을 높이는 기술을 구현했다. 인텔 루나 레이크 기반 AI PC에서 입력 처리와 답변 생성 단계를 나눠 각각 GPU와 NPU에 배치하는 방식이다. 회사 측은 단일 GPU 실행 대비 토큰당 에너지 소비를 약 32% 줄이고 생성 처리량을 약 12% 높였으며, 단일 NPU 대비 첫 응답 지연시간을 약 89% 단축했다고 밝혔다. AI 에이전트 기능이 PC 환경으로 확산되면서 AI PC 경쟁이 개별 칩 성능보다 시스템 차원의 연산 최적화로 확대되는 흐름과 맞물린다.

2026-06-04 13:57:48by 명세환 기자

노타, 천안 도시안전망에 온디바이스 AI 적용

노타가 약 107억원 규모의 정부 온디바이스 AI 실증 사업에 참여해 천안시 재난안전 대응 체계 고도화에 나선다. 이번 사업은 하천과 지하차도 등 위험 지역에서 AI가 현장 데이터를 직접 분석하고 즉각 대응하는 도시안전망 구축을 목표로 한다.

2026-06-08 10:35:04by 명세환 기자