인피니언 3월24일부터
양자화
양자화
image

“엣지 AI 모델은 돌아가는데 제품은 안 된다? 하드웨어 특성 고려가 우선”

▲노타 AI 조석영 매니저가 발표하고 있다.   실제 연산량 줄어드는 구조적 경량화, 빨라진 결과로 체감 하드웨어 인지형 최적화, 속도 개선 실제 발생 지점 찾아내 “엣지 AI 시대에 개발자의 경쟁력은 더 큰 모델을 만드는 ..

2026.03.24by 배종인 기자

image

노타, 업스테이지 ‘솔라 오픈 100B’ 양자화 모델 공개…가중치 메모리 191.2GB→51.9GB

대형 LLM 경량화 경쟁 속 ‘MoE 특화’ 양자화 결과 공개 대형언어모델(LLM)을 현장 디바이스나 제한된 GPU 환경에서 돌리려는 수요가 늘면서, 모델 정확도를 크게 훼손하지 않으면서도 메모리 사용량을 낮추는 ‘양..

2026.03.05by 배종인 기자

1