반도체 AI 보안 인더스트리 4.0 SDV 스마트 IoT 컴퓨터 통신 특수 가스 소재 및 장비 유통 e4ds plus

배워야 할 양의 25분의 1만 배워도 다 배운 것 같은 AI

기사입력2025.12.01 08:16


▲(좌측부터)심재영 교수, 임재영 연구원(제1저자), 김동욱 연구원(제1저자)

 
UNIST, 3D AI 모델 고효율 학습 데이터 증류 기술 공개

원래 배워야 할 양의 25분의 1만 배워도 전체를 다 배운 것 만큼 똑똑한 AI를 만드는 기술이 나왔다.

UNIST 인공지능대학원 심재영 교수팀이 자율주행차·로봇 등 첨단 산업의 핵심인 3D 인공지능(AI) 모델 학습 효율을 극대화할 수 있는 데이터 증류(dataset distillation) 기술을 개발했다고 1일 밝혔다.

이번 성과는 국제 인공지능 학회 NeurIPS 2025에 정식 논문으로 채택되며 세계적 주목을 받고 있다.

3D 포인트 클라우드(Point Cloud) 데이터는 사물을 점으로 표현하는 방식으로, 자율주행차·드론·로봇의 ‘눈’ 역할을 한다.

반면에 점들의 배열에 정해진 순서가 없고 회전 변동성이 크다는 특성 때문에 데이터 증류 적용이 까다롭다.

기존 기술은 원본 데이터와 요약 데이터의 특징을 비교하는 과정에서 매칭 오류가 발생해 성능 저하가 불가피했다.

심재영 교수팀은 이러한 문제를 해결하기 위해 두 가지 핵심 기법을 도입했다.

SADM 손실 함수로 순서가 제각각인 점 데이터를 자동으로 정렬해 의미 구조를 맞췄고, Learnable Rotation 기법으로 물체의 회전 각도를 AI가 스스로 최적화해 학습하도록 했다.

이로써 기존 기술의 매칭 오류를 근본적으로 해결하고, 데이터 요약 과정에서도 원본 성능을 유지할 수 있게 됐다.

연구팀은 대표적인 3D 데이터셋 ModelNet40을 활용해 성능을 검증했다.

원본 데이터의 25분의 1 수준으로 줄인 요약 데이터로 학습했음에도 80.1% 인식 정확도를 기록했다.

이는 전체 데이터를 사용했을 때의 87.8% 정확도와 큰 차이가 없는 결과로, 높은 압축률에서도 학습 효율과 성능을 균형 있게 확보할 수 있음을 입증했다.

심재영 교수는 “이번 기술은 3D 점 데이터의 무질서한 구조와 회전 불확실성으로 인한 기존 매칭 오류를 근본적으로 해결했다”며 “자율주행, 드론, 로봇, 디지털 트윈 등 대규모 3D 데이터 활용이 필요한 분야에서 AI 학습 비용과 시간을 크게 줄이는 데 기여할 것”이라고 강조했다.

이번 연구는 과학기술정보통신부 한국연구재단과 정보통신기획평가원의 지원을 받아 수행됐다.

연구 결과는 세계 3대 인공지능 학회 중 하나인 신경정보처리시스템학회(NeurIPS) 2025에 정식 논문으로 채택됐다. 학회는 오는 12월2일부터 7일까지 미국 샌디에이고에서 개최되며, UNIST의 성과는 글로벌 AI 연구자들에게 큰 관심을 받을 것으로 기대된다.
 

▲3D 데이터셋 증류 기술 개요