과학기술정보통신부는 디지털 뉴딜 ‘데이터 댐’의 핵심자원인 인공지능(AI) 데이터 품질 표준안을 국제표준화로 추진한다고 밝혔다. 이와 관련해 품질의 개념과 범위, 세부 요구사항 등을 정립한 표준안을 개발하고, 6일 한국정보통신기술협회 내의 단체 표준화 기구(TTA PG 1005, 인공지능기반기술)에 공식 제안해 한국정보통신기술협회(TTA) 단체표준으로 만들 예정이다.
데이터 품질 개념·범위·세부 요구사항 마련
▲인공지능 데이터 품질 개념[사진=과학기술정보통신부]
과학기술정보통신부는 5일 디지털 뉴딜 ‘데이터 댐’의 핵심자원인 인공지능(AI) 데이터 품질 표준안을 국제표준화로 추진한다고 밝혔다.
이와 관련해 품질의 개념과 범위, 세부 요구사항 등을 정립한 표준안을 개발하고, 6일 한국정보통신기술협회 내의 단체 표준화 기구(TTA PG 1005, 인공지능기반기술)에 공식 제안해 한국정보통신기술협회(TTA) 단체표준으로 만들 예정이다.
이후 관련 전문가의 의견수렴 절차를 거쳐 내년 6월에 최종 채택·확정될 것으로 전망된다. 또 앞으로 관련 내용을 국제표준화 성과로 이어갈 계획이다.
이번 표준안은 한국정보통신기술협회와 한국정보화진흥원을 통해 기 개발된 ‘인공지능 학습용 데이터 구축 및 품질관리 공통기준(’19년)‘을 해외사례 분석, 인공지능 및 품질관리 등을 거쳐 보완·구체화하여 개발되었다.
따라서 인공지능 데이터의 품질은 AI기술(모델 및 알고리즘) 데이터의 다양성, 정확성, 유효성 등을 고려해 사용자 중심의 유용한 가치로 초점을 맞췄다.
하지만, 세계적 정보통신기술 기업들인 마이크로소프트나 구글 등이 4~6년 넘게 구축·업데이트해온 유명한 개방 데이터셋의 경우도 데이터 정확도가 43~83% 수준에 불과해 아직 세계적으로 인공지능 데이터 품질에 대한 체계적인 방법론이 정립되지 않았음을 보여준다.
이에 표준안은 자연어처리, 자율자동차, 의료, 농축수산, 제조 등 다양한 분야에서 공통적으로 적용 가능한 범용표준의 형태로 개발된다.
과기정통부는 이번에 개발된 표준안을 이미 10대 분야 추경사업 과제에 적용하고 있으며, 한국정보통신기술협회 내의 단체 표준화 기구(TTA PG 1005, 인공지능기반기술) 산·학·연 전문가 의견수렴을 거쳐 신속하게 표준화를 추진한다고 밝혔다.
또 앞으로 관련 사항을 ‘인공지능 국제표준화회의(ISO/IEC JTC1/SC42)’에 제안해 국제표준화의 성과로 이어지도록 할 계획이다.