5년 노력 끝에 ‘AI 안전·신뢰성’ 위한 세계표준 세워

한국전자통신연구원(ETRI)이 AI 시스템의 테스트 절차와 방법론을 정의한 ‘AI 시스템 테스팅 개요’ 표준이 지난 3일 국제표준화기구(ISO/IEC JTC1)에서 공식 제정됐다. 이는 우리나라가 ISO/IEC 인공지능 기술위원회(SC 42)에서 주도적으로 제정한 최초의 ‘AI 테스팅’ 핵심 국제표준이다. 이 국제표준은 AI 데이터 품질, 모델 성능, 편향성 등 AI 전주기 테스트 방법론을 최초로 정의한 것으로 향후 국제 공인시험, 국제 적합성 시험 평가 등에 활용된다.
ETRI가 정립한 표준은 기존 소프트웨어 테스트 표준을 AI 시스템에 맞게 확장한 것으로 AI 특성에 맞춘 데이터 품질 테스트, 모델 테스트 등 새로운 테스트 단계를 정의했다. 이를 통해 AI 시스템의 핵심 요소인 데이터 품질부터 모델 성능까지 종합적으로 검증할 수 있는 기반을 마련했다. 이 표준은 앞으로 제정될 AI 레드팀 테스팅, 생성형 AI 테스팅 등 후속 표준의 기반이 되는 ‘총론’격으로, AI 신뢰성 검증 체계의 근간을 우리나라가 설계했다는 데 의미가 있다.
ETRI는 이번 표준 제정을 기반으로 현재 개발 중인 후속 테스팅 시리즈 표준인 레드팀 테스팅 표준을 비롯해 온톨로지 표준, AI 벤치마크 등 AI 테스팅 국제 표준 시리즈 개발도 선도할 계획이다. 방승찬 원장은 “AI의 안전성과 신뢰성을 확보하는 것은 인공지능 시대의 핵심 과제”라며 “이번 국제표준 제정은 대한민국이 AI 기술뿐만 아니라 AI 테스팅과 평가 규범을 선도하는 분기점이 될 것”이라고 밝혔다.
김형중 기자 kimhj@ggilbo.com
