• 과기정통부·AI안전연구소·TTA, AssurAI 데이터셋 활용 35개 위험 영역 점검
  • AI기본법 시행 앞두고 고성능 모델 컨설팅 지원…국제 표준화 연계 확대
카카오 AI 모델 안정성 평가 결과 공개

과학기술정보통신부는 AI안전연구소, 한국정보통신기술협회와 함께 카카오의 AI 모델 'Kanana Essence 1.5'를 대상으로 국내 최초 AI 안전성 평가를 실시하고 결과를 공개했다. 이번 평가는 AI기본법 시행을 앞두고 기업 고성능 AI 모델의 안전성 확보를 지원하는 과정에서 이뤄졌으며, 폭력·차별 표현 등 35개 위험 영역을 폭넓게 점검했다.

평가는 TTA와 카이스트 최호진 교수 연구팀이 지난 11월 18일 공개한 한국어 기반 벤치마크 데이터셋 'AssurAI'와 AI안전연구소의 고위험 분야 데이터셋을 활용했다. 무기 오남용·보안 취약점 등 시나리오를 적용한 결과, Kanana는 미국 Llama 3.1, 프랑스 Mistral 0.3 등 유사 규모 글로벌 모델 대비 높은 안전성을 확인했다.

AssurAI 데이터셋은 한국어를 기반으로 설계됐으며, 미국·영국·일본 등 10개국 국제 AI안전연구소 네트워크와 공동 검증을 거쳐 공개됐다. 과기정통부는 이를 AI안전연구소 고위험 데이터셋과 연계해 ISO/IEC JTC 1/SC 42 등 국제표준화에 반영, 글로벌 정합성을 높일 계획이다.

이번 결과는 국내 AI 모델의 안전 경쟁력을 증명한 사례로 평가되며, 내년에는 '독자 AI 파운데이션 모델' 프로젝트 1차 평가에 활용되고 국내외 AI 기업 대상 평가를 확대한다. AI안전연구소는 올해 11월 출범 이후 산학연 협력 허브 역할을 수행하며 주요국 AI 안전기관과 협력하고 있다.

TTA는 2021년 '신뢰할 수 있는 인공지능 개발 안내서'를 마련한 데 이어 올해 4월 국내 최초 생성형 AI 레드팀을 개최하고 12월 안전성 평가 데이터셋을 구축하며 AI 안전 실증을 강화해왔다. 이번 평가는 AI안전컨소시엄 산학연 24개 기관이 참여한 가운데 진행됐다.