- 과기정통부, 1만 시간 분량 방송영상으로 한국형 AI 개발 지원
- 추경 200억 투입…4개 연합체 선정해 방송·AI 융합 생태계 조성 목표

국내 방송 콘텐츠가 인공지능(AI) 학습의 원천 데이터로 탈바꿈한다. 과학기술정보통신부(이하 ‘과기정통부’)는 방송·미디어 산업의 인공지능 전환을 가속화하고, 한국형 AI 모형 개발을 지원하기 위한 대규모 사업에 본격 착수했다고 5일 밝혔다.
과기정통부와 한국전파진흥협회는 이날부터 다음 달 4일까지 「방송영상 인공지능 학습용 데이터 구축사업」을 공모한다. 이번 사업은 2024년도 제1차 추가경정예산으로 확보된 200억 원을 투입해 신규로 추진되며, 국내 방송 콘텐츠를 고품질 AI 학습 데이터로 전환하는 데 목적이 있다.
특히 이번 사업은 지상파 및 종편 등 방송사가 보유한 방송영상 원본 중 저작권과 개인정보 이슈가 해소된 콘텐츠를 기반으로, 인공지능·데이터 전문 기업과의 협력을 통해 AI 학습용 데이터로 가공·검증하는 것이 핵심이다. 이를 위해 정부는 방송사, AI 기업, 데이터 기관 등으로 구성된 4개 연합체(컨소시엄)를 선정하고, 각 컨소시엄당 약 48억 원을 지원할 계획이다.
선정된 컨소시엄은 방송 콘텐츠의 기획·제작·서비스 전반에 AI 기술을 적용할 수 있도록 특화된 인공지능 모델 개발 계획을 수립해야 한다. 이와 함께 방송사가 보유한 원본 영상 총 1만 시간 이상을 기반으로, 개인정보와 저작권 등 이슈가 없는 클린 데이터를 추출해 최소 5천 시간 이상의 학습용 데이터를 구축해야 한다.
과기정통부는 이번 사업이 단순한 데이터 구축에 그치지 않고, AI와 방송 기술 간 융합 생태계 조성을 위한 마중물 역할을 할 것으로 기대하고 있다. 이를 위해 데이터 품질 관리 및 검증에도 공을 들인다. 사업 추진 전반에 걸쳐 전문기관을 통해 단계별 품질을 관리하고, 데이터 검증용 AI 모델을 활용해 구축된 데이터의 실효성을 평가할 예정이다.
방송 영상 콘텐츠는 시각, 음성, 텍스트 등 복합 정보가 결합된 고차원 데이터로, 자연어 처리, 멀티모달 학습, 콘텐츠 추천 등 다양한 AI 기술에 활용 가능성이 높다. 특히 한국 방송 고유의 포맷과 언어, 문화적 요소가 반영된 데이터를 기반으로 학습한 인공지능은 국내 환경에 특화된 AI 서비스 개발에 중요한 토대가 될 수 있다.
과기정통부 관계자는 “이번 사업은 국내 방송산업과 AI 산업 간의 시너지를 극대화할 수 있는 시작점”이라며 “장기적으로는 AI가 콘텐츠 산업의 창의성과 생산성을 동시에 끌어올리는 핵심 동력으로 작용할 것”이라고 밝혔다.








