[방송기술저널 백선하 기자] SK텔레콤과 JTBC스튜디오가 실시간 인공지능(AI) 자동 자막 서비스 기술 개발 협약을 10월 27일 체결했다. 양사는 이를 통해 청각 장애인 등 사회적 약자를 위해 드라마, 예능 등 모든 프로그램과 인터넷TV(IPTV), OTT 등 다양한 미디어에 자막 서비스를 제공하는 AI 미디어 기술을 공동 개발하기로 했다.
해당 기술은 AI가 영상 콘텐츠를 인식해 자동으로 한국어 자막을 제공하는 것이다. 양사는 “영화나 드라마의 대사가 배경음악 등에 묻혀 정확히 들리지 않는다는 시청자 불만을 해소하고, 한국 문화나 한국어에 관심이 많은 해외 시청자들을 위한 한국어 서비스 제공 효과도 있어 K-콘텐츠의 해외 확산에도 기여할 것으로 전망된다”고 설명했다.
JTBC의 콘텐츠 제작 및 유통을 총괄하는 JTBC스튜디오가 AI 딥러닝을 위한 영상 콘텐츠와 방송기술 컨설팅을 제공하고, SK텔레콤는 미디어에 최적화된 음성인식 및 자막 생성 원천기술을 개발해 함께 활용하기로 했다.
현재 주요 방송사들은 사람이 직접 영상 콘텐츠의 대화를 듣고 이를 자막화해 서비스를 제공하고 있으나, 4~5초 정도의 지연시간과 함께 일부 대화의 누락으로 제대로 시청하기 어렵다는 불만이 제기돼 왔다. 또한 실시간 방송 이외의 VOD 및 OTT 매체에는 해당 서비스가 제공되지 않아, 청각장애인의 시청복지에 소홀했던 것이 사실이다.
SK텔레콤은 “또한 국내 콘텐츠의 해외 진출 측면에서 대본이 있는 드라마 이외의 교양 및 예능 콘텐츠에도 자막파일 자동생성 및 싱크 기술이 포함되므로, 수출을 위한 준비 시간 및 비용을 획기적으로 줄일 수 있다”며 “수출국 지역 언어로의 번역에 드는 시간과 비용을 절약할 수 있어 K콘텐츠의 확산에도 크게 기여할 것으로 기대된다”고 밝혔다.
현재 자막 생성 기술로는 구글 음성 인식기가 대표적이나, 잡음이 많은 방송에 바로 활용하기 어렵고 방송 콘텐츠에 맞게 추가 학습 및 개발이 필요한 상황이다. 특히 방송 콘텐츠의 경우 화자의 목소리 인식을 방해하는 사투리, 배경음악, 생활 잡음 등이 자막 추출의 정확도를 낮추기 때문에 이에 대응하는 특화된 AI 음성인식 및 잡음제거 기술이 필요하다.
SK텔레콤은 올해 상반기 개발 완료한 AI 잡음 제거 기술을 활용해, 지난 6월 ‘SK텔레콤 오픈 골프대회’에서 촬영 중 함께 녹음된 바람소리, 새소리, 차 소리 등의 잡음을 제거했다.
양사는 이번 협력을 통해 주요 방송 채널에 실시간 제공되는 자막 서비스를 더 많은 채널 및 다양한 미디어로 확대 적용할 예정이다.
박창성 JTBC스튜디오 콘텐트사업본부 본부장은 “JTBC 콘텐츠를 활용해 시청자 복지 향상을 위한 미디어 기술 개발이 속도를 낼 수 있게 되어 뜻 깊다”며 “긴밀한 협력을 통해 양사가 국내 콘텐츠 산업 발전에 기여할 수 있도록 노력해 나갈 것”이라고 소감을 밝혔다.
이재광 SK텔레콤 미디어사업지원그룹 그룹장은 “JTBC스튜디오와의 제휴를 통해 딥러닝 콘텐츠와 방송기술 컨설팅을 제공받게 돼 AI 미디어 기술 개발의 최대 난제를 해결할 수 있게 됐다”며 “이러한 미디어 기술이 시청자 복지 및 K-콘텐츠를 통한 한류 확산에 기여하기를 기대한다”고 말했다.