<본 글은 『KOBA 2025 Daily News』에 실린 원고입니다.>
[방송기술저널=백선호 트위그팜 대표이사] 최근 생성형 인공지능(Generative AI) 기술은 일상적인 정보 검색부터 콘텐츠 제작, 번역, 기획 업무에 이르기까지 광범위하게 활용되고 있다. 특히 챗지피티(ChatGPT)처럼 대화형으로 작동하는 거대언어모델(Large Language Model, LLM)의 등장은 생산성 향상의 패러다임을 바꾸어 가고 있다. 사용자와 자연어로 소통하며, 문서 작성, 요약, 번역, 코드 작성 등 다양한 작업을 실시간으로 수행할 수 있기 때문이다. 글로벌 IT 기업과 스타트업들은 LLM을 활용한 인공지능 생성 서비스를 앞다투어 제공하고 있으며, 지능형 에이전트(AI Agent) 개발에도 속도를 내고 있다.
KOBA 2025의 주제인 방송·음향·조명 산업도 예외는 아니다. 특히 콘텐츠 현지화(localization) 분야에서는 인공지능을 활용한 자동화 수준이 눈에 띄게 높아졌다. 기존에 기계 번역기(Machine Translation)는 번역가의 보조 도구 정도로 활용되었지만, 챗지피티와 같은 LLM 기반 생성형 인공지능이 등장하면서 문맥을 이해한 자연스러운 번역을 제공하게 되었다. 파일 업로드를 통해 간편하게 번역 결과물을 생성할 수 있으면서, 결과물이 현지 언어 사용자에게도 전혀 어색하지 않는 수준까지 향상된 것이다.
이러한 기술 발전은 콘텐츠 제작 환경 전반을 빠르게 변화시키고 있다. 최근에는 번역뿐 아니라 자막 파일 생성, 내용에 적합한 이미지 제작, 더빙용 음성 생성까지도 한 번의 명령으로 처리할 수 있을 만큼 기술이 발전했다. 덕분에 언어나 코딩 비전문가도 영상 현지화의 다양한 작업을 스스로 수행할 수 있는 길이 열렸다. 더 이상 외주 번역, 자막 제작에 의존하지 않고, 편집자 사이를 오가며 파일을 주고받지 않아도 되는 것이다.
예를 들어 챗지피티를 활용하면 기본적인 언어 지식만으로 번역과 검수가 가능하다. 또 네이버 클로바(Clova)를 통해 전사(轉寫, transcription, 영상의 대사를 문자로 옮겨 적는 업무)도 자동으로 처리할 수 있다. 더빙 역시 과거보다 훨씬 자연스러운 목소리와 감정 표현이 가능해져 뉴스 클립부터 게임 시네마틱 영상까지 실제 업무에 적극적으로 도입되고 있다. 이쯤 되면 LLM 서비스를 업무에 활용하지 않는 것이 오히려 비효율적이라 느껴질 정도이다.
하지만 실무자 입장에서는 여전히 아쉬움이 남는다. 전사, 번역, 자막, 더빙 등 각 기능을 위해 서로 다른 솔루션 서비스를 번갈아 가며 사용해야 하고, 각 도구의 사용법도 따로 익혀야 한다. 영상 포맷 변환, 자막 싱크 조정, 파일 관리처럼 반복적이고 번거로운 작업도 완전히 사라지지 않았다. 유료 서비스의 경우 사용량에 따른 비용 부담 또한 존재하며, 협업 과정에서의 데이터 관리, 보안 문제 역시 해결해야 할 중요한 과제이다.
이러한 불편을 해결하려면 영상 현지화에 필요한 모든 기능을 통합 제공하는 AI 기반 통합 솔루션이 필요하다. 전문 번역가 수준의 품질을 제공할 수 있는 LLM을 탑재하고, 사용성을 획기적으로 개선하면서도 보안에 대한 우려를 해결하는 서비스가 요구된다.

㈜트위그팜은 이러한 필요에 대응하여 KOBA 2025에서 콘텐츠 재창작 솔루션 ‘레터웍스’를 선보인다. 2023년에 출시한 레터웍스는 영상 현지화에 필요한 전사, 번역, 자막/더빙 생성, 화질 보정, 프로젝트 관리 기능을 통합하여 제공한다. 회사는 최근 업데이트를 통해 챗지피티와 제미나이(Gemini) API를 연동하여 번역 성능을 혁신적으로 개선했으며, 전사와 번역 절차를 통합하여 편의성을 대폭 향상시켰다.
기술적으로는 번역 메모리(Translation Memory, TM)와 용어집(Term Base, TB)을 벡터 데이터베이스(Vector Database)로 구축하고, 이를 검색 증강 생성(Retrieval-Augmented Generation, RAG) 방식으로 LLM과 연계해 보다 정확하고 일관된 번역 결과를 제공한다. 단순한 API 호출을 넘어 자사 데이터와 축적된 사용자 경험을 LLM 성능에 반영, 보다 우수한 성능의 번역 결과물을 생성할 수 있다는 점이 가장 큰 차별점이다.
자막 싱크 자동 조정, 산출물 버전 관리, 히스토리 추적 등 실무에서 자주 발생하는 불편을 해소하는 기능도 고루 갖췄다. 코딩이나 프롬프트에 대한 전문 지식 없이 자연어 명령으로 자막 제작을 할 수 있으며, 누구나 쉽게 활용할 수 있다는 점에서 인공지능 활용의 진입 장벽을 대폭 낮추는 데 기여하고 있다.
이처럼 LLM과 생성형 인공지능 기술이 영상 현지화에 본격 적용되면서, 단순한 번역 자동화를 넘어 본격적인 ‘콘텐츠 재창작’의 시대가 도래하고 있다. 이는 단순히 비용을 절감하는 도구가 아니라, 누구나 글로벌 시장을 겨냥한 콘텐츠를 창작할 수 있도록 돕는 새로운 창작 인프라의 등장을 의미한다. 언어와 기술의 장벽이 무너지는 지금, 영상 산업의 경쟁력은 더 이상 규모에만 달려 있지 않다. 그야말로 콘텐츠 창작 방식의 판이 바뀌고 있는 것이다.