NAB Show 2025 참관기…AI 기반의 영상 편집, 제작과 디지털 스트리밍

[기고] NAB Show 2025 참관기…AI 기반의 영상 편집, 제작과 디지털 스트리밍

480

[방송기술저널=이준형 SBS 미디어IT팀 매니저] 제가 이번 NAB 2025에서 흥미롭게 관람한 분야는 AI를 등에 업은 영상 편집, 제작 분야와 디지털 스트리밍 분야입니다. 우선 디지털 스트리밍의 경우 작년까지 AI, 인터렉티브 경험과 함께 핵심 키워드로 많이 소개되었던 FAST(Free Ad-Supported Streaming TV) 콘텐츠 유통 수익 모델에 대한 언급은 많이 사라지고, 대부분 AI나 Cloud-based streaming 시스템과 연관된 기술들을 좀 더 자세히 소개하는 분위기였습니다. 특히 업체마다 AI의 힘을 빌어 디지털 스트리밍을 좀 더 쉽고 간편하게, 나아가 품질 개선까지 할 수 있는 솔루션을 내놓고 있는 모습을 많이 볼 수 있었습니다. 또한 방송 제작 편집에서도 AI 기술 도입을 상당 부분 이용해서 제작 시간과 비용을 획기적으로 줄일 수 있는 모습을 선보였는데, 우리에게 적합한 솔루션과 신기술을 선별하여 AI 기반 제작 및 스트리밍 시스템을 구축한다면 비용적으로나 퀄리티 면에서 중요한 경쟁력을 갖출 수 있을 것으로 판단되었습니다.

AI 기반 영상 편집 및 제작 도구

AI 기술을 활용한 제작 솔루션이 대거 소개되며, 콘텐츠 제작 효율성을 혁신적으로 향상하는 도구들이 주목받았습니다. 우선 SBS에서 많이 사용 중인 Adobe Premiere Pro 및 After Effects에서는 클립의 시작이나 끝을 자연스럽게 확장하여 편집의 유연성을 높이는 Generative Extend 기능과 영상 내의 특정한 객체, 장소, 카메라 앵글 등을 자동으로 인식하여 자연어 검색으로 원하는 클립들을 신속하게 찾을 수 있는 Media Intelligence 기능 등 실제 활용 가능성이 높은 기술을 선보였습니다. 이 밖에도 초점이 나간 영상을 AI가 활용 가능한 수준으로 복원해주는 기능이나 STT를 포함하여 27개 언어의 자동 번역, 화자별로 레이어를 자동분리해 주는 기능 등 실제 편집자들의 사용한다면 편집 시간을 획기적으로 줄여주며 효율성을 극대화해주는 유용한 기능들이 상당히 많이 소개되었습니다.

라이브 인코딩 기술은 계속 진화 중

실시간 스트리밍의 안정성과 품질을 높이기 위한 AWS Elemental MediaLive의 MQAR(Media Quality-Aware Resiliency) 기능이 눈에 띄었습니다. 이 기능은 네트워크나 콘텐츠 특성에 따라 좌우되는 스트리밍 품질을 자동으로 조정하는 Adaptive Recovery 기술로, 단순한 끊김 방지보다는 콘텐츠 중심의 복원 기술을 강조하고 있습니다. 스트리밍 서비스에서 가장 취약한 약점이라고 할 수 있는 네트워크 트래픽에 따른 버퍼링 이슈가 발생하였을 때 기존에는 스트림 재시작 또는 백업 장비나 라인전환으로밖에 처리하지 못했습니다. 하지만 AI/ML 기반 품질 모델이 적용된 MQAR 기술을 이용한다면 입력 신호, 인코딩 상태를 지속해서 모니터링하다가 영상의 비중요 구간에서는 스무딩 처리를 하고, 중요 구간에는 백업 소스 고속 리커버리 기술을 사용하여 시청자가 눈치채지 못하게 화질이나 프레임 손실을 부드럽게 복원하여 끊어짐 없이 안정적인 스트리밍 서비스를 제공할 수 있을 것으로 기대됩니다.

단순 반복 작업을 없앨 수 있는 혁신적인 기술들

Twelve Labs에서 소개한 Jocky라는 대화형 비디오 에이전트(Convertational Video Agent)가 상당히 인상적이었습니다. 특히 현재 비슷한 주제의 뉴스 영상 묶음 클립 제작을 위해 관련된 영상을 검색한 후 비슷한 주제끼리 모아 편집, 영상 결합, 유튜브 스트리밍까지 많은 시간이 소요되는 반복 작업 프로세스를 개선할 수 있기 때문입니다. 자연어 대화 형태로 특정 장면을 검색하면 하이라이트 생성부터 내용 요약, 영상 merging까지 쉽게 완료해주는 AI 기술 솔루션으로 많은 부분 운영 효율화와 비용 절감 효과를 기대할 수 있을 것으로 판단됩니다.

AI 기반 화질 개선
국내 기업 포바이포(4BY4)의 픽셀(PIXELL)이란 솔루션이 상당히 인상적이었는데, 원클릭으로 최대 8K급 업스케일링 하는 기술을 선보였습니다. 이는 수만 건의 초고화질 영상을 학습한 딥러닝 기반 AI 모델을 통해 Contrast, Saturation, Noise, Sharpness 등 화질의 핵심 요소를 최적화하여 화질을 개선하는 기술입니다. 거의 실시간으로 이루어지는 빠른 업스케일링 시간과 비트레이트 절감 기술력이 눈에 띄었고, SaaS 및 API 형태로도 제공되기 때문에 SBS에 도입한다면 좀 더 쉽고 효율적으로 저화질 구작 영상들의 업스케일링 스트리밍에 활용 가능성이 높아 보였습니다.