[방송기술저널=정영재 EBS 제작기술부 차장] 지상파 4사 및 주요 방송사 오디오 엔지니어 10명이 대한민국 UHDTV 오디오 표준으로 채택된 MPEG-H 3D 오디오에 대한 기술적 이해와 제작 능력 향상을 목적으로 MPEG-H 원천기술을 개발한 독일의 연구기관 Fraunhofer IIS 현지에서 5일간 밀도 있는 교육을 이수 받았다.
교육기관인 Fraunhofer IIS를 간략히 소개하자면 한국의 ETRI와 비슷한 개념의 연구기관이다. 독일에 기반을 두고 있으며 전 세계 25,000명 이상의 직원과 매년 23억 유로의 연구 예산을 집행하는 유럽 최대 응용 연구기관으로, MP3의 원천기술을 비롯해 AAC(Advanced Audio Coding), MPEG-H PART.3 등 기술 표준화를 선도하는 곳이다.
세계적 연구기관의 명성에 걸맞게 높은 수준의 연수 과정이 준비돼 있었다. 46개의 스피커가 설치된 3D 오디오 스튜디오, Sound Bar 체험실, 고급 스포츠카 오디오 체험, 시네마 VR 체험 등 수준급 시설에서 New Generation Audio 관련 다양한 경험을 체험했다.
UHDTV에서 오디오의 변화는 무엇이 있을까?
첫째, 청취 환경에 제약이 있는 가정에서도 별도의 세팅 없이 실감 나는 음향을 감상할 수 있다는 것이다. 기존 5.1채널 같은 평면적 사운드가 아니라 Upper Layer 3차원 입체음향이 구현 가능하다. 이미 시네마에서 3D 오디오 기술이 구현되고 있으나 일반 가정에서는 입체음향 스피커 세팅이 쉽지 않다는 지적이 나올 수 있다. 최근 출시되고 있는 Sound Bar나 BINAURAL 기술에서 가능성을 찾을 수 있다. 7.1+4H를 구현할 수 있는 Sound Bar가 이미 출시되고 있다. 삼성, LG 등 가전사와 Sennheiser와 같은 음향 기기 전문 업체가 지속해서 업그레이드된 Sound Bar를 선보이고 있다.
연수 기간 Sound Bar 체험실에서 Fraunhofer IIS와 Sennheiser의 프로토타입2 Sound Bar의 사운드를 체험했는데 예상했던 것 이상의 사운드를 구현해 깜짝 놀랐다. 만약 합리적 가격만 제시된다면 의외로 쉽게 3D 오디오 시장이 빨리 대중화될 수도 있다. 헤드폰으로 3D 입체음향을 가능하게 해주는 Binaural 기술과 휴대폰의 오디오 성능 개선으로 모바일 환경에서도 가능성이 열려있다. 영상의 고화질 Up/Down Converting 개념과 비슷한 Up/Down-mix도 가능하다. 스테레오 2채널 오디오를 5.1채널로 Up-mix해서 송출할 수도 있고 7.1+4H 3D 오디오를 수신환경에 따라 스테레오로 감상할 수 있다.
둘째, Object 기반 오디오를 구현해 시청자가 주도적으로 청취 환경을 선택할 수 있게 됐다. 특정 음원을 객체화하고 그 정보(Metadata)를 정의해 몇 가지 Preset을 전송하면 시청자가 여러 Preset 값 중 선택하거나 객체화된 음원의 음량이나 위치를 디테일하게 조정할 수 있다. 예를 들어 메이저리그 야구 중계에서 현장 캐스터를 선택하고 경기장 현장 소리를 볼륨 업하는 것이 가능해지고 Preset 중에서 클래식이나 영화 같은 장르를 선택할 수도 있다.
◇ MPEG-H 관련 차세대 오디오 시스템 구성
1. Production
⓵ AMAU(Audio Monitoring & Authoring Unit) : MPEG-H 3D 오디오를 편집하고 모니터링
– jünger사의 MMA, Linear Acoustic사의 AMS
⓶ MPEG-H AUTHORING Tool and Plug in
⓷ DAW
2. Encoding : 오디오를 Embedded해서 ATSC 3.O 규격으로 엔코딩하는 장비
– KaiMedia, DS Broadcast, Media Excel, Pixtree, ERICSSON사 등이 제공하고 있다.
3. playback devices
– TV 수상기 : 삼성, LG에서 MPEG-H 3D오디오 디코더를 탑재한 UHDTV를 출시하고 있으며 지원모델 확인여부 체크가 요구됨, 최신 기종부터 지속적인 펌웨어 지원 가능
– Soundbar : 삼성, LG 등에서 번들로 제공, SENNHEISER 2세대 프로토 타입 테스트 중
– binaural headset : 헤드셋에서 3D 오디오 구현
4. 3D AUDIO RECORDING AND MICROPHONES (Ambisonics)
– Ambisonics이란 입체감 있는 사운드를 구현하기 위한 기법으로 여러 개의 마이크를 특이한 배열로 설치하고 수음한 후 방식으로 신호 변환(엔코딩)하고 재생 스피커로 적정하게 신호 분배해 현장감 있게 재생하는 기술
Early Adapter이고 변화를 선호하는 편이지만 사실 독일 뮌헨을 경유하는 뤼른베르크행 Lufthansa 항공편 긴 여정에서 이번 연수와 MPEG-H 3D 오디오의 실효성에 대해서는 반신반의했었다. 지상파 데이터 방송, DMB, 3DTV, VR 등 새로운 이슈가 등장할 때마다 비교적(?) 긍정적 시각에서 서비스 도입을 위해 애써왔지만 결과는 신통치 않았기 때문에……
시청자 입장에서 TV 기술의 진보를 논하자면 디지털 전환에 따른 화질 개선 이외에는 강한 임팩트가 없었다. 3DTV의 몰입감은 3D 안경이라는 불편한 프레임에 의해, 멀티채널 오디오는 안방에서 사운드 재현의 물리적 제약에 의해 시청자의 외면을 받아왔다. UHDTV는 무엇을 해줄 수 있을까? 가전산업 활성화에만 몰입돼 콘텐츠 생산자인 방송사와 시청자의 주머니만 축내는 것은 아닌지…
연수 과정에서 가장 인상 깊은 점은 오디오 코덱을 만든 연구기관으로부터 일방적 지식만 전달받는 것이 아니라, MPEG-H 3D 오디오 지상파 TV 서비스를 세계 최초로 시행하는 한국 시장에서 성공하기 위해 시청자 접근성과 풍성한 콘텐츠 필요성을 인지하고 콘텐츠 제공자 역할을 하는 각 사 오디오 감독의 노하우와 의견을 상호 경청하고 실제적 아이디어가 오고 갔다는 것이다.
짧은 일정에도 3D 오디오 기본 개념, MPEG-H 3D 오디오 코덱 및 시스템 구성, 카오디오 시스템, 편집 및 모니터링 툴 사용법, Ambisonics 수음을 위한 마이킹과 시스템 구성, Up-mix 등 다양한 이론과 실습을 통해 Next Generation Audio 전문가로 거듭나기 위한 좋은 동기부여의 기회가 됐다.
한국 시장에서 그리고 EBS에서 MPEG-H 오디오를 어떻게 도입하고 안착시킬 것인가?
Fraunhofer IIS가 속한 유럽연합은 다양한 언어를 사용하므로 언어 선택 기능 하나만으로도 큰 장점이 될 수 있다. 그러나 한국은 그러하지 않다. 중국, 필리핀, 베트남 등 다문화 가정이 증가하고 있지만 모든 방송사가 다중 언어를 서비스하기 쉽지 않다.
영어 채널 EBSe를 가지고 있는 EBS의 경우 영어로 더빙한 다큐나 어린이 프로그램이 많지만 기존 프로그램은 더빙 소스만 따로 관리하고 있지 않기 때문에 재활용이 불가능하고 신규 프로그램에서 Commentary 한국어. 영어, 기타 언어를 따로 녹음하고 음원 소스를 관리해야 한다. 기존에 해오던 시각장애인을 위한 화면해설용 오디오 채널도 검토해야 한다. 새로운 워크플로와 콘텐츠 관리 시스템이 필요하게 된다.
편성 스케줄에 따라 일정 물량의 콘텐츠를 생산해야 하는 방송사에서 많은 시간과 자원이 필요한 3D 오디오 콘텐츠를 제작하기란 쉽지 않다. 녹록지 않은 제작 환경에서 음악 콘서트나 다큐멘터리, 대형 스포츠 경기 등 장르별로 실험적 시도가 요구될 것이다.
필자가 근무하는 EBS는 대내외 복잡한 상황 때문에 아직 UHDTV 서비스를 못 하고 있지만 현재 UHD 기반 NPS를 시설 중이며 내년 UHDTV 주조정실 시스템 구축을 위한 예산이 심의 중이다. UHDTV 관련 재원 확보와 투자 실효성 의문 등 현실적 제약이 있지만 미디어 트렌드를 이끌어 가야 하는 방송 엔지니어로서의 소양을 펼칠 기회가 오고 있다.