MBC노조 "뭐가 악의적이냐고?… '원본음성' 다시 듣길 바란다"MBC 사내 게시판에 9월 22일 뉴욕서 송출한 원본 파일 올려
  • ▲ 지난 9월 22일 윤석열 대통령이 바이든 대통령과 만난 뒤 행사장을 나오면서 비속어가 담긴 발언을 했다고 보도한 MBC 뉴스데스크.
    ▲ 지난 9월 22일 윤석열 대통령이 바이든 대통령과 만난 뒤 행사장을 나오면서 비속어가 담긴 발언을 했다고 보도한 MBC 뉴스데스크.
    지난 18일 MBC 이모 기자가 대통령실 관계자와 "(MBC 뉴스가) 뭐가 악의적이냐"며 설전을 벌인 후 도어스테핑이 중단되는 등 파장이 커지고 있는 가운데, MBC노동조합(3노조, 위원장 오정환)이 "결국 그날의 진실을 밝히는 것이 급선무라는 생각이 든다"며 지난 9월 22일 오전 미국에서 MBC 본사로 송출된 윤석열 대통령의 '뉴욕 발언' 원본 파일을 공개했다.

    21일 MBC 사내 게시판에 당시 '글로벌 펀드 제7차 재정공약회의' 현장 촬영을 담당했던 MBC 카메라 기자가 보낸 원본 영상을 올린 MBC노조는 "이 음성 파일은 뉴욕에서 송출된 원본을 MBC 영상자료시스템에서 재생해 녹음한 것"이라며 "'쪽팔려서 어떡하나?'라는 말은 들리지만 다른 말은 알아듣기 어렵다"고 주장했다.

    "자막 생성 프로그램 돌려보니 '정보 없음' 결과 나와"


    MBC노조는 "논란이 불거진 직후 MBC 보도국 직원이 MBC가 개발한 자막 자동 생성 프로그램(Sound To Text, STT)으로 윤석열 대통령의 공식 연설 음성을 돌려본 결과 '토시 하나 안 틀리고' 녹취가 풀어졌으나, 문제의 발언이 녹화된 '00시 20분 28초 ~ 00시 20분 34초' 구간은 '어떠한 정보도 없다'는 결과가 나왔다"고 밝혔다.

    그러면서 "대통령의 '비속어 발언' 직후 (카메라에 부착된) '현장음 마이크'에 녹음된 MBC 카메라 기자의 음성은 STT가 73%의 정확도로 잡아냈다"고 소개한 MBC노조는 결과적으로 MBC가 구축한 자막 자동 생성 프로그램조차 '인간의 언어로서 유의미한 음성'이 아니라고 판단한 파일을 MBC가 '미국'과 '바이든'이라는 자막까지 달아 보도한 것이라고 지적했다.

    MBC노조는 "그러나 이 같은 사실을 지적한 3노조의 성명이 나가자, MBC는 '2022년 1월 AI 기술을 바탕으로 개발해 보도본부와 시사교양본부에서 사용되고 있는 STT 서비스는 콘텐츠 제작의 효율성을 높이기 위한 보조적인 수단일 뿐, 주위 소음이나 다수 화자 간의 음성 겹침, 화자의 연령, 사투리 사용 등 녹취 상태에 따라 오류를 내재하고 있다'고 반론했다"고 되짚었다.

    "즉, 오류 가능성이 커서 '프리뷰 스크립트 작성을 보조하는 용도로 사용된다'는 것이 MBC가 밝힌 주된 주장이었다"고 소개한 MBC노조는 "당시 MBC는 소란스러운 환경에서 낮은 음량으로 녹취된 콘텐츠에 대해 STT 기술이 '인식 없음'이라고 출력할 수 있으나, AI가 음성을 인식하지 못한다고 해서 사람도 인식할 수 없다고 단언할 수는 없다고 주장했다"고 밝혔다.

    MBC 기술본부장 "'STT' 월간 1600여건, 하루 53건 사용"


    MBC노조는 "하지만 정영하 MBC 방송인프라본부장은 지난 7월 20일 방송문화진흥회에 '최근 보도본부가 월간 1600여건, 시사교양이 월간 300여건을 사용했다'며 STT 시스템이 활발히 사용되고 있음을 보고한 바 있다"고 소개했다.

    MBC노조는 "정 본부장의 보고 내용에 따르면 STT 시스템의 정확도에 대해 보도와 시사교양 직원들의 반응이 매우 호의적이고 신뢰성이 있다는 평가가 있는 것으로 추정된다"며 "정확성을 생명으로 하는 보도국에서 월간 1600건, 하루 50여건의 사용하고 있다는 것은 초벌 녹취 풀기용 이상으로 정확도가 높고 활용성이 있음을 방증하는 것"이라고 주장했다.

    "더군다나 MBC의 STT 서비스는 학습을 통해 녹취 풀기의 정확도를 더 높일 수 있기 때문에 올해 1월부터 매달 1000여건에서 2000여건을 사용함으로써 정확도는 계속 높아졌을 것"이라고 추정한 MBC노조는 "이러한 STT 서비스가 윤 대통령의 발언 내용에 대해 '인식불가' 판정을 내린 것"이라고 강조했다.

    "'비속어 들린다'고 전파… '인식 왜곡' 일어났을 수도"


    또한 MBC노조는 "AI가 인식하지 못한 것을 사람이 정확하게 인식했다고도 할 수 없다"며 "MBC는 'STT 서비스가 잡음이 많은 상황에서는 사람의 음성을 정확히 인식할 수 없다'고 했는데, 실제로 대통령의 발언이 나온 상황은 음악이 매우 크게 흘러나오고 있었고, 대통령은 주변에 함께 걸어가는 사람들만 들을 수 있는 목소리로 말했다"고 당시 상황을 되짚었다.

    MBC노조는 "그런 음성을 대통령의 바로 앞에 설치된 카메라의 '현장음 마이크'가 수음한 것"이라며 "이어폰을 끼고 현장에 있던 카메라 기자는 들을 수 있었다고 하더라도 그 공간에서 조금만 떨어져 있던 사람들이라면 대통령의 말을 정확히 알아들을 수 있는 상황이 아니었음은 명확하다"고 단정했다.

    "AI가 인식하지 못한 말을, '선입된 정보'로 '인식 왜곡이 가능한 인간'이 분명하고 정확하게 인식했다고도 단정할 수 없다"며 당시 MBC 순방취재단 기자가 '바이든 대통령을 조롱하는 비속어가 들리는 것 같다'며 주변 기자들에게 전파한 사실을 거론한 MBC노조는 "대통령에 대한 '부정적인 선입견'이 해당 음성의 자의적인 인식 왜곡을 유도했을 가능성도 있는 것"이라고 주장했다.

    ※ 하단 영상: MBC 보도국 관계자가 MBC 뉴스 영상 서버 시스템인 '마이다스(MIDAS)'에 저장된 윤석열 대통령의 '뉴욕 발언'을 돌려보는 장면. MBC노동조합 제공