MBC노조 "AI·소리전문가도 비속어 여부 인식 못해"'尹 발언' 자막 생성해보니 "어떤 정보도 없다" 나와
  • 지난달 22일 윤석열 대통령이 바이든 대통령과 만난 뒤 행사장을 나오면서 참모들에게 한 발언이 파문을 일으키고 있다고 보도한 MBC 뉴스데스크.
    ▲ 지난달 22일 윤석열 대통령이 바이든 대통령과 만난 뒤 행사장을 나오면서 참모들에게 한 발언이 파문을 일으키고 있다고 보도한 MBC 뉴스데스크.
    MBC가 "윤석열 대통령이 방미 중 욕설을 했다"며 근거로 제시한 소위 '뉴욕 발언'을 MBC의 자막 자동 생성 프로그램으로 돌려본 결과 "식별이 불가능하다"는 판단이 나온 것으로 전해졌다.

    MBC 노동조합(위원장 오정환)은 지난 2일 배포한 성명에서 "문제의 발언이 녹화됐던 '9월 22일 00시 20분 27초~00시 20분 32초'까지 약 5초간의 음성에 대해 자막 자동 생성 기능을 작동시켜보니 '어떠한 정보도 없다'는 결과가 나왔다"고 밝혔다.

    반면 "윤 대통령의 글로벌 재정펀드 회의 '공식연설'이 담긴 동영상 부분은 대통령의 연설 내용이 77%에서 98%의 정확도로 자막이 정확하게 생성돼 서비스됐다"고 덧붙였다.

    MBC, 2018년부터 '자막 자동 생성 기능' 도입

    MBC노조에 따르면 MBC는 2018년 뉴스영상서버 시스템인 '마이다스(MIDAS)'를 구축하면서 기자들의 기사 작성을 돕기 위해, 서버에 등재된 뉴스용 촬영 영상의 음성을 자동으로 문자로 생성해주는 '자막 생성 기능(Sound To Text, STT)'을 도입한 것으로 알려졌다.

    MBC노조는 "MBC가 구축한 자막 자동 생성 프로그램조차 당시 윤석열 대통령 발언 녹음에 대해 인간의 언어로서 유의미한 음성이 아니라고 판단한 것"이라며 "당시 이 동영상을 촬영했던 카메라 기자가 동영상을 송출하는 과정에서 혼잣말로 발언했던 음성까지 73%의 정확도로 생성할 정도로, 이 자막 자동 생성 기능의 정확성은 상당히 높은 수준"이라고 강조했다.

    MBC노조는 "이러한 결과는 이상규 전 국립국어원장이 윤 대통령의 '비속어 논란'을 보도한 언론사들을 비판하면서 MBC의 자막 처리가 잘못됐다고 주장한 사실과 일맥상통한다"며 "이상규 전 원장은 '노이즈가 많은 음성에 대한 인식은 사람마다 달라질 수 있는데, 트랜스크라이브로 음성 파형을 확대해 구간 반복으로 청취해 봐도 식별하기 어려웠다'고 밝혔다"고 전했다.

    이 같은 전문가의 주장과 STT 검증 결과를 인용한 MBC노조는 "과학적으로 분별성이 없는 음성을 자막 보도로 오염된 선입견을 따라 언론사들이 앞다퉈 보도한 것이 이번 사태의 원인이라는 주장이 설득력을 얻고 있는 것"이라고 해석했다.

    "MBC 보도는 특정 대통령 침몰시키려는 음모"

    자신을 '방언 청취 전문가'로 소개한 이상규 전 원장은 지난 2일 쿠키뉴스와의 인터뷰와 SNS 등을 통해 "(소리가) 아주 분명하지 않았을 때 자막을 달아 (인식을 수월하게) 하는데, 제가 MBC에서 초대 우리말 위원회 위원장을 지내며 당시 자막 처리 기술을 향상하기 위한 연구 노력을 많이 했다"며 "(음성 파형 확대 청취 외) 담화 문맥의 흐름을 분석해 봐도 MBC의 자막 처리가 잘못됐다는 과학적 논거는 뚜렷하다"고 주장했다.

    이 전 원장은 "방송에서의 자막 처리는 대단히 공정하고 정확해야 한다는 게 본인의 신념인데, 이번에 문제가 됐던 내용을 미세하게 듣고 자막과 동일한가를 따져봐도 식별이 어려웠다"며 "말의 앞뒤가 맞아야 하는데 '이XX'나 '바이든'이 들어가야 할 이유가 없다. 문맥 논리의 구성으로 보더라도 MBC에서 그날 자막을 임의로 내보낸 것은 아주 잘못됐다"고 비판했다.

    해당 발언에 '미국' 등의 자막을 임의로 추가한 MBC의 보도를 두고 "국가 이익을 완전히 포기하고 특정 대통령을 소위 침몰시키려고 하는 음모라고까지도 여겨진다"고 비난한 이 전 원장은 "정치적 해석보다는 학문을 하는 사람으로서 사회의 공정, 정의를 위해 잘못된 건 잘못됐다고 얘기해야겠다는 판단에서 말한 것"이라고 강조했다.