"네이버 협업 필터는 OTT의 그룹핑 모델""'비슷한 관심' 가진 이용자 '그룹화' 필수""네이버, 이용자 재동의 받고 서비스 해야"
  • ▲ 네이버가 AiRS 알고리즘에 대해 설명한 안내문. ⓒMBC노동조합(3노조) 제공
    ▲ 네이버가 AiRS 알고리즘에 대해 설명한 안내문. ⓒMBC노동조합(3노조) 제공
    최근 국내 최대 포털 네이버가 뉴스 서비스 이용자들을 소비 성향별로 '그룹핑(Grouping)'하고 있다고 주장해 파란을 일으킨 MBC노동조합(3노조, 비상대책위원장 강명일)이 "뉴스 이용자를 '그룹핑'한 적 없다"는 네이버의 해명에 "'나와 비슷한 관심사를 가진 사용자를 그룹으로 묶어 낸다'고 '협업 필터(Collaborative Filtering) 모델'을 설명했던 네이버가 갑자기 말을 바꿨다"며 프라이버시 침해 우려가 큰 '에어스(AiRS) 시스템'을 즉각 중단할 것을 거듭 촉구했다.

    지난 15일부터 사흘 연속 네이버의 '인공지능 기사 추천 시스템(AiRS)'을 비판하는 성명을 낸 MBC노조는 "네이버는 알고리즘 섹터의 'AiRS 추천'이라는 항목에서 <협업(필터) 모델은 나와 비슷한 관심사를 가진 사용자를 그룹으로 묶어 낸다. 그룹 내 인원들이 함께 많이 본 기사를 찾아 해당 사용자가 선호할 것으로 예측된 기사를 추천한다>고 소개하고 있다"며 "그런데 MBC노조가 정치적 그룹핑의 문제점을 지적하자, <협업 필터(CF)는 이용자와 동일한 기사를 본 다른 사용자의 서비스 이용 기록을 참고하는 모델일 뿐, 사용자를 특정 그룹에 매칭하거나 분류하지 않는다>고 다르게 해명했다"고 지적했다.

    MBC노조는 "AiRS 알고리즘을 설명하는 홈페이지 글에 분명히 '그룹 내 인원' '그룹으로 묶어 낸다'는 등의 표현이 들어 있음에도, 네이버는 '그룹'이 아니라 '개인'의 소비 이력을 참조한다고 말을 바꾼 것"이라며 "네이버의 이러한 주장은 지금까지의 설명과 완전히 모순된 것으로, 과거의 발표를 스스로 부인한 꼴"이라고 비판했다.

    MBC노조는 네이버가 사용하고 있는 CF 협업 모델은 넷플릭스 등 OTT에서 쓰이는 '그룹핑' 모델이라고 주장했다.

    MBC노조에 따르면 CF 협업 모델은 △나와 비슷한 영화나 드라마 취향을 가진 소비자들을 '소비 이력'을 통해 '그룹화'한 뒤 △그 그룹 내에 소비자들이 소비한 영화나 드라마를 나에게 추천해 주는 '추천서비스'로, 본래 OTT 등에서 활용돼 온 방식으로 알려졌다.

    MBC노조는 "알고리즘 전문가들에 따르면 CF 협업 모델은 '그룹핑'을 기본적인 요소로 사용한다"며 "네이버는 '개인별 유사도'만 참조한다고 하는데, 과연 그럴 수 있을지 의문이 든다"고 지적했다.

    MBC노조는 "네이버는 정치·경제·사회·문화·외신 등 다양한 분야의 기사 소비 성향이 어떻게 '정치적 성향'으로 분류될 수 있느냐고 반론하고 있으나, 민주주의 공동체에서 '언론 기사'라는 담론은 큰 의미로 모두 정치적"이라며 "우리 삶을 둘러싼 미디어 언론의 담론은 본질적으로 (공동체의 시각으로 봤을 때) 모두 민주주의와 연결된 정치적인 성격의 것"이라고 규정했다.

    ◆'20년 전 받은 동의' 이용해 AI 학습

    또한 MBC노조는 네이버가 "서비스 이용 기록을 동의 없이 사용하지 않으며 '개인정보 보호 원칙'을 준수하고 있다"고 해명한 것에 대해서도 비판의 날을 세웠다.

    MBC노조는 "네이버는 20년 전, AI가 없던 시절 받은 '개인정보 (서비스 이력) 이용 동의'를 근거로, 개인의 '수십 년 기사 조회 이력'을 샅샅이 딥러닝해 '정신'을 스캐닝하는 것을 '합법'이라고 오판하는 것 같다"며 "아직도 자신이 무슨 잘못을 했는지 정신을 못 차린 것 같다"고 비난했다.

    MBC노조에 따르면 네이버는 CBF(Content-Based Filtering)를 통해 이용자 개인이 과거 조회한 기사를 인공지능이 '딥러닝(Deep Learning)'한다고 소개하고 있다.

    이용자가 조회한 기사에 등장한 단어(키워드)와 그 기사의 중요도를 차별화하는 작업이 1단계고, 중요도가 높은 단어나 관련성이 높은 기사를 선별하는 것이 2단계 작업이다.

    이러한 작업들은 인공지능에 설정값을 넣어서 수행하게 되고, 인공지능 학습 과정의 중요한 피드백은 결국 네이버가 조정해 주면서 진행하게 된다.

    예를 들면 특정 이용자가 한동훈 국민의힘 대표와 관련된 기사와, 이재명 더불어민주당 대표의 재판 관련 기사를 집중적으로 조회해 왔다고 했을 때 이러한 기사에 자주 등장하는 키워드(용산, 독대, 대장동, 특검 등)를 추릴 수 있다.

    그러면 이러한 키워드들이 많이 등장하는 기사나 키워드들과 관련성이 높은 기사를 인공지능이 선별하고 추천해 주는 방식이 바로 네이버의 '기사 추천 시스템'이라는 게 MBC노조의 설명이다.

    MBC노조는 "이 같은 작업은 결국 개인의 '기사 취향'을 특정하는 것이고, 다시 말해 '정치적 성향'을 특정하는 것"이라며 "이런 데이터가 네이버 인공지능 안에 고스란히 개인별로 저장돼 있다면 얼마나 섬뜩한 일인가?"라고 되물었다.

    따라서 "이러한 일들은 충분한 설명 후에 개인별로 동의를 받는 작업이 반드시 필요하다"며 "'20년 전 받은 동의'를 활용한다는 네이버의 설명은 불법을 자인하는 일"이라고 비판했다.

    MBC노조는 "네이버 뉴스가 10년 전, 혹은 20년 전 최초 회원가입시 반강제적으로 받은 '개인정보 수집 동의'를 이용해 아무런 추가 동의 없이 개인의 뉴스 소비 이력을 '빅브라더'처럼 조회하고, 인공지능 개발에 활용하고 있다는 전문가들의 비판이 이어지고 있다"며 "네이버는 이용자들이 회원가입을 할 때 '자동 생성 정보'도 수집한다고 안내하고 있는데, AI 개발에 사용한다는 점을 고지하지 않았다면 구체적으로 다시 기존 가입자들에게 설명하고 위험성을 인식하도록 해야 한다"고 강조했다.

    이에 "네이버는 전문가들의 의견을 수렴, 즉각 에어스 시스템의 개인정보 무단 사용을 중지하고 이용자들로부터 '재동의'를 받기 바란다"고 충고했다.