MBC노조 "'비슷한 관심' 가진 이용자 '그룹화'"네이버 "사용자, 특정그룹으로 매칭·분류 안 해"
-
- ▲ 네이버가 AiRS 알고리즘에 대해 설명한 안내문. ⓒMBC노동조합(3노조) 제공
특히 뉴스 소비 성향에는 필연적으로 '정치적 성향'이 들어갈 수밖에 없어, 만에 하나 관련 데이터가 유출될 경우 △'선거'에 악용되거나 △뉴스 이용자들이 '사회적 박해' 혹은 '차별'을 받는 심각한 문제가 발생할 수 있다는 지적이다.
이에 따라 네이버는 △이용자들로부터 '구체적인 사전 동의'를 받고 △'헌법상 인격권'을 침해할 우려가 있는 소비 이력 수집을 지양해야 하며 △개인정보 이용 및 처리 과정을 낱낱이 공개하는 한편 △엄격한 데이터 관리에 만전을 기해야 한다는 게 관련 의혹을 제기한 MBC노동조합(3노조, 공동비상대책위원장 오정환·강명일)의 주장이다.
반면 네이버는 "뉴스 이용자를 '그룹핑'하거나 '정치 성향'을 판단할 수 없고, 서비스 이용 기록을 동의 없이 사용하지도 않는다"며 관련 의혹을 부인하고 있는 상황이다.
그러나 네이버의 반박이 나온 후 MBC노조가 "△인공지능(AI) 서비스가 등장하기 전, 네이버에 가입한 이용자들이 AI의 뉴스 소비 이력 수집에 동의했다고 보기 어렵고 △네이버가 AiRS 알고리즘에 대해 설명한 안내문에는 분명히 '협업(필터) 모델은 나와 비슷한 관심사를 가진 사용자를 그룹으로 묶어 낸다'는 문구가 있다"며 재반박에 나서 논란이 커지고 있는 양상이다.
◆"기사추천서비스, 개인정보 유용 의혹"
MBC노조는 지난 12일 배포한 <네이버의 인공지능 기사추천 서비스 ‥ 개인정보 유용 의혹>이라는 제하의 성명에서 "네이버뉴스가 2017년부터 사용하고 있는 '인공지능 기반 기사추천서비스(AiRS)'의 알고리즘 추천 설계에 중대한 문제점이 있다"고 주장했다.
지난달 30일 국회에서 열린 '알고리즘 위험성과 해결 방안' 토론회에 참석해 관련 자료를 살펴본 결과, 네이버 뉴스 회원 수천만 명의 뉴스 소비 이력이 '구체적인 동의 없이' 무분별하게 수집돼, 소비 성향 그룹별로 분류되고 '구체적인 허락 없이' 사용되고 있는 정황이 나타났다는 것이다.
MBC노조는 "네이버가 안내한 인공지능추천시스템(AiRS)에 따르면 네이버는 사용자별 뉴스 소비 데이터를 모두 수집해 사용자별 기사 소비 특성을 뽑아 비슷한 성향으로 그룹별로 분류했다"며 "기사 소비 성향이 유형화됐다는 것은 뉴스 이용자의 정치 성향에 따라 그룹핑이 완료됐다는 의미로 해석될 수 있다"고 주장했다.
한마디로 개인이 원하든 원하지 않든 특정 정치적 성향의 그룹, 혹은 특정 뉴스 소비 그룹으로 분류돼 '기사 선호 예측'이 이뤄지고 있다는 것이다.
네이버는 이를 CF 모델링, 즉 'Collaborative Filtering'이라고 이름 붙이고 있다고 소개한 MBC노조는 "조지 오웰의 이른바 '빅브라더'처럼 누가 어떤 매체의 어떤 성향의 기사를 많이 읽는지 이미 네이버는 전 국민의 개인별 정치 성향 분류를 마치고 이 데이터를 활용하고 있다는 뜻"이라고 강조했다.
MBC노조는 "네이버는 또 뉴스 이용자가 과거에 조회했던 기사와 단어를 중요도 기반으로 순위를 매겨 AI 딥러닝 방식으로 학습하도록 하고 있다고 한다(콘텐츠 기반 필터링)"며 "이처럼 특정 이용자의 과거 단어 조회와 기사 조회 이력이 모두 학습돼 빅데이터로 인공지능 학습에 이용되고 있는데, 이 과정에서도 개인정보 이용에 대한 구체적인 동의를 얻은 기억을 가진 이용자는 드물다"고 단정했다.
"이러한 데이터가 혹시라도 유출돼 개인의 정치 성향으로 낙인 찍히고, 차별이나 사회적 박해의 도구로 악용될 수 있어서 큰 문제"라고 지적한 MBC노조는 "네이버는 회원 가입시 '서비스 이용 과정에서 IP 주소, 쿠키, 서비스 이용 기록, 기기 정보, 위치 정보가 생성돼 수집될 수 있다'고 설명하고 '개인정보 수집 동의를 받고 있으며 이에 동의하지 않으면 회원가입이 불가능하다'고 전하고 있는데, 이러한 수준의 '개인정보 이용 동의'가 개인별 기사 소비 성향의 정보 수집과 활용, 그룹핑에 동의한 것으로 해석될 수 있을지 의문"이라고 밝혔다.
MBC노조는 "엄청난 양의 빅데이터로 모인 뉴스 소비 성향 정보는 곧바로 개인별 정치적 성향 분류표가 돼 선거에 악용되거나 판매될 수 있고, 개인에 대한 박해의 근거가 될 수 있다"며 "이에 따라 철저한 개인정보 사용 동의가 반드시 필요하고, 네이버가 무분별하게 수집해 개인의 뉴스 소비 성향을 분류하는 행위는 그 자체로도 헌법상의 인격권을 침해하는 행위가 될 수 있다"고 해석했다.
◆뉴스 이용자 정치 성향 분류? "사실과 달라"
이 같은 성명이 공개되자 네이버는 자사 인공지능 기반 기사추천서비스(에어스, AiRS)를 위해 뉴스 소비 이력을 이용자 동의 없이 수집하고 이용자 정치 성향을 분류한다는 MBC노조의 주장은 사실과 다르다고 반박했다.
지난 13일 오후 공식 블로그를 통해 "네이버는 뉴스 이용자를 그룹핑하거나 정치 성향을 판단할 수 없다"고 단언한 네이버는 "서비스 이용 기록을 동의 없이 사용하지 않으며 '개인정보 보호 원칙'을 준수하고 있다"고 강조했다.
네이버는 "'협업 필터(CF)'는 이용자와 동일한 기사를 본 다른 사용자의 서비스 이용 기록을 참고하는 모델일 뿐"이라며 "해당 사용자가 선호할 것으로 예측된 기사 후보군을 추천하는 것으로, 사용자를 특정 그룹에 매칭하거나 분류하지 않는다"고 설명했다.
따라서 "네이버는 뉴스 이용자의 정치 성향을 판단할 수 없고, 기사 소비 성향이 정치 성향과 일치한다는 주장은 근거가 부족하다"고 반박했다.
'네이버가 이용자 동의 없이 서비스 이용 기록을 사용했다'는 의혹에 대해서도 네이버는 "적법한 절차에 따라 개인정보 수집, 이용, 제공 등을 동의받고 있다"며 "개인정보 수집 과정에서 서비스 개선 목적으로 사용할 수 있다는 내용을 개인정보 처리 방침에서 설명하고 있다"고 밝혔다.
그러면서 "새로운 서비스를 반영할 때 '개인정보 보호 원칙'을 지키기 위해 최선을 다하고 있다"고 강조한 네이버는 "인공지능 관련 개인정보 처리 사항을 명시하도록 하는 사회적 분위기와 더불어 이용자가 보다 쉽게 이해할 수 있도록 지난해 8월 당시 인공지능 관련 내용을 포함했다"고 덧붙였다.
네이버는 "뉴스 알고리즘 구성의 적절성, 합리성을 투명하게 검토 받고 있으며 앞으로도 다양한 채널을 통해 알고리즘에 대한 오해를 바로잡고 이용자와 소통하겠다"고 밝혔다.
◆AiRS 알고리즘 설명문에 '그룹화' 언급
"사용자를 특정 그룹에 매칭하거나 분류하고 있지 않다"는 네이버의 해명이 나오자, MBC노조는 14일 재차 성명을 내고 "네이버가 AiRS 알고리즘에 대해 설명한 안내문에는 분명히 '그룹'에 대한 언급이 나온다"고 반박했다.
해당 안내문에 '협업(필터) 모델은 나와 비슷한 관심사를 가진 사용자를 그룹으로 묶어 냅니다. 그룹 내 인원들이 함께 많이 본 기사를 찾아 해당 사용자가 선호할 것으로 예측된 기사를 추천합니다'라는 문구가 있음을 밝힌 MBC노조는 "△예를 들어 김OO 씨라는 사람이 특정 매체 정치 기사에서 '이재명' '윤석열' 키워드가 들어간 기사를 집중적으로 소비해 왔던 것이 '뉴스 소비 정보'로 파악됐다고 가정하면 △비슷한 매체에서 비슷한 키워드의 기사를 집중적으로 소비한 집단이 형성될 것이고 △이를 그룹으로 묶어 'Aa1'라는 이름을 붙이면 이게 바로 정치적으로 그룹화한 게 아니냐"고 되물었다.
MBC노조는 20년 전인 2004년 네이버에 회원가입한 이용자는 가입 당시, 필수 동의 항목으로 '개인정보 이용 동의'를 하게 되는데, 이것을 AI를 통한 개인정보 수집까지 동의한 것으로 간주하기는 어렵다고 해석했다.
MBC노조는 "2004년에 가입한 이용자는 이른바 '서비스 이용 과정에 자동 생성되는 정보'에 대한 이용 동의를 하게끔 돼 있는데, 이때는 네이버든 카카오든, 챗GPT 등 인공지능 서비스가 개인의 기사 조회 이력을 샅샅이 뒤져서 활용할 것이라고는 꿈에도 생각하지 못하던 시절"이라며 "이러고도 적법한 개인정보 이용 동의를 받았다고 주장하고 있는 것이냐"고 네이버에 물었다.
2016년 이후에 '개인정보 이용 동의'를 받은 사항도 마찬가지라며 "본인의 과거 수십 년간의 기사 조회 내용을 빅데이터화해 '분류'하고 '그룹핑'하고 이를 네이버 인공지능시스템에 활용해도 되는지 정확히 묻고 동의를 받지 않았다면, 적법한 동의로 간주되지 않을 가능성이 높다"고 단언한 MBC노조는 "특히 이러한 '자동생성정보'에 대해 개인이 추후 선별적으로 동의를 철회할 수 없도록 한 것도 문제"라며 "왜 동의를 철회할 수 없도록 해놓은 것이냐"고 따져 물었다.
MBC노조는 "네이버는 얼마나 많은 회원들의 기사 소비 이력을 얼마나 광범위하게 사용했는지, 그리고 기사추천서비스를 할 정도로 개개인의 뉴스 소비 성향을 속속들이 알고 있는 것이 합법적인 일인지 곱씹어 보고, 개인정보 이용과 처리 과정을 낱낱이 공개하기 바란다"고 촉구했다.