美 제재 속 탄생한 '中 고성능 AI' … 기술력 실체는엔비디아 '최신 칩' 썼나…싱가포르 '중간 거점' 의혹오픈AI, 자사 데이터 무단 사용 의혹 제기기술충격 이어 안보우려 확산 … 각국 제재 움직임
  • ▲ 딥시크 애플리케이션 구동화면. 출처=APⓒ뉴시스
    ▲ 딥시크 애플리케이션 구동화면. 출처=APⓒ뉴시스
    중국 인공지능(AI) 스타트업 '딥시크'가 '가성비'를 넘어 미국 거대 빅테크기업의 AI 모델을 성능 면에서 뛰어 넘으며 기술시장에 충격파를 제대로 생성했다. 도널드 트럼프 미국 대통령이 취임 직후 미국 내 AI 인프라 구축을 위해 700조원 이상이 투입되는 거대 프로젝트 '스타게이트'를 발표한 와중에 찬물을 끼얹은 격이다. 

    다만 5년에 걸친 전방위적인 대중 제재를 뚫고 탄생한 딥시크의 기술력에 대한 의구심도 시간이 갈수록 커지는 모양새다.

    31일 정보통신(IT)업계에 따르면 딥시크는 지난 22일 공개한 기술 보고서에서 최신 AI 모델 'R1' 개발에 엔비디아의 저사양 반도체 'H800' 2048개를 사용했다고 밝혔다. 미국이 중국에 AI 반도체 수출 제한 조치를 실시하자 이를 피하기 위해 택한 고육책이다.

    H800은 엔비디아가 미국의 대중 제재를 피해 중국에 판매가 가능하도록 사양을 낮춘 AI 반도체다.

    그러나 일론 머스크 테슬라 최고경영자(CEO)는 이러한 저사양 반도체로 고성능 AI 모델인 R1을 만들었다는 주장을 믿을 수 없다며 딥시크가 몰래 엔비디아의 고성능 반도체를 사용했을 것이라는 의혹을 제기하고 나섰다. 딥시크가 자사 AI 모델 개발에 사용한 반도체를 완전히 공개하지 않은 점도 이같은 의혹을 키우고 있다. 

    미 당국은 대중국 반도체 수출 제재의 빈틈을 재점검하고 있다. 중국이 실제로는 엔비디아의 고성능 반도체를 사용하고 있을 것으로 의심하고 있는 셈이다.

    블룸버그통신은 복수의 익명 소식통을 인용해 미국 당국이 딥시크가 싱가포르의 제삼자를 통해 엔비디아 반도체를 구매해 미국 AI 칩 판매 제한을 우회했는지 조사하고 있다고 보도했다. 엔비디아 전체 수출 물량의 약 20%를 차지하는 싱가포르가 미국에서 중국으로 향하는 길목의 중간 거점으로 지목됐다.

    다만 엔비디아 대변인은 블룸버그에 "싱가포르에서 발생한 매출이 중국으로의 우회 배송을 의미하는 것은 아니"라고 강조했다. 

    10분의 1로 줄였다는 개발비 논란도 커지고 있다. R1의 구체적인 개발비는 미공개 상태지만 기술보고서에 따르면 딥시크는 미국 기업 대비 훨씬 적은 규모의 비용이 들었다고 밝혔다.

    R1 이전 모델인 'V3'의 공개된 개발비는 557만6000달러(한화 약 78억8000만원)에 불과하다. 메타가 최신 AI 모델 '라마 3'를 엔비디아의 고가 칩으로 훈련한 비용 대비 10분의 1 수준이다.

    미국 AI 업계 전문가들은 딥시크 창업자인 량원펑이 딥시크 창업 전에 AI 관련 투자사 환판량화를 운영하며 실행한 반도체 투자 비용도 개발비에 포함해야 한다고 지적한다.

    지난 2019년 량원펑은 10억 위안(약 1993억7000만원)을 투자해 엔비디아의 고성능 반도체 'A100' 1만개를 사들였다. 이 반도체가 딥시크의 고성능 AI 모델 개발에 사용됐을 것이라는 추측이다.

    전문가들은 딥시크가 이러한 '꼼수'로 일부 영역에서 오픈AI의 AI 모델을 앞섰다고 보고 있다. 딥시크의 R1은 오픈AI가 개발한 'o1'과 성능 비교에서 총 21개 분야 중 수학·추론·정보 추출 등 12개 항목을 앞질렀다.

    딥시크가 내놓은 열쇠는 '전문가 혼합(MoE·Mixture of Experts)' 모델이다. AI 챗봇에 특정 질문이 들어오면 관련된 AI 모델 영역만 활성화시켜 답하는 방식이다. 칩 사용량을 줄여 효율성이 높아진다.

    이세돌과 대국을 펼쳤던 구글 딥마인드의 AI 바둑 프로그램 '알파고'가 사용했던 전략과 유사하다. 바둑판에 놓을 수 있는 가능한 모든 수를 두고 계산하는 대신 놓음직한 몇 개의 옵션만 추려서 계산해 연산 속도를 높이는 것이다.
  • ▲ 휴대전화 화면에 딥시크와 챗GPT 애플리케이션 아이콘이 보인다. 출처=APⓒ뉴시스
    ▲ 휴대전화 화면에 딥시크와 챗GPT 애플리케이션 아이콘이 보인다. 출처=APⓒ뉴시스
    오픈AI와 마이크로소프트(MS)는 딥시크가 자사의 데이터를 도용했다는 의혹을 내세우며 조사에 착수했다. 29일(현지시간) 월스트리트저널에 따르면 두 회사는 딥시크가 오픈AI의 AI 도구에서 대량의 데이터를 빼내 무단으로 이용했는지에 대해 조사하고 있다.

    오픈AI는 '챗GPT'를 개발하기 위해 데이터 학습 과정에서 천문학적 비용을 들였다. 오픈AI 측은 중국과 관련된 여러 기관들이 대량의 데이터를 빼내려는 시도를 여러 차례 했다고 주장하고 있다.

    도널드 트럼프 미 행정부에서 AI·가상화폐 정책 총괄로 임명된 데이비드 색스 역시 이 주장에 "상당한 증거가 있다"며 힘을 실었다.

    오픈AI는 딥시크가 '증류(distillation)' 과정을 거쳐 자사 모델을 훈련한 것으로 보고 있다 증류는 다른 모델의 출력 결과를 가져와 자사 AI 모델을 훈련하는 방식을 가리킨다.

    이에 대해 딥시크는 R1에 쓰인 코드를 오픈소스로 공개하며 누구나 검증 가능하도록 해 자신감을 보였다. 그러나 학습 데이터와 일부 알고리즘은 공개하지 않았다.

    한편 개인정보 유출에 대한 우려에 따라 일부 국가와 정부기관, 수 백개의 기업이 딥시크 사용 금지를 선언했다. 이탈리아는 딥시크 사용자의 개인정보가 중국에 있는 서버에 저장된다는 점을 우려해 신규 다운로드를 차단했다.

    미 의회도 의회 내 컴퓨터 등 장치에 딥시크 기능을 제한했다. 직원들에게도 공용 기기에 딥시크를 설치하지 말라고 지시했다. 미 국방부 역시 지난 28일 직원들의 딥시크 접속 차단에 나섰다.

    딥시크의 개인정보 보호 약관에 따르면 딥시크는 AI 모델 학습을 위해 텍스트, 오디오, 파일, 채팅 기록은 물론 사용자가 입력한 키보드 패턴까지 수집한다. 이 정보들은 중국 내 서버에 저장되며 법 집행기관이나 공공기관과 공유될 수 있다. 개인정보 관련 분쟁이 발생할 시 딥시크는 중국 정부의 법률을 적용한다고 명시했다.

    전문가들은 딥시크가 '옵트아웃(정보수집 거부)' 기능을 제공하지 않아 다른 AI 모델 대비 대량의 정보를 거부 선택지 없이 수집한다는 점에 우려를 나타냈다.

    31일 현재 딥시크는 국내 애플 앱스토어 무료 애플리케이션 다운로드 순위 1위를 차지하고 있다.