티스토리 뷰

반응형

https://www.wired.com/story/deepseek-china-model-ai/?_sp=6d5f1966-ad71-4657-b021-a06b70f815db.1738124571822

실리콘밸리를 놀라게 한 중국 AI 기업

2025년 1월 20일, 중국의 무명 AI 연구소였던 DeepSeek이 오픈소스 모델을 공개했다. 이 모델은 실리콘밸리에서 큰 화제가 되고 있다. DeepSeek이 발표한 논문에 따르면, DeepSeek-R1은 수학 및 논리적 사고 벤치마크에서 OpenAI의 o1을 비롯한 업계 선도 모델들을 뛰어넘는다. 성능, 비용, 개방성 등 중요한 지표에서 DeepSeek은 서구 AI 대기업들과 정면으로 경쟁하고 있다.

DeepSeek의 성공은 미·중 기술 냉전이 초래한 의외의 결과다. 미국의 수출 통제로 인해 중국 기술 기업들은 서구 기업들처럼 칩을 무한히 구매하고 장기간 훈련하는 방식으로 AI 경쟁을 할 수 없었다. 이로 인해 대부분의 중국 기업들은 자체 모델을 개발하기보다는 AI 응용 프로그램에 집중해왔다. 하지만 DeepSeek은 다른 길을 택했다. AI 모델의 기본 구조를 혁신하고 제한된 자원을 보다 효율적으로 활용하는 방식으로 성과를 거둔 것이다.

“대부분의 중국 AI 기업들이 첨단 하드웨어에 크게 의존하는 반면, DeepSeek은 소프트웨어 기반의 자원 최적화에 집중했습니다.”
호주 시드니공과대학교(University of Technology Sydney)에서 중국 혁신을 연구하는 마리나 장(Marina Zhang) 교수의 설명이다.
“DeepSeek은 오픈소스 방식을 적극 활용해 집단적인 전문성을 모으고 협력적 혁신을 장려했습니다. 이는 자원 제약을 극복하는 동시에 최첨단 기술 개발을 가속화하는 역할을 했죠. 이런 접근 방식은 폐쇄적인 경쟁을 벌이는 기존 기업들과 확연히 차별화됩니다.”

그렇다면 DeepSeek의 배후에는 누가 있을까? 그리고 이들이 왜 업계 최고 수준의 모델을 개발하고도 이를 무료로 공개하는 걸까? WIRED는 중국 AI 업계 전문가들과의 인터뷰 및 DeepSeek 창립자인 량원펑과의 심층 인터뷰를 분석해 이 스타트업의 놀라운 성장 배경을 추적했다. 한편, DeepSeek은 WIRED의 여러 차례 문의에 응답하지 않았다.

중국 최고의 퀀트 헤지펀드에서 출발한 AI 기업

DeepSeek은 중국 AI 업계에서도 독특한 행보를 보이는 기업이다. 이 회사는 원래 High-Flyer라는 중국 최고의 퀀트 헤지펀드에서 운영하던 Fire-Flyer라는 딥러닝 연구 부서에서 출발했다. 2015년 설립된 High-Flyer는 빠르게 중국 금융업계에서 두각을 나타냈고, 1000억 위안(약 150억 달러) 이상의 자금을 운용한 최초의 퀀트 헤지펀드가 되었다. (2021년 이후 운용 규모는 800억 위안(약 80억 달러)으로 줄어들었으나, 여전히 중국에서 가장 중요한 퀀트 헤지펀드 중 하나다.)

High-Flyer는 오랫동안 GPU를 축적하며 Fire-Flyer 슈퍼컴퓨터를 구축해 금융 데이터를 분석해왔다. 그러나 2023년, 컴퓨터공학 석사 학위를 가진 량원펑은 AI 연구에 집중하기 위해 펀드의 자원을 DeepSeek이라는 새로운 회사에 투입하기로 결정했다. 그리고 궁극적으로는 인공지능 일반화(AGI, Artificial General Intelligence)를 개발하는 것이 목표였다. 마치 월스트리트의 거대 트레이딩 회사인 *제인 스트리트(Jane Street)*가 갑자기 AI 스타트업이 되어 연구개발에 거액을 쏟아붓는 것과 같은 파격적인 행보였다. 이러한 대담한 비전은 의외로 통했다.

“DeepSeek은 단기적인 상업적 성공보다 장기적인 기술 발전을 우선시하는 새로운 세대의 중국 기술 기업을 대표합니다.” 마리나 장 교수의 분석이다.

량원펑은 중국 기술 매체 36Kr와의 인터뷰에서 DeepSeek을 설립한 동기가 이윤이 아니라 과학적 호기심이었다고 설명했다.

“DeepSeek을 설립한 상업적 이유를 찾으라고 해도 저는 대답할 수 없을 겁니다. 이건 돈이 되는 일이 아니니까요. 기초과학 연구는 투자 대비 수익률이 굉장히 낮습니다. OpenAI 초기 투자자들도 돈을 벌기 위해 투자한 것이 아닙니다. 그들은 단지 ‘이 일을 하고 싶었을 뿐’이었죠.”

오늘날 DeepSeek은 바이두(Baidu), 알리바바(Alibaba), 바이트댄스(ByteDance) 같은 중국 거대 IT 기업의 지원 없이 독립적으로 운영되는 유일한 AI 기업 중 하나다.

젊은 천재들의 실험실

량원펑이 DeepSeek의 연구팀을 꾸릴 때 목표는 소비자 대상 제품을 개발할 경험 많은 엔지니어를 찾는 것이 아니었다. 대신, 그는 베이징대학과 칭화대학 등 중국 최고 대학에서 갓 졸업한 박사급 인재들을 영입하는 데 집중했다. 이들은 국제 학술지에 논문을 발표하고 학술 대회에서 상을 받은 인재들이었지만, 산업 경험은 부족했다.

2023년 36Kr와의 인터뷰에서 량원펑은 “DeepSeek의 핵심 기술 포지션은 대부분 최근 1~2년 이내에 졸업한 인재들로 채워졌다”고 밝혔다. 신입 연구자들이 넉넉한 컴퓨팅 자원을 활용해 비정형적인 연구를 자유롭게 수행할 수 있도록 한 것이다. 이는 중국의 기존 대형 IT 기업들과 확연히 다른 방식이다. 예를 들어, 최근 바이트댄스에서는 한 인턴이 팀의 컴퓨팅 자원을 독점하기 위해 동료 연구원의 연구를 방해한 사건이 벌어지기도 했다.

량원펑은 젊은 연구자들이 ‘높은 투자 대비 낮은 수익’의 기초 연구에 더 적합하다고 믿었다. “사람은 젊었을 때야말로 순수하게 하나의 목표에 몰입할 수 있습니다.” 그가 연구자들에게 던진 메시지는 간단했다. “DeepSeek은 세상에서 가장 어려운 문제를 해결하기 위해 설립되었습니다.”

위기가 낳은 혁신

2022년 10월, 미국 정부는 중국 AI 기업들이 Nvidia의 H100과 같은 최첨단 칩을 확보하지 못하도록 수출 규제를 강화했다. DeepSeek은 기존에 10,000개의 A100 칩을 확보하고 있었지만, OpenAI나 Meta 같은 기업과 경쟁하려면 더 많은 칩이 필요했다. 량원펑은 2024년 36Kr와의 인터뷰에서 “DeepSeek이 직면한 가장 큰 문제는 자금이 아니라 첨단 칩 수출 규제”라고 밝혔다. DeepSeek은 보다 효율적인 모델 훈련 방법을 찾아야 했다.

“DeepSeek은 칩 간 통신 최적화, 메모리 절약을 위한 필드 크기 축소, MoE(Mixture of Experts) 기법을 활용한 혁신적 모델 아키텍처 등 다양한 공학적 기법을 조합해 뛰어난 성과를 냈습니다.” 독일 메르카토 연구소의 AI 정책 분석가 웬디 창(Wendy Chang)의 설명이다.

DeepSeek의 연구 결과는 AI 칩 규제 전략에 대한 기존 예측을 뒤흔들고 있다.

미국의 수출 규제가 과연 AI 경쟁에서 효과적인 방어 전략이 될 수 있을까? DeepSeek은 그 질문에 새로운 답을 던지고 있다.

반응형

' > 도구' 카테고리의 다른 글

핸드폰 배경화면  (0) 2025.02.02
손 마사요시, 아이폰 개발에 투자하다  (1) 2025.01.27
토렌트와 저작권  (0) 2025.01.24
만년필에 딴지를 걸다  (0) 2024.12.22
2025년 다이어리 양식  (0) 2024.10.22
댓글
최근에 올라온 글
Total
Today
Yesterday