AI 캐릭터 · 컴패니언
다리오 아모데이: 딥시크와 반도체 수출 통제에 관하여
몇 주 전, 저는 중국의 반도체 수입 제한을 더욱 강화해야 한다고 주장했습니다. 그 이후 중국의 인공지능 기업 '딥시크'가 일부 분야에서 미국의 최첨단 AI 모델들과 맞먹는 성능을 더 낮은 비용으로 구현했다는 소식이 전해졌습니다.
이 글에서는 딥시크가 앤트로픽과 같은 미국 AI 기업들에게 실질적인 위협이 되는지는 다루지 않겠습니다(미국의 AI 주도권에 대한 위협 주장이 과장되어 있다고 판단합니다)¹.
대신, 딥시크의 이러한 성과가 반도체 수출 통제 정책의 타당성을 훼손하는지 검토하고자 합니다. 제 의견으로는 그렇지 않습니다. 오히려 일주일 전보다 수출 통제의 실질적 중요성이 한층 더 높아졌다고 봅니다².
수출 통제는 민주주의 국가들이 AI 개발의 선두 자리를 지키도록 하는 핵심적 역할을 합니다. 분명히 말씀드리자면, 이는 미국과 중국 간의 경쟁을 피하는 방법이 아닙니다. 궁극적으로 우리가 승리하려면 미국과 여타 민주주의 국가들의 AI 기업들이 중국보다 우수한 모델을 보유해야 합니다. 다만 우리의 기술적 우위를 중국 공산당이 따라잡을 수 있도록 도와줄 필요는 없습니다.
AI 개발의 세 가지 역학관계
정책 제안에 앞서, AI 시스템의 세 가지 기본적인 역학관계를 설명하고자 합니다:
1. 규모의 법칙(Scaling laws). AI의 주요 특성 중 하나는 - 제가 공동 창업자들과 함께 오픈AI에서 처음 입증했던 - 다른 조건이 동일할 때, AI 시스템의 학습 규모를 확대하면 다양한 인지 과제에서 전반적인 성능이 점진적으로 향상된다는 점입니다. 예컨대, 100만 달러 모델은 주요 코딩 과제의 20%를, 1,000만 달러 모델은 40%를, 1억 달러 모델은 60%를 해결할 수 있습니다. 이러한 차이는 실질적으로 큰 의미를 지니며 - 10배의 격차는 학부생과 박사급 실력 차이에 맞먹을 수 있어 - 기업들은 이러한 모델 학습에 막대한 투자를 하고 있습니다.
2. 곡선의 이동(Shifting the curve). 이 분야는 지속적으로 효과성과 효율성을 높이는 크고 작은 혁신들을 만들어내고 있습니다. 이는 모델의 '구조'를 개선하거나(현재 모든 모델이 사용하는 기본 트랜스포머 구조의 개선) 기반 하드웨어에서 모델을 더 효율적으로 실행하는 방식으로 나타날 수 있습니다. 새로운 세대의 하드웨어도 같은 효과를 보입니다. 이는 일반적으로 '곡선을 이동시킵니다': 만약 혁신이 2배의 "연산 승수"(CM)를 가져온다면, 코딩 작업에서 40%의 성능을 내는 데 1,000만 달러 대신 500만 달러가 들거나, 60%의 성능을 내는 데 1억 달러 대신 5,000만 달러가 드는 식입니다.
최첨단 AI 기업들은 정기적으로 이러한 CM들을 발견합니다: 자주는 작은 규모(~1.2배), 때로는 중간 규모(~2배), 가끔은 매우 큰 규모(~10배)의 발전을 이룹니다. 더 지능적인 시스템을 갖는 것의 가치가 매우 크기 때문에, 이러한 곡선의 이동은 일반적으로 기업들이 모델 학습에 '더 적게가 아닌 더 많이' 투자하게 만듭니다: 비용 효율성의 향상은 전적으로 더 똑똑한