일론 머스크 CEO가 차세대 AI 모델 '그록(Grok) 4.5'의 내부 테스트가 진행 중이라고 공개하며, 초기 성능이 앤트로픽의 최상위 모델 '클로드 오퍼스'에 근접하거나 이를 뛰어넘을 가능성이 있다고 주장했다. 또 올해 안에 처음부터 새롭게 학습시킨 AI 모델을 매달 공개하겠다는 계획도 밝혔다.
머스크 CEO는 28일(현지시간) X를 통해 "그록 4.5는 1조5000억(1.5T) 매개변수 규모의 V9 기반 모델을 바탕으로 추가 학습을 거쳐 현재 스페이스X와 테슬라에서 비공개 베타 테스트를 진행 중"이라고 발표했다.
현재 그록 4.5는 스페이스X와 테슬라 내부에서만 비공개 베타 테스트 형태로 운용되고 있으며, 이를 통해 성능과 안정성을 검증한 뒤 앞으로 일반 사용자에게 공개될 것으로 예상된다.
특히, "초기 평가에서는 앤트로픽의 오퍼스와 비슷하거나, 어쩌면 이를 능가하는 성능을 보여주고 있다"라고 강조했다.
여기에서 말하는 오퍼스가 4.7인지 4.8 버전인지는 확실하지 않다. 하지만 그가 그록 4.5를 오퍼스와 직접 비교한 것은 이번이 처음이다. 아직 공개 벤치마크 결과는 제시되지 않았지만, 차세대 모델의 경쟁력을 강조하려는 의도로 보인다.
그록 4.5의 기반 모델인 V9은 현재 운영 중인 그록 서비스의 기반인 V8 모델보다 약 3배 큰 규모인 1조5000억개의 매개변수를 갖췄다. V9 학습은 지난 5월26일 완료됐으며, 이후 바이브코딩 도구 커서의 워크플로우 데이터를 활용한 추가 학습을 거쳐 성능을 높였다. 이달 초에는 스페이스X가 커서를 600억달러(약 92조원)에 인수하며, 해당 데이터를 적극 활용하고 있다고 밝힌 바 있다.
특히, 머스크 CEO는 커서 인수에 따라 강화학습(RL)을 통해 모델 성능이 지속적으로 크게 향상되고 있다고 강조했다. "RL이 모델을 계속 크게 개선하고 있으며, 코드 생성 및 개발 자동화 시스템인 '그록 빌드(Grok Build)'도 매일 발전하고 있다"라며 연구진을 칭찬했다.
Grok 4.5, based on our 1.5T V9 foundation model, with Cursor data added in supplemental training, is now in private beta at SpaceX & Tesla. Early evals show performance close to, perhaps exceeding Opus.
RL is continuing to significantly improve the model, and the Grok Build…
앞으로 개발 계획도 공개했다. 그는 "올해 남은 기간 동안 스페이스X가 처음부터 완전히 새롭게 학습(Trained from scratch)한 신규 기반 모델을 매달 출시할 예정"이라고 밝혔다.
이 같은 계획이 현실화되면, 업계의 AI 모델 출시 주기를 크게 앞당기는 사례가 된다. 현재 오픈AI와 앤트로픽, 구글 등 주요 AI 기업들은 일반적으로 3~6개월 간격으로 차세대 프론티어 모델을 공개하고 있다.
반면 스페이스X는 매달 새로운 기반 모델을 선보이겠다는 전략을 내세우며 개발 속도 경쟁을 본격화하겠다는 의지를 드러냈다.
박찬 기자 cpark@aitimes.com