구글이 AI 패권 경쟁에서 소프트웨어와 하드웨어를 동시에 겨냥한 양면 전략을 공식화했다. 기업용 에이전트 도구로 오픈AI·앤트로픽에, 8세대 AI 칩으로는 엔비디아에 각각 도전장을 내밀었다.

구글은 22일(현지시간) 기업용 AI 에이전트 구축 플랫폼 '제미나이 엔터프라이즈 에이전트 플랫폼'을 발표했다. 코딩 지식 없이도 에이전트를 직접 만들 수 있도록 설계한 이 도구는 개발자뿐 아니라 일반 업무 직원까지 아우르는 넓은 이용자층을 겨냥한다.

현재 기업용 AI 시장에서 가장 확실한 매출원으로 꼽히는 코딩 도구 분야에서는 오픈AI의 코덱스와 앤트로픽의 클로드 코드가 경쟁 중이다. 구글은 이번 플랫폼을 통해 코딩 도구 시장을 넘어 기업용 AI의 새 주류로 부상하는 에이전트 시장 전반의 주도권을 확보하겠다는 구상이다.

구글은 자사 제미나이 모델과 함께 경쟁사인 앤트로픽의 클로드 모델도 동일 플랫폼에서 사용할 수 있도록 개방형 구조를 채택했다.

토머스 쿠리안 CEO는 "이는 단편적인 서비스를 엮어서 제공하는 것이 아니라 혁신을 위해 포괄적인 기반을 제공하는 것"이라고 설명했다.

구글의 8세대 추론용 칩 'TPU 8i'
구글의 8세대 추론용 칩 'TPU 8i'(구글 제공)

구글은 이와 함께 8세대 텐서처리장치(TPU·Tensor Processing Unit)를 공개했다. 훈련용 'TPU 8t'와 추론용 'TPU 8i'로 역할을 나눈 것이 핵심이다. 기반 모델(파운데이션 모델)을 학습시킬 때는 연산량이 높은 TPU 8t를, 에이전트를 실시간으로 구동하는 추론 단계에서는 처리 속도에 최적화한 TPU 8i를 활용하는 구조다.

이는 엔비디아가 자사 베라 루빈(Vera Rubin) AI 슈퍼컴퓨터 생태계에 루빈 그래픽처리장치(GPU)와 함께, 우회 인수한 그록이 생산한 추론 전용 언어처리장치(LPU·Language Processing Unit)를 추가한 전략과 유사한 방식이다. TPU 8t·8i와 엔비디아의 GPU·LPU가 각각 맞대응하는 구도다.

TPU 8i와 그록 LPU는 비용이 많이 들고 면적도 크게 차지하지만, 데이터 전송 속도가 빠른 S램(SRAM)에 의존한다는 공통점이 있다. 연산과 데이터 저장 영역 사이의 병목 현상을 해소해 추론 속도를 높이기 위한 설계다.

"AI 에이전트가 부상하면서 훈련과 서비스(추론)에 각각 특화한 칩이 도움이 될 것으로 판단했다"이라고 아민 바닷 구글 수석부사장가 밝혔다.

이번 발표로 구글은 칩, 클라우드, AI 모델, 개발자 도구, 에이전트 도구로 이어지는 AI 수직계열화(풀스택) 체계를 갖추게 됐다. 아마존과 마이크로소프트도 자체 칩 '트레이니엄(Trainium)'과 '마이아(Maia)'를 운용하고 있으나, 구글은 2015년부터 맞춤형 칩을 생산·운용해온 경험이 앞선다.

AI 모델 분야에서도 제미나이는 오픈AI의 챗GPT, 앤트로픽의 클로드와 함께 3강 체제를 형성하고 있으며, 앤트로픽도 구글 TPU의 대규모 사용을 약정한 것으로 알려졌다.

쿠리안 CEO는 "에이전트형 기업으로의 전환은 모든 기업이 나아가야 할 미래"라며 "구글 클라우드의 기술적 준비는 끝났다. 이제 기업이 성장 엔진을 구축해야 할 때"라고 밝혔다.