• 코드 레드 후 한 달 만에… “가장 강력한 지식 노동용 모델”
  • 인스턴트·씽킹·프로 3종… “현실 업무 시나리오 겨냥”
  • 환각 감소·멘탈헬스 대응 강화… 안전성도 업그레이드
GPT 5.2 출시

오픈AI가 구글 제미니3에 맞서 차세대 인공지능 모델 ‘GPT-5.2’를 공식 공개했다.

샘 올트먼 CEO가 최근 사내에 ‘코드 레드(code red)’를 발동하며 챗GPT 경쟁력 제고를 주문한 이후 나온 첫 결과물이다. 새 모델은 글쓰기·코딩·추론 성능을 전반적으로 끌어올리고, 실제 업무 자동화와 에이전트(Agentic AI) 활용에 초점을 맞춘 것이 특징이다.

로이터에 따르면, GPT-5.2는 11일(현지시간) 공개됐다. 올트먼 CEO가 구글 제미니3 등장 이후 챗GPT 품질 개선을 최우선 과제로 삼고, 내부적으로 개발 속도를 끌어올리도록 지시한 지 약 1주일 만이다. 오픈AI는 GPT-5.2를 “전문 지식 노동을 위한 가장 강력한 모델 시리즈”라고 규정했다.

이번 출시에는 구글과의 주도권 경쟁이 직접적인 배경으로 작용했다. 제미니3는 각종 벤치마크에서 기존 GPT-5 계열을 추월했다는 평가를 받으며 시장 관심을 끌어왔다. 이에 맞서 오픈AI는 챗GPT의 응답 속도·정확도·안정성을 동시에 강화해 사용 경험에서 우위를 확보하겠다는 전략이다.

GPT-5.2는 ▲인스턴트(Instant) ▲씽킹(Thinking) ▲프로(Pro) 세 가지 라인업으로 제공된다. 인스턴트는 빠른 검색·질문 응답 등 일상적 질의응답에 최적화된 모델이며, 씽킹은 코딩·복잡한 문서 요약·수학·계획 수립 등 심층 작업용, 프로는 고난도 전문 영역을 대상으로 한 최고 등급 모델이다.

오픈AI는 GPT-5.2가 스프레드시트 작성, 프레젠테이션 구성, 코드 생성, 이미지 이해, 장문 문서 분석, 툴 호출 및 외부 시스템 연동 등 실제 업무 시나리오 전반에서 성능을 개선했다고 설명했다. 특히 에이전트형 워크플로우(여러 단계로 이루어진 자동 업무 흐름)를 안정적으로 수행하도록 설계한 점을 강조했다.

오픈AI는 내부 벤치마크 ‘GDPval’ 결과에 따르면 GPT-5.2는 44개 직군의 실제 업무 과제를 기준으로 인간 전문가와 비교했을 때, 평균 처리 속도가 11배 빠르고 비용은 1% 미만 수준인 것으로 주장했다.

GPT-5.2는 사실과 다른 답변을 내놓는 ‘환각(hallucination)’ 문제를 줄이는 데도 초점을 맞췄다. 오픈AI는 GPT-5.2가 사실 질문 응답, 장문 문맥 이해, 도구 활용 등 여러 평가에서 GPT-5.1보다 오류와 오답 빈도를 줄였다고 밝혔다. 시스템 카드 업데이트에서도 자살·자해, 정신적 고통, 모델에 대한 과도한 의존을 시사하는 입력에 대한 대응을 강화했다고 설명한다.

정신 건강 관련 대응은 이미 중요한 과제로 떠올랐다. 오픈AI는 앞서 공개한 자료에서 매주 100만 명이 넘는 사용자가 자살 관련 고민을 챗GPT에 털어놓는 것으로 추정된다고 밝힌 바 있다. GPT-5.2에서는 이 같은 민감한 대화에서 부적절한 응답을 줄이고, 전문 기관에 연결하도록 유도하는 방향으로 정책을 조정했다는 설명이다.

이와 함께 오픈AI는 일부 국가에서 나이 예측(age prediction) 모델을 시험 적용해, 미성년자로 추정되는 이용자에게는 더 강한 콘텐츠 제한을 거는 방식을 도입하고 있다.

GPT-5.2는 우선 챗GPT 유료 이용자(플러스-프로-고-엔터프라이즈)에게 순차 적용된다. 오픈AI는 서비스 안정성을 위해 모델 배포를 점진적으로 진행하며, 일정 기간 GPT-5.1도 ‘레거시(legacy)’ 옵션으로 함께 제공한다는 방침이다. 이후 수개월 내에 GPT-5.1을 단계적으로 종료할 계획이다.

API에서도 GPT-5.2 씽킹은 gpt-5.2, 인스턴트는 gpt-5.2-chat-latest, 프로는 gpt-5.2-pro라는 이름으로 제공된다. 토큰 단가는 GPT-5.1보다 다소 높지만, 토큰 효율과 작업 단위당 성능 향상을 고려하면 전체 비용 측면에서는 유리하다고 오픈AI는 주장하고 있다.

이번 GPT-5.2 출시는 구글 제미니3, 앤스로픽의 클로드 등과의 고도화 경쟁이 본격적인 ‘에이전트 전쟁’ 단계로 진입하고 있음을 보여준다. 오픈AI는 GPT-5.2를 기반으로 개발자와 기업이 복잡한 워크플로우를 자동화하는 에이전트형 서비스를 쉽게 구축할 수 있다고 강조하고 있다.

전문가들은 GPT-5.2가 실제 사무·개발 현장에서 어느 정도 생산성 향상을 입증하느냐에 따라, 기업용 생성형 AI 시장 구도가 다시 재편될 수 있다고 보고 있다. 동시에, 성능 향상과 함께 강화된 성인 모드·연령 보호·멘탈헬스 대응이 규제 환경 속에서 어느 수준의 신뢰를 얻을지도 향후 관전 포인트로 꼽힌다.