AI·8개월·506

GPT-5.2-Codex 출시

GPT-5.2 기반의 Codex 최적화 에이전트형 코딩 모델(전문 소프트웨어 엔지니어링 + 방어적 사이버 보안 목적)

장시간 작업 안정성(컨텍스트 압축)과 대규모 코드 변경(리팩터링/마이그레이션) 역량 강화

제공/접근
- 유료 ChatGPT 사용자 대상으로 Codex CLI, IDE 확장, 클라우드, 코드 리뷰 환경에서 우선 제공
- 서드파티 앱의 API 안전 접근 지원 방안 발표 예고
소프트웨어 엔지니어링 역량
- 장기 컨텍스트 이해 강화, 도구 호출 안정화, 정확도 개선, 네이티브 컴팩션, 토큰 효율 유지
- 리포지터리 탐색→리팩터링→PR 생성·검토까지 전 과정 성능 향상
멀티모달/플랫폼
- 비전 성능 강화: 스크린샷·기술 도면·차트·UI 화면 해석 정확도 개선
- Windows 네이티브 환경에서 에이전트형 코딩 성능·안정성 개선
벤치마크 성과
- SWE-Bench Pro 정확도: 56.4%(GPT-5.2-Codex) / 55.6%(GPT-5.2) / 50.8%(GPT-5.1)
- Terminal-Bench 2.0 정확도: 64.0%(GPT-5.2-Codex) / 62.2%(GPT-5.2) / 58.1%(GPT-5.1-Codex-Max)
- 벤치마크 의미: SWE-Bench Pro=리포지터리 기반 패치 생성, Terminal-Bench 2.0=실제 터미널 작업(컴파일/훈련/서버 설정 등)
사이버 보안 포지션(역량·리스크·운영)
- 공개 모델 중 최강 수준의 사이버 보안 역량 강조(방어 작업 가속 가능)
- 듀얼유스(오용) 리스크를 전제로 신중 배포·접근 통제 강화
- 준비성 평가 체계 기준 사이버 ‘높음’ 단계는 아직 미도달이나, 향후 도달 가능성을 전제로 설계·평가 진행
- Professional Capture-the-Flag(CTF) 평가에서는 모델이 Linux 환경에서 전문가 수준의 사이버 보안 역량이 요구되는 고난도 다단계 실무 문제를 얼마나 자주 해결할 수 있는지 측정

현실 사례(React 취약점)
- Privy(Stripe 계열) 보안 연구원이 Codex CLI에서 GPT-5.1-Codex-Max로 React2Shell 분석/재현 중 표준 워크플로(로컬 환경, 공격면 분석, 퍼징)로 미공개 취약점 3개 추가 발견 후 책임 공개
  - Denial of Service and Source Code Exposure in React Server Components
신뢰 기반 접근(Trusted Access)
- 초대 전용 파일럿: 검증된 보안 전문가·조직에 고급 보안 기능을 “명확한 목적의 방어 작업”으로 제한 제공
- 강력한 보호장치 하에서 승인된 방어 작업(예: 악성코드 분석, 핵심 인프라 스트레스 테스트) 수행 지원
결론/방향
- 개발자·보안 책임자의 복잡·장기 과제 해결을 지원하면서, 보호장치·접근 통제·커뮤니티 협력으로 방어 효과 극대화 및 오용 위험 최소화
- 윤리적 취약점 연구 또는 승인된 레드팀 수행 주체에 신뢰 기반 접근 프로그램 참여·의견 공유 권장

GPT-5.2-Codex 출시

source https://openai.com/ko-KR/index/introducing-gpt-5-2-codex/

#codex 목록