AI·3개월·2.0k

Codex 토큰이 너무 빨리 떨어진다면 이 요인들을 확인하세요

source https://github.com/openai/codex/issues/13568#issuecomment-4015658187

이 문제를 함께 확인하는 동안 기다려줘서 감사함.
위에서 말했듯, 우리는 이 스레드에서 설명된 현상 일부를 설명해 주는 문제를 찾아냈음. 이 문제 때문에 사용량 보고가 불규칙하게 나타났음. 어떤 사용자는 남은 사용량이 갑자기 크게 줄어들거나, 더 높은 값과 더 낮은 값 사이를 오가는 것처럼 보인다고 했음. 또 다른 사용자는 로컬 클라이언트와 웹 사용량 대시보드 사이에서 통계가 일관되지 않는다고 보고했음. 원인은 리전(데이터 센터) 간 동기화 문제였음. 특히 지리적으로 리전 경계 부근에 있는 사용자에게 영향이 더 크게 나타났음.
우리는 이제 데이터 센터 간 동기화 지연을 줄이기 위한 메커니즘을 추가했음. 요청이 서로 다른 리전으로 라우팅되는 경우 짧은 시간 동안 사용량 통계에 약간의 차이가 보일 수는 있지만, 그 차이는 몇 퍼센트를 넘지 않아야 함.
다만 이 문제가 예상보다 높은 사용량에 대한 모든 보고를 설명한다고 보지는 않음. 우리는 그런 보고 다수를 조사했지만, 사용량 집계 자체에서 다른 문제는 확인하지 못했음. 현재로서는 아래 요인들이 복합적으로 작용한 결과라고 보고 있음.
gpt-5.4를 쓰면 gpt-5.3-codex보다 사용량이 약 30% 더 빠르게 소모됨.
"fast mode"를 쓰면 사용량이 2배 속도로 소모됨.
큰 컨텍스트 윈도우(large context window, gpt-5.4에서 제공되는 새로운 실험 기능)를 쓰면 사용량이 2배 속도로 소모됨.
실험적 multi_agent기능을 켜면, 서브에이전트가 비활성 상태일 때보다 일반적으로 더 높은 속도로 토큰을 소비함. 이 기능은 계속 다듬는 중이라, 앞으로의 변경이 토큰 소비량에 영향을 줄 수도 있음. 사용량 소모가 걱정된다면 당분간은 기본값인 비활성 상태로 두는 편을 권장함.
아직 개발 중인 기능의 feature flag를 수동으로 켜면 토큰이 훨씬 더 빠르게 소모될 수 있음. 이 방식은 권장하지 않음.
위 설명으로도 맞지 않는 예상 밖의 사용량 증가가 보이고, 이를 뒷받침할 강한 증거나 분석이 있다면 알려주기 바람.
이 이슈는 이제 닫고 잠글 예정임. 이미 너무 길어져서 GitHub에서도 렌더링하기 어려운 상태이기 때문임.

source https://github.com/openai/codex/issues/13568#issuecomment-4015658187

AI 목록