에이전틱 코딩에도 인간두뇌가 토큰 경제적인 이유
antigravity 에이전트 개발 이전에 VScode gemini code assist + gemini cli 로 작업을 했었는데 작업스케쥴 및 배치식으로 gemini cli 한테 맞겨놓으면 기본적으로 gemini pro 2.5가 좀 멍청하기도 하고 바보같은 loop에 걸려버리면 토큰을 금방 다 써버리기도 하고 상당히 비효율적이었다 이거죠
현재도 antigravity 에이전트들도 마찬가지입니다. 계획-시스템설치-코드 작성/리팩터링-빌드테스트-런타임테스트를 알아서(TURBO 모드)는 상당히 비효율적이라는거죠
Antigravity 에이전트는 관찰(Observe) → 방향 설정(Orient) → 결정(Decide) → 실행(Act)의 과정을 반복하는데
Antigravity 에이전트에게 SSH 권한을 주어 '자율적 루프(Autonomous Loop)'를 돌리는 것과 사용자가 개입하는 '인간 개입형(Human-in-the-Loop, HITL)' 방식의 토큰 경제성과 개발 효율성은 후자가 훨씬 낫다는 겁니다 아직은
토큰 소모량 비교 분석
결론부터 말씀드리면, 에이전트에게 자율권을 줄 경우 토큰 소모량이 최소 2~5배 이상 급증할 수 있습니다.
비교 항목 | 자율 에이전트 (SSH 허용) | 사용자 개입 (직접 빌드/전달) |
토큰 소모량 | 매우 높음 (🔴) | 상대적으로 낮음 (🟢) |
이유 | 에이전트가 터미널 명령(ls, cat, build)을 내릴 때마다 그 결과가 컨텍스트에 계속 쌓임. 에러 발생 시 스스로 수정 시도를 하며 루프를 돌기 때문. | 사용자가 에러 로그 중 '핵심'만 발췌해서 전달하므로 불필요한 터미널 출력값이 컨텍스트를 차지하지 않음. |
컨텍스트 유지 | 에이전트가 모든 히스토리(명령어+결과)를 기억해야 하므로 컨텍스트 윈도우가 빠르게 참. | 필요한 코드와 명확한 피드백만 오가므로 효율적인 컨텍스트 관리 가능. |
작업 속도 | 사용자가 자리를 비워도 진행됨 (비동기 효율) | 사용자의 대기 시간이 발생함 (동기식) |
AI에게 모든 것을 맡기는 'Full-Autonomous'는 기술적으로는 화려해 보이지만, 실제로는 '비효율적인 무한 루프'와 '비용 폭탄'이라는 함정이 있죠. 이를 깨닫고 인간의 경제적 본능(Economic Instinct)을 개입시키는 것이 현재 가장 영리한 AI 활용법입니다.