AI가 가끔 산으로 갈 때

클로드 코드한테 디버깅 용도로 file save dir을 CLI flag에서 지정하지 않았을 때 실제 파일이 아니라 devnull에 쓰도록 지정해달라고 했는데 자기가 devnull을 wrap하는 클래스를 만들더라고요.
그래서 이런 식으로 중간에 interrupt 걸고 그렇게 하지 말라고 해서 고치는 걸 가끔씩 하고 있는데..
이런 자잘한 실수들을 제가 지속적으로 보지 않더라도 자체적으로 컷하게 하고 싶은데, 물론 완벽이란 건 아니어도 이런 실수하는 수준의 bar을 앤트로픽이 더 좋은 AI를 만들어주기 전까지 최대한 더 자체적으로 좀 높이고 싶은데 고민이네여.
이런 관점에서 코드를 2차 점검하는 병렬 에이전트들을 스폰해야 하나?
