LLM이 웹에서 작동할 수 있도록 DOM을 자연어로 변환하는 웹 에이전트 프레임워크
저는 웹 사이트 DOM을 자연어로 변환하여 LLM이 웹에서 작동할 수 있도록 하는 브라우저 프레임워크인 Notte를 구축하여 AI 에이전트 기능을 개선했습니다.
핵심 혁신은 웹사이트를 자연어로 설명된 구조화된 맵으로 변환하는 인식 레이어입니다. 이를 통해 AI 에이전트는 원시 HTML이 아닌 웹사이트의 의도를 이해할 수 있으므로 더 작은 모델에서도 안정적으로 작동할 수 있습니다.
벤치마크 결과는 고무적이었습니다:
- 평균 작업 완료 시간 47초(다른 대안보다 2.4배 빠름)
- 여러 번의 시도에서 96.6%의 작업 안정성 보장
Notte에는 통합 세션 관리, 스텔스 기능, 자격증명 저장소, 간단한 API를 통한 CAPTCHA 처리 기능이 포함되어 있습니다.
LLM 및 웹 자동화 프로젝트를 진행하는 사람들에게 흥미로울 것이라고 생각했습니다.