AI 에이전트에 전화 기능 붙이기 — VoIP/SIP 기초 정리
AI 에이전트를 만들다 보면 “전화도 할 수 있으면 좋겠다”는 생각이 한 번쯤 듭니다.
실제로 해보면 생각보다 복잡한 부분이 많아서, 기초부터 정리해봤습니다.
왜 전화 기능이 필요한가
LLM 기반 에이전트가 텍스트 채팅은 잘 하는데, 실제 비즈니스에서는 전화가 필수인 경우가 많습니다.
병원/치과 예약 접수 (24시간)
- 배송 조회, 교환/반품 CS
- 리마인더 콜 (예약 확인, 결제 안내)
VoIP vs PSTN
PSTN(공중전화망)은 기존 유선 전화 인프라입니다.
VoIP(Voice over IP)는 인터넷으로 음성을 전송합니다.
AI 에이전트에는 VoIP가 맞습니다:
API로 제어 가능
- 프로그래밍 가능한 통화 흐름
- 기존 통신사 계약 없이 사용 가능
SIP(Session Initiation Protocol) 기초
SIP는 VoIP 통화를 설정/관리/종료하는 표준 프로토콜입니다.
AI 에이전트 → SIP → VoIP 게이트웨이 → PSTN 순서로 연결됩니다.
핵심 개념:
SIP URI: 전화번호 대신 사용하는 주소 (sip:agent@example.com)
2. INVITE: 통화 시작 요청
3. RTP: 실제 음성 데이터 전송 프로토콜
4. Codec: 음성 압축 형식 (G.711, Opus 등)
한국에서의 현실
해외에는 Twilio, Vonage 같은 서비스가 있지만, 한국 070 번호를 지원하는 서비스는 거의 없습니다.
한국에서 AI 에이전트에 전화 기능을 붙이려면:
통신사와 SIP 트렁크 계약 (법인 필요, 수일~수주)
2. FreeSWITCH/Asterisk 같은 PBX 서버 직접 구축
3. STT/TTS 엔진 연동
4. LLM 통합
이 과정 전체를 API 한 줄로 해결하는 서비스를 만들고 있습니다.
관심 있으신 분은 claw-ops.com 참고해주세요.
참고 자료:
RFC 3261 (SIP 프로토콜 명세)
- VoIP-Info.org
