고수분들의 도움을 부탁드립니다.
안녕하세요.
예전에 도움을 요청을 드렸었는데..
요청 드리는 내용을 좀더 명확하게 정리해서 다시 요청드립니다.
고수분들의 도움을 부탁드립니다.
[현재 상황]
서버 - RTX 5090 GPU 1개 있는 서버
모델 - CosyVoice V3 모델 ( 파인튜닝한 모델 )
서빙 - LightTTS (https://github.com/ModelTC/LightTTS)
를 사용하고 있습니다.
주된 개발은 완료된 상태입니다. 다만 아래의 성능과 품질에 대한 개선을 요청을 드립니다.
위의 환경에서
[개선 작업 1]
현재는 1초당 1건의 요청을 처리하는 성능으로 동작을 하고 있습니다.
이것에 대해서 1초당 2건이상 처리하는 성능으로 개선을 요청 드립니다.
[개선 작업 2]
TTS 오류 중에 적지 않은 비율로 문장 자체를 음성으로 생성 못하거나..
기계음이 발생하는 문제가 있습니다.
위와 같이 2건의 개선작업을 진행해주시면 됩니다.
제 생각에는 아마도 LightTTS의 소스코드를 수정 또는 튜닝하는 업무라고 생각합니다.
실력이 있으신 분이면 해결하는데 시간이 오래걸리지 않을것 같습니다.
개선에 성공해주시면 1000만원 정도 성공 보수를 생각을 하고 있습니다.
관심이 있으신분들은 ihdream@growv.com으로 연락 부탁드립니다.