퀀트는 결국 pytorch forecasting인가
퀀트 프로그램 설계를 위해서 기반 기술과 도구들을 알아보는 중입니다
정량적 데이터(가격, 수급, 거래량)는 오라클 SQL DB에 넣고 GO프로그램으로 각종 주식데이터 뽑고
(influxDB 같은 시계열 DB는 초단위 거래데이터 처리에나 필요하고. 오라클 SQL DB 정도면 분단위 시계열처리에 충분함)
정성적 데이터(뉴스, 공시, 실적발표, 애널리스트자료)는 Qdrant 벡터 DB에 임베딩 해서 넣고 LLM으로 감성점수 등 뽑고
페어링 대상과의 관계 데이터도 시계열적으로 뽑아 계산해서 JSON DB에 넣고
이걸 다 합쳐서 Python Pandas DataFrame 시계열 데이터로 전처리해서
pytorch forecasting 작업으로 넘기는 것이 코어 부분입니다
데이터추출 스크래핑,보고서,의사결정지원 등은 부가적인 부분이고요
결국 pytorch 를 돌려야 되는데 비용 뽑아보니 클라우드 GPU 쓰는 것이 GPU 컴퓨터 구매 후 전기값도 안되는 것 같은데
그럼 클라우드 GPU가 좋겠네요. 어차피 pytorch 돌리는 것 외에는 게임도 잘 안해서 GPU 컴터 쓰지도 않을 것 같고
시나리오 1: 소규모 실험 및 주간 학습
NVIDIA T4 (16GB VRAM):
AWS (g4dn.xlarge): 온디맨드 기준 시간당 약 $0.58 (Spot 인스턴스는 $0.28 정도까지 내려갈 수 있음)
Google Cloud (T4): 온디맨드 기준 시간당 약 $0.35 (할인 적용 시 더 저렴)
Azure (NCasT4_v3): 온디맨드 기준 시간당 약 $0.50~$0.60
모델 학습 시간: 한 번 학습에 2시간 소요
주간 학습 횟수: 5회 (매일 모델 업데이트 등)
총 학습 시간: 2시간/회 * 5회/주 = 10시간/주
주간 비용: 10시간 * $0.40/시간 = $4.00 (약 5,500원)
월간 비용 (4주 기준): $4.00 * 4 = $16.00 (약 22,000원)
RTX 4070 12GB 기반 PC:
그래픽카드: 80만원
CPU (i5-13세대/14세대 or Ryzen 5 7000번대): 25~40만원
메인보드: 15~25만원
RAM (DDR5 16GB or 32GB): 8~15만원
SSD (NVMe 1TB): 8~12만원
파워 서플라이 (700W~800W): 8~12만원
케이스: 7~15만원
총계: 약 150만원 ~ 200만원 (모니터, 키보드, 마우스 제외)