AI·5개월·1.0k

주식 뉴스 80개를 긁어서 딥씨크R1에게 먹여봤습니다

안녕하세요. 취미로 Next.js + Python으로 'AI 주가 예측 서비스'를 만들고 있는 물리학과 대학원생입니다.

최근 핫하다는 DeepSeek-R1(Reasoner) 모델을 제 서비스의 '한국 증시 시황 리포트', AI 뉴스 및 AI 칼럼 기능에 도입해 보면서 겪은 기술적 진화 과정(?)을 짧게 공유해 봅니다.

처음에는 단순히 GPT-4o mini 등에게 이렇게 시켰습니다.

"오늘 한국 증시 요약해서 칼럼 좀 써줘."

결과:

AI에게 지식을 물어보는 게 아니라, 문맥(Context)을 씹어먹게 만드는 검색 증강 생성 방식?으로 구조를 뜯어고쳤습니다.

[변경된 파이프라인]

News_Collector.py (Python)
- 매일 새벽, 네이버 금융/글로벌 뉴스 등에서 80개 이상의 최신 기사를 크롤링합니다. (이게 또 너무 많이 요청하면 요청이 거절될 수 있다고 하더라구요, 그래서 80개로 제한했습니다.)
- 단순 크롤링이 아니라, 각 기사에서 '핵심 키워드'와 '감성 점수'를 1차로 추출해서 DB에 저장합니다.
Context Injection
- 추출된 80개의 뉴스 요약본과 주요 지수(환율, 금리, 유가) 데이터를 하나의 거대한 프롬프트로 만듭니다. (약 10,000 토큰 분량)
DeepSeek Reasoner (R1) 호출
- 여기서 DeepSeek을 씁니다. 단순 요약이 아니라 "인과관계 추론"을 시킵니다.
- "뉴스 A(반도체 하락)와 뉴스 B(미국 국채 금리 급등)의 상관관계를 분석해서 인사이트를 도출해."

확실히 'Reasoner' 모델이라 그런지 글을 쓰는 '결(Texture)'이 다릅니다.

논리적 연결: 기존 모델이 나열식이었다면, DeepSeek은 "A라서 B가 되었고, 이는 C 섹터에 악재다"라는 식의 Chain of Thought가 결과물에 잘 묻어납니다.
가성비: 이 정도 추론을 GPT-4o로 매일 돌리면 토큰 비용이 꽤 나오는데, DeepSeek API는 가성비가 깡패 수준이라 부담 없이 문맥을 때려 넣을 수 있었습니다. (5달러 넣어놓고 1달째 사용중)

Before: "삼성전자가 1% 올랐습니다. 반도체 업황이 좋습니다."
After: "필라델피아 반도체 지수의 급락에도 불구하고, 삼성전자는 외국인 저가 매수세 유입으로 1% 반등했습니다. 이는 단순 업황 개선보다는 환율 안정화에 따른 수급 개선으로 보입니다."

[결론 및 요약]

혹시 저처럼 데이터 분석 서비스 만드시는 분들 계시면, DeepSeek API 한번 찍먹해 보시길 추천합니다. 생각보다 한국어 패치(?)도 잘 되어 있어서 놀랐네요.

👉 (링크) 제 AI 애널리스트가 쓴 오늘의 글 보러가기 (아직 부족한 게 많습니다. 피드백은 언제나 환영입니다!)