주식 뉴스 80개를 긁어서 딥씨크R1에게 먹여봤습니다
안녕하세요. 취미로 Next.js + Python으로 'AI 주가 예측 서비스'를 만들고 있는 물리학과 대학원생입니다.
최근 핫하다는 DeepSeek-R1(Reasoner) 모델을 제 서비스의 '한국 증시 시황 리포트', AI 뉴스 및 AI 칼럼 기능에 도입해 보면서 겪은 기술적 진화 과정(?)을 짧게 공유해 봅니다.
1. 초기 접근의 한계 (The "Naive" Approach)
처음에는 단순히 GPT-4o mini 등에게 이렇게 시켰습니다.
"오늘 한국 증시 요약해서 칼럼 좀 써줘."
결과:
환각(Hallucination): 없는 종목이 상한가를 갔다고 하거나, 어제 뉴스를 오늘처럼 말함.
영혼 없음: "오늘은 코스피가 올랐습니다. 끝." 수준의 초등학생 일기장.
결론: "아, AI한테 팩트 체크까지 시키면 안 되겠구나."
2. 아키텍처 변경: "팩트는 내가 줄게, 넌 생각만 해"
AI에게 지식을 물어보는 게 아니라, 문맥(Context)을 씹어먹게 만드는 검색 증강 생성 방식?으로 구조를 뜯어고쳤습니다.
[변경된 파이프라인]
News_Collector.py (Python)
매일 새벽, 네이버 금융/글로벌 뉴스 등에서 80개 이상의 최신 기사를 크롤링합니다. (이게 또 너무 많이 요청하면 요청이 거절될 수 있다고 하더라구요, 그래서 80개로 제한했습니다.)
단순 크롤링이 아니라, 각 기사에서 '핵심 키워드'와 '감성 점수'를 1차로 추출해서 DB에 저장합니다.
Context Injection
추출된 80개의 뉴스 요약본과 주요 지수(환율, 금리, 유가) 데이터를 하나의 거대한 프롬프트로 만듭니다. (약 10,000 토큰 분량)
DeepSeek Reasoner (R1) 호출
여기서 DeepSeek을 씁니다. 단순 요약이 아니라 "인과관계 추론"을 시킵니다.
"뉴스 A(반도체 하락)와 뉴스 B(미국 국채 금리 급등)의 상관관계를 분석해서 인사이트를 도출해."
3. DeepSeek R1 사용 후기 (vs GPT-4o)
확실히 'Reasoner' 모델이라 그런지 글을 쓰는 '결(Texture)'이 다릅니다.
논리적 연결: 기존 모델이 나열식이었다면, DeepSeek은 "A라서 B가 되었고, 이는 C 섹터에 악재다"라는 식의 Chain of Thought가 결과물에 잘 묻어납니다.
가성비: 이 정도 추론을 GPT-4o로 매일 돌리면 토큰 비용이 꽤 나오는데, DeepSeek API는 가성비가 깡패 수준이라 부담 없이 문맥을 때려 넣을 수 있었습니다. (5달러 넣어놓고 1달째 사용중)
4. 결과물 (Before & After)
Before: "삼성전자가 1% 올랐습니다. 반도체 업황이 좋습니다."
After: "필라델피아 반도체 지수의 급락에도 불구하고, 삼성전자는 외국인 저가 매수세 유입으로 1% 반등했습니다. 이는 단순 업황 개선보다는 환율 안정화에 따른 수급 개선으로 보입니다."
[결론 및 요약]
주식 분석처럼 '팩트'가 중요한 분야에서 AI에게 모든 걸 맡기면 힘들다.
News Collector(데이터 수집기)를 따로 두어 'Ground Truth'를 확보하는 게 지향된다.
확보된 데이터를 해석하는 데에는 DeepSeek Reasoner가 가성비와 성능 면에서 아주 훌륭하다.
혹시 저처럼 데이터 분석 서비스 만드시는 분들 계시면, DeepSeek API 한번 찍먹해 보시길 추천합니다. 생각보다 한국어 패치(?)도 잘 되어 있어서 놀랐네요.
👉 (링크) 제 AI 애널리스트가 쓴 오늘의 글 보러가기 (아직 부족한 게 많습니다. 피드백은 언제나 환영입니다!)