[무료 세미나] R-Zero와 SPICE로 완벽하게 이해하는 LLM 자가 진화(Self-Evolution) 매커니즘
고품질의 데이터를 얻기 어려워지는 상황 속,
사람의 개입 없이 LLM의 성능을 정교하게 높일 수 있는 Self-Play 방법이 새롭게 주목받고 있습니다.
단 하루, 무료 세미나에서 고품질의 LLM 개발을 위한 Self-Play (자가 진화) 전략
최근 사례와 함께 배우고, 특별 혜택까지 받아가세요!
By. NeurIPS & ICLR Main Conference
저자 이승유
(Open-LLM / Open-Ko LLM
리더보드 최장기 1위 달성)
📅 행사 안내
◾ 행사 일시 : 2025. 12. 23 (화) 19:00 - 21:00 l ZOOM
◾ 장소 : 온라인 (Zoom)
◾ 신청 기간 : ~2025. 12.22 (월) 23:59
※ 실시간 세미나 신청해주신 분들께는 12/23 세미나에 참여 가능한 ZOOM 링크를 전달드릴 예정입니다.
※ 세미나에 참여하신 분들께 현업 꿀팁을 들을 수 있는 실시간 녹화 영상을 드립니다.
🚩 모집 대상
◾ R-1, R-Zero 등의 기술적 디테일을 파악하고 적용해보고 싶은 AI 리서쳐/엔지니어
◾ 모델 자체의 생성 능력을 활용하여 모델의 성능 개선을 원하는 데이터 사이언티스트
◾ LLM의 발전 흐름인 Reasoning Model, Self-Evolution 흐름을 따라 잡고 싶은 분
📌 12월 ‘Human Labeling의 한계를 넘어서 : R-Zero와 SPICE로 완벽하게 이해하는
LLM 자가 진화(Self-Evolution) 매커니즘 Preview
Session 1. DeepSeek R1 & R-Zero: 데이터 없이 사고하기
• Supervised Fine-Tuning(SFT) 없는 학습이 가능한가?
• GRPO 알고리즘 상세 분석 및 R1-Zero의 학습 곡선 해석
• 모델이 스스로 사고 과정(Chain of Thought)을 길게 늘리는 이유
• R-Zero가 제안하는 Challenger vs Solver 프레임워크
Session 2. Meta SPICE: 외부 지식으로 정교해지기
• Internal Knowledge의 한계를 넘는 'Corpus Grounding'
• Challenger-Reasoner의 적대적 게임(Adversarial Game) 구조
• 왜 '분산(Variance)'이 최고의 커리큘럼인가? (SPICE의 보상 함수)
⏰ 세미나 신청자 전원 대상! 2가지 혜택 제공
더 깊은 내용, 배워보고 싶다면? 연사님의 강의에 적용 가능한 20% 할인쿠폰 즉시 제공!
언제든지 다시 돌려볼 수 있도록! 세미나 풀버전 녹화본 무료 제공!
⬇️ 지금 바로 신청하기 ⬇️