AI·7개월·376

Gemini 3 Pro 모델 카드 유출 및 정보.pdf

모델 개요
- Gemini 3 Pro는 Gemini 시리즈의 차세대 멀티모달 추론 모델로, 현재 Google의 가장 고급 Pro 모델.
- 텍스트·이미지·오디오·비디오·코드 저장소 등 다양한 소스를 이해하며, 복잡한 추론과 대규모 데이터 처리에 특화.
- 입력 컨텍스트는 최대 100만 토큰, 출력은 최대 64K 토큰 지원.
- Sparse Mixture-of-Experts(MoE) 기반 트랜스포머 구조로, 일부 전문가만 활성화해 성능과 비용을 분리.

학습 데이터
- 공개 웹 문서, 코드, 이미지, 오디오, 비디오 등 대규모·다양한 데이터 사용.
- 크롤링 데이터, 라이선스 데이터, Google 서비스 사용자 데이터(약관·프라이버시 정책·사용자 설정에 따라), 사내 생성 데이터, 합성 데이터 포함.
- 중복 제거, robots.txt 준수, 안전 필터링, 품질 필터링 등을 통해 유해·저품질 데이터를 걸러내는 전처리 수행.
학습 및 인프라
- Google TPU 및 TPU Pod를 활용해 대규모 분산 학습 수행.
- 고대역폭 메모리와 대규모 클러스터로 대형 모델·배치 처리에 최적화.
- 소프트웨어 스택은 JAX와 Pathways 기반.
배포 채널
- Gemini App, Google Cloud Vertex AI, Google AI Studio, Gemini API, Google AI Mode, Google Antigravity 등 다양한 채널로 제공.
- 주로 API 형태로 제공되며, 각 플랫폼별 추가 약관과 사용 정책이 적용됨.
성능 평가
- 추론, 멀티모달, 에이전트형 툴 사용, 다국어, 롱컨텍스트 등 다양한 벤치마크로 평가.
- 전반적으로 Gemini 2.5 Pro 대비 추론·멀티모달 성능이 유의미하게 향상.
- 상세 점수·벤치마크는 별도 평가 페이지에서 제공.
  - https://deepmind.google/models/evals/gemini-3-pro/ (25-11-18 20:57 기준 닫혀있음)
의도된 활용과 한계
- 복잡한 현실 문제 해결, 고급 코딩, 장문 컨텍스트 처리, 멀티모달 이해, 알고리즘 개발 및 에이전트형 사용 사례에 적합.
- 여전히 환각(hallucination), 속도 저하, 타임아웃 등의 일반적인 한계 존재.
- 지식 컷오프는 2025년 1월.
- Google의 Generative AI 금지 사용 정책에 따라, 불법·위험·폭력·성적·혐오·허위정보 등의 용도로 사용 금지.
윤리·콘텐츠 안전
- 개발 과정에서 안전·보안·책임팀과 협업, Google AI 원칙 및 Gen AI 정책을 준수.
- 자동·수동 평가, 휴먼/자동 레드팀, 윤리·안전 리뷰 등 다단계 평가 수행.
- 텍스트·이미지·다국어 안전 평가에서 Gemini 2.5 Pro 대비 전반적인 안전성과 톤이 개선되면서도, 불필요한 거부 비율은 낮게 유지.
- 데이터 필터링, 조건부 프리트레이닝, SFT, RLHF·크리틱 피드백, 정책·필터링 등 다양한 완화(mitigation) 기법 적용.
주요 위험과 완화
- 여전히 남아 있는 위험
  - 탈옥(jailbreak) 취약성
  - 다중 턴 대화에서의 성능 저하 가능성.
- 위험 완화를 위해 모델 전·후처리, 정책, 제품 레벨 필터 등 다층 방어 구조 운용.
프론티어 안전(Frontier Safety)
- Google DeepMind의 Frontier Safety Framework(2025년 버전)에 따라 CBRN, 사이버 보안, 조작, ML R&D 가속, 오용 가능성 등을 평가.
- CBRN, 사이버 공격, 해로운 조작, 고도 자동화 등 어떤 영역에서도 ‘중요 능력 수준(Critical Capability Level)’에는 도달하지 않은 것으로 판단.
- 일부 영역에서 기존 모델 대비 향상은 있으나, 위협 행위자의 능력을 비약적으로 끌어올릴 정도의 수준에는 미달.

https://archive.org/details/gemini-3-pro-model-card

AI 목록