[카카오톡 대회] 쇼핑몰에 등록된 상품의 텍스트, 이미지 정보등을 활용해 카테고리를 분류하는 대회
대회 설명
다음쇼핑에는 수억개의 상품이 존재합니다. 사용자에게 효과적으로 상품을 노출하기 위해서는 체계적인 분류가 필요하지만, 상품을 제공하는 업체마다 기준이 다르거나 분류 정보가 없는 경우가 많기 때문에 일관된 분류 체계로 만드는 작업이 필요합니다.
이 대회는 더 정확한 상품 분류기를 만드는 것이 목표입니다. 상품은 최대 4개까지의 분류 값을 갖는데, 각 분류는 계층적인 구조입니다. 예를 들어 아이디 L3203227501 상품은 맛있는 제주차 3종세트 ...인데, 이 상품의 카테고리는 아래와 같습니다.
- 대분류: 음료/생수/커피
- 중분류: 차/티백
- 소분류: 차 선물세트
- 세분류 : 없음
대/중/소/세는 카테고리 분류 체계를 말하며 앞선 카테고리가 상위 카테고리입니다.
이 대회에서 다루게될 데이터는 아래와 같습니다.
- 약 천만건의 데이터: 제목, 브랜드, 이미지 피쳐, …
- 57개의 대분류 카테고리, 552개의 중분류 카테고리, 3190개의 소분류 카테고리, 404개의 세분류 카테고리
대회 참가자는 주어진 데이터로 분류기를 만든 후에 평가 데이터에 대해 예측한 결과를 제출하고 결과를 확인할 수 있습니다.
기초 코드
데이터 구조, 제출 포맷 확인등 원활한 참가를 돕기 위해 베이스라인 솔루션을 제공하고 있습니다. github의 코드를 참고하세요.
일정
- 시작: 2018.11.07 10:00:00
- 종료: 2019.01.07 00:00:00
- 최종 순위 공개: 2019.01.14 10:00:00
상금 수여 시점은 최종 순위 공개일 보다 늦어질 수 있습니다.
관심있는 분은 참고바랍니다