페트병 하나 못 집는 제조 AI를 보며 배운 것
사람 눈에는 그냥 찌그러진 페트병인데, AI에게는 처음 보는 물체일 수 있습니다. 제조 AI 사례를 분석하면서 성능 병목이 모델보다 데이터 품질에서 시작되는 경우가 많다는 걸 다시 느꼈습니다.
투명 PET병 위에 투명 비닐이 겹치면 AI가 하나의 물체처럼 보거나 배경으로 인식하기도 합니다. 금속 캔은 반사광 때문에 경계를 놓치고, 찌그러진 페트병은 처음 보는 물체처럼 판단할 수 있고요.
데이터 양도 함정이었습니다. 산업 폐기물 이미지 100만 장을 분석해보니, 가장 많은 클래스는 79,560장인데 가장 적은 클래스는 단 20장뿐이었습니다. 전체 데이터 수보다 클래스별 균형이 중요하다는 걸 다시 느꼈습니다.
그래서 제조 AI에서는 합성데이터의 역할이 중요합니다. 현실에서 모으기 어려운 희귀 케이스를 의도적으로 만들고, 투명도·오염·변형·반사광 같은 변수를 조절해 부족한 데이터를 채울 수 있기 때문입니다.
이 점들을 바탕으로 실제 재활용 AI 사례와 제조 AI 데이터 품질 문제를 분석한 과정을 정리해보았습니다. 제조 AI, 피지컬 AI 쪽 데이터 때문에 고민 중이신 분들께 도움이 되길 바랍니다.
