AI 데이터 처리 용어 정리: "증강? 합성? 오버샘플링? 다 뭐가 다른 거야?"

·
AI · ML/Computer Vision
※ 본 썸네일은 나노바나나 AI를 통해 생성된 합성 데이터입니다."손상된 옷 이미지가 100장밖에 없는데, 어떻게 학습시키지?"들어가며의류 품질 검사 AI 프로젝트를 진행하면서 만난 현실적인 문제다.데이터 현황:- 정상 의류: 10,000장- 손상 의류: 100장- 오염 의류: 50장문제: 극심한 클래스 불균형팀 회의에서 나온 해결책들:A: "회전시키고 노이즈 주면 되지 않나요?"B: "나노바나나로 생성하면 되잖아요."C: "그냥 복사해서 늘리면 안 돼요?"다들 맞는 말인데, 정확한 용어를 몰라서 소통이 어려웠다.오늘은 AI 데이터 처리에서 가장 헷갈리는 3가지 개념을 정리한다.핵심 용어 3가지1. Data Augmentation (데이터 증강)정의:기존 데이터를 "변형"해서 다양성을 늘리는 기법핵심:❌..