[논문정리] Class-Balanced Loss Based on Effective Number of Samples
구름 운형을 분류하는 딥러닝 모델을 만들고 있는데, 수집된 데이터의 샘플 불균형이 너무 심한 탓인지 테스트 셋에 대한 결과가 좋지 않았다. 이에 대해서 업샘플링을 진행할까 해봤는데 해당 논문이 도움이 될 것 같아 읽어보기로 하였다. 정리된 것도 많고 구현된 코드도 있어서 good 논문정보 Class-Balanced Loss Based on Effective Number of Samples 논문정리 Abstract 대용량의 데이터셋이 빠르게 증가하게 되면서, long-tailed 데이터 분포 문제를 해결하는 것이 중요해졌다. long-tailed 이란? 소수의 클래스가 데이터의 대부분을 차지하고 나머지 클래스는 데이터가 부족한 경우 기존의 해결책은 re-sampling, re-weighting같은 전형적인..