다양한 타입들.(이산형, datetime, 연속형 등)
Non-Gaussian 분포
이미지 데이터에서 pixel 값은 대부분 가우시안 분포를 따르기 때문에 min-max normalization 수행해서, 학습에 안정성을 더할 수 있다.
하지만, tabluar data의 연속형 변수는 대부분 Non-Gaussian 분포이기 때문에 min-max normalization의 적용은 vanishing gradient problem으로 이어짐.
→ Mode-specific Normalization
Multimodal distributions
연구진들이 8개의 real-world dataset의 연속형 변수들을 대상으로 mode의 갯수를 추정한 결과, 123개 중 57개가 multi-mode를 가지고 있음.
또한 한 연구에서는 gan이 이러한 multi-mode를 모델링할 수 없다고 지적함.
그러므로 이 연구에서는 연속형 변수의 multi modal을 해결하고자 노력함.
→ Mode-specific Normalization
Learning from sparse one-hot-encoded vectors
Highly imbalanced categorical columns
데이터 불균형은 mode collapse를 야기함.
또한 minor classes에 대해 충분한 학습 기회를 제공하지 못하기 때문에, 그냥 생성이 안될 가능성이 큼.
→ conditional generator and training-by-sampling





