3. Challenges with GANs in Tabular Data Generation Task

Mode-specific Normalization

Untitled

Untitled

Untitled

  1. VGM을 사용하여 GMM의 각 분포의 모수(평균, 표준편차 / 기호로는 감마, 파이 인듯? )를 추정한다.
  2. 한 column의 하나의 값 cij가 각 mode에서 왔을 확률을 계산함. (p1, p2, p3)
  3. 주어진 확률 밀도 함수에서 sampling을 수행하고 해당 mode의 모수를 이용하여 cij를 normalization한다.

Untitled

  1. 그리고 a(정규화 값), b(어느 mode에서 sampling 되었는지에 대한 one-hot vector) 등… 을 concat하는데, b가 들어가는 이유는 추후 invers_transform을 위한 것 같긴한데,, 학습 중에 어떤 도움이 되는지는 모르겠음.

Untitled

Untitled