[[후속 논문][2021] Pros and Cons of GAN Evaluation Measures: New Developments](https://dorae222.notion.site/2021-Pros-and-Cons-of-GAN-Evaluation-Measures-New-Developments-6ab74989dd374f64a87f775c1c97ef82)

  1. 기존에는 단순히 얼굴을 기준으로만 평가했으며, 다양한 케이스에 대한 평가 지표를 깊이 있게 다루지 않았다.
  2. Quality and diversity에 대한 관점은 많지만, 차원(Generalization, fairness)부분에 대한 연구가 적다.
    1. Generalization 관점에서는 생성 모델을 더 깊게 이해할 수 있게 된다.
    2. Fairness 관점에서는 올바른 사회적 영향에 대해서 다룰 수 있으며, 모델 배포로 인해 발생하는 잠재적 위험 요소를 완화할 수 있습니다.
  3. Downstream Task마다 중요한 평가 요소가 다르다.
    1. 예를 들어, 이미지의 퀄리티가 중요한 반면 다른 상황에서는 Diversity가 확보되는 것이 중요하다.(두 관계는 Trade-off 관계입니다)
  4. 좋은 평가 지표란 모델의 순위를 매길 수 있는 측면도 있지만, 도메인(e.g. 의료 이미지) 별로 적절한 평가 지표가 유의미한 지이다.
  5. 생성 모델이 학습 데이터를 기억하는 정도는 여전히 명확하지 않습니다.
  6. 궁극적으로, 딥 페이크와 같은 사회적 이슈를 다루기 위한 평가 지표를 고려해야 합니다.