[[후속 논문][2021] Pros and Cons of GAN Evaluation Measures: New Developments](https://dorae222.notion.site/2021-Pros-and-Cons-of-GAN-Evaluation-Measures-New-Developments-6ab74989dd374f64a87f775c1c97ef82)
- 기존에는 단순히 얼굴을 기준으로만 평가했으며, 다양한 케이스에 대한 평가 지표를 깊이 있게 다루지 않았다.
- Quality and diversity에 대한 관점은 많지만, 차원(Generalization, fairness)부분에 대한 연구가 적다.
- Generalization 관점에서는 생성 모델을 더 깊게 이해할 수 있게 된다.
- Fairness 관점에서는 올바른 사회적 영향에 대해서 다룰 수 있으며, 모델 배포로 인해 발생하는 잠재적 위험 요소를 완화할 수 있습니다.
- Downstream Task마다 중요한 평가 요소가 다르다.
- 예를 들어, 이미지의 퀄리티가 중요한 반면 다른 상황에서는 Diversity가 확보되는 것이 중요하다.(두 관계는 Trade-off 관계입니다)
- 좋은 평가 지표란 모델의 순위를 매길 수 있는 측면도 있지만, 도메인(e.g. 의료 이미지) 별로 적절한 평가 지표가 유의미한 지이다.
- 생성 모델이 학습 데이터를 기억하는 정도는 여전히 명확하지 않습니다.
- 궁극적으로, 딥 페이크와 같은 사회적 이슈를 다루기 위한 평가 지표를 고려해야 합니다.