使用 KL 散度、JS 散度、Wasserstein 距离等指标评估 GAN 生成数据与真实数据分布差异。
指标说明:KL散度/JS散度/Wasserstein距离 设置阈值,超出阈值则触发告警
统计 GAN 生成数据的统计特征(均值、方差、分布等),并与真实数据进行对比。
特征 | GAN 生成数据 | 真实数据 |
---|---|---|
均值 | 0.52 | 0.48 |
方差 | 0.08 | 0.07 |
分布 | 正态分布 | 均匀分布 |
评估感知模型对 GAN 生成数据的置信度。
指标说明:感知模型对GAN生成数据的平均置信度 (指标承接提质-降低事故率)。
使用机器学习模型预测数据的真实性、多样性和相关性。
邀请领域专家对生成数据的质量进行评估,包括真实性、多样性、相关性等。
指标说明:领域专家对生成数据的平均评分(指标承接创新-降低人工成本)
GAN 生成数据质量差,可能导致模型过拟合生成数据,反而降低鲁棒性。风险管控:调整 GAN 结构、损失函数、训练方式,优化数据质量监控流程。
评估指标无法准确反映数据质量,导致误判。风险管控:定期审查评估指标,并根据实际情况进行调整。