8月25日消息,据Arxiv页面报道,中国科技大学和新加坡管理大学近日发布了一个图像生成模型CgT-Gan。
CgT-GAN通过将图像纳入训练过程,使模型能够“看到”真实的视觉模式。具体来说,研究团队利用对抗训练教会CgT-GAN模型模仿外部文本语料库中的短语,同时利用基于CLIP的奖励机制提供语义指导。
实验结果表明,CgT-GAN在各项指标上明显优于现有方法。

微信扫码
QQ扫码
您的IP:10.1.228.218,2025-12-19 04:39:48,Processed in 0.25728 second(s).