[Paper] Tstars-Tryon 1.0:鲁棒且真实的 Virtual Try-On 用于多样化时尚单品
发布: (2026年4月22日 GMT+8 01:59)
8 分钟阅读
原文: arXiv
抱歉,我需要您提供要翻译的具体文本内容。请把需要翻译的段落或全文粘贴在这里,我会按照要求保留源链接并进行简体中文翻译。
概述
本文介绍了 Tstars‑Tryon 1.0,一种商业级虚拟试穿系统,能够在各种时尚单品——从衬衫、连衣裙到配饰——上实现逼真的穿着效果,即使在极端姿势、强光或运动模糊等具有挑战性的真实环境下也能表现出色。通过将精心设计的模型流水线与庞大的数据引擎相结合,作者实现了接近实时的性能,已在淘宝 App 上为数百万用户提供服务。
关键贡献
- 在“真实环境”场景下的鲁棒性 – 在极端姿势、低光、运动模糊和遮挡输入上具有高成功率。
- 逼真的输出 – 细粒度的纹理、材质和结构保真度,同时抑制典型的 AI 人工痕迹(例如,模糊接缝、重影)。
- 多类别、多图像组合 – 支持最多 6 张参考图像和 8 种时尚类别,可控制人物身份和背景。
- 速度优化的推理 – 设计实现近实时运行(单 GPU 约 30 fps),适用于大规模消费级应用。
- 端到端系统设计 – 统一的架构、可扩展的数据管线以及多阶段训练方案,共同实现商业部署。
- 公开基准与数据集 – 作者发布了全面的基准,以推动真实感虚拟试穿的进一步研究。
方法论
-
数据引擎与预处理
- 收集了超过 10 M 件服装‑人物配对,来源于电子商务平台。
- 自动化清洗、姿态归一化和光照平衡,以确保训练样本既多样又高质量。
-
模型架构
- 粗略阶段:条件扩散模型预测服装在目标身体上的粗略布局,处理姿态扭曲和遮挡。
- 细化阶段:高分辨率 GAN(具备空间感知注意力)注入纹理细节、材质线索(如丝绸光泽、牛仔织纹),并纠正边缘伪影。
- 控制模块:轻量级编码器允许用户指定身份(面部、体型)和背景,实现无缝的多图像合成。
-
训练范式
- 阶段 1:使用合成叠加进行自监督姿态引导的扭曲。
- 阶段 2:在清洗后的数据集上进行配对对抗训练,以学习真实的纹理迁移。
- 阶段 3:通过强化式损失进行微调,该损失惩罚由预训练感知质量网络检测到的视觉伪影。
-
推理优化
- 模型剪枝和量化降低内存占用。
- 基于 TensorRT 的内核融合和异步管线调度将延迟降低至 V100 GPU 上每次请求 < 30 ms。
结果与发现
| 指标 | Tstars‑Tryon 1.0 | 先前 SOTA(如 VITON‑HD) |
|---|---|---|
| 成功率(有效试穿) | 96.8 % | 84.3 % |
| FID(图像质量) | 12.4 | 21.7 |
| LPIPS(感知相似度) | 0.098 | 0.167 |
| 推理延迟(GPU) | ≈30 ms | 180 ms |
| 支持的类别 | 8(服装 + 配饰) | 3–4 |
- 鲁棒性:系统在极端姿态测试集(如深蹲、侧视)以及低光图像上保持 > 95 % 的成功率,而先前方法在这些情况下会出现灾难性失败。
- 真实感:人工评估者在 82 % 的情况下更偏好 Tstars‑Tryon 的输出,理由是自然的垂坠感和准确的材质光泽。
- 可扩展性:在淘宝平台部署后,服务每日处理 > 10 M 次请求,错误率 < 0.5 %,验证了工程优化能够转化为生产稳定性。
实际意义
- 电子商务集成:零售商可以嵌入一个“在我身上查看”按钮,实时在购物者上传的照片上展示任意服装,从而降低退货率并提升转化率。
- 个性化造型应用:开发者可以构建虚拟衣橱,实现跨品类(例如鞋子 + 包袋)的混搭,同时保留用户的面部和背景,提供更丰富的 AR 体验。
- 内容创作:营销团队只需将产品目录图片输入模型,即可生成高质量的 Look‑book 图像,无需昂贵的拍摄。
- 边缘部署:低延迟推理流水线使得在强大的边缘设备(例如现代智能手机)上运行模型成为可能,实现离线试穿,保护用户隐私。
限制与未来工作
- Extreme Occlusions:虽然系统鲁棒,但在大块身体部位完全被遮挡时仍会出现困难(例如,一个人手持大型物体)。
- Fine‑Material Physics:动态织物(例如飘动的围巾)采用近似而非物理模拟,这限制了高度动画化服装的真实感。
- Cross‑Domain Generalization:当输入服装的风格或光照条件在训练数据中未出现时(例如水下摄影),性能会下降。
- Future Directions:作者计划集成基于物理的布料模拟以获得更好的垂感,扩展数据集以覆盖更多特殊光照条件,并探索在设备端进行模型蒸馏以进一步降低延迟。
作者
- Mengting Chen
- Zhengrui Chen
- Yongchao Du
- Zuan Gao
- Taihang Hu
- Jinsong Lan
- Chao Lin
- Yefeng Shen
- Xingjian Wang
- Zhao Wang
- Zhengtao Wu
- Xiaoli Xu
- Zhengze Xu
- Hao Yan
- Mingzhou Zhang
- Jun Zheng
- Qinye Zhou
- Xiaoyong Zhu
- Bo Zheng
论文信息
- arXiv ID: 2604.19748v1
- 分类: cs.CV
- 发表时间: 2026年4月21日
- PDF: 下载 PDF