研究院两项多模态生成成果入选CVPR 2026,以技术创新赋能业务差异化发展

360 AI Research
2026-04-07 67 阅读
研究院两项多模态生成成果入选CVPR 2026,以技术创新赋能业务差异化发展

做为360集团在AI领域的核心研发团队,360人工智能研究院在多模态生成方向的两项成果,被计算机视觉与模式识别国际顶会CVPR 2026接收!作为与ICCV、ECCV齐名的计算机视觉全球顶尖学术会议,CVPR今年收到16092篇投稿,最终接收4090篇,录用率仅25%,竞争一如既往地激烈。

当前 AI 行业发展进入深水区,图像 / 视频生成赛道产品同质化问题日益凸显,通用化生成能力已难以匹配产业场景对精细化、定制化、高效化的核心需求。360 人工智能研究院始终锚定 “立足集团关键业务场景,通过前沿多模态 AI 研发,赋能业务 AI 差异化优势” 为核心定位,深耕图像与视频的可控生成、可控编辑技术领域,持续攻坚核心技术难题,为集团AI创新业务打造独家技术护城河,输出差异化核心 AI 能力。

RefTON:首创上身参考图引导的虚拟试穿框架,实现零辅助输入的高保真服装还原

RefTON 人像虚拟试衣框架,破解传统虚拟试衣技术的行业痛点。以往的虚拟试衣技术,不仅需要依赖人体姿态识别、图像分割等外部模型,算法流程长且易引入外部错误,还常出现面料质感失真、蕾丝花纹、透明材质等细节还原不到位的问题。RefTON 开创性地引入服装上身参考图作为视觉指引,通过创新双阶段训练策略与多条件输入适配优化,摆脱了对复杂辅助输入的依赖,仅需人物原图与目标服装图,就能实现高保真的虚拟试穿生成,精准还原服装的材质纹理、精细设计,同时兼容掩码与无掩码两种试穿模式,在国际公开基准测试中斩获领先性能,为电商零售等相关业务场景,打造了更贴合实际需求的虚拟试衣技术方案。

NAMI:创新桥接渐进式Rectified Flow架构,实现高分辨率图像生成效果与效率的双向突破

NAMI 高效图像生成架构,则直击高分辨率 AI 图像生成 “效果好则速度慢、速度快则效果打折扣” 的行业痛点。当前主流的图像生成模型,往往因参数量庞大,存在推理延迟高、算力消耗大、难以在端侧部署的问题。360人工智能研究院研发的 NAMI 架构,创新提出桥接渐进式Rectified Flow设计,将图像生成过程按分辨率分阶段拆解,通过自研 BridgeFlow 模块实现跨阶段流的精准对齐,让模型在低分辨率阶段快速搭建图像轮廓,高分辨率阶段精细化打磨细节。在保证生成画质、文本语义对齐能力比肩国际顶尖模型的前提下,将 1024×1024 高分辨率图像的推理时间大幅降低 64%。这一技术大幅降低了高保真图像生成的算力与部署门槛,为集团移动端、端侧 AI 创新业务,提供轻量化、高性能的核心生成能力支撑。

360 人工智能研究院将继续深耕多模态理解与生成领域的前沿技术研究,以产业实际业务需求为导向,推动更多前沿技术成果落地转化,用硬核技术创新打破行业产品同质化困局,持续为集团业务发展注入核心 AI 动能,同时不断提升在全球 AI 学术领域的行业影响力,助力中国 AI 技术走向世界前沿。

上述两项工作均已开源,详情请参考研究院GitHub主页:

https://github.com/360CVGroup