技术Blog
探索人工智能领域的最新研究成果与技术实践
研究院两项多模态生成成果入选CVPR 2026,以技术创新赋能业务差异化发展
360人工智能研究院在多模态生成方向的两项成果,被计算机视觉与模式识别国际顶会CVPR 2026接收!作为与ICCV、ECCV齐名的计算机视觉全…
为专业妆容迁移而生:FLUX-Makeup,无需人脸控制模块的高一致性妆容迁移方法
FLUX-Makeup 的核心价值在于:在不引入任何额外人脸控制模块的前提下,仅通过“源图 + 参考图”这一最自然的输入形式,实现高保真、强一致…
以多模态技术破局,让大模型从炫技走向落地 —— 360人工智能研究院年度技术总结
本文将带您走进AI研究院的2025,一起回顾研究院2025年的代表性工作。这些创新成果已成功在集团内外部多个关键业务场景中实现深度落地应用,有效…
致谢与应用反馈:FG-CLIP 2 在智能养老监护课程项目中的应用
近日,我们收到了一封来上海交通大学学生的感谢信。该学生是自动化与感知学院的大一学生,利用研究院多模态模型FG-CLIP 2在细粒度识别和多语言支…
FG-CLIP 2: 为细粒度跨模态理解而生的下一代VLM,8大类29项任务双语性能全球第一
FG-CLIP 2从训练范式、目标函数到数据生态对上一代模型进行了全面革新,从源头解决了CLIP的近视和粗粒度词袋效应,补齐了业界亟需的中文能力…
突破多模态检索壁垒,RzenEmbed重点发力企业文档智能
360人工智能研究院的多模态理解团队,基于前期在跨模态理解与多模态大模型领域的长期积累,倾力推出RzenEmbed 多模态 Embedding…
MiniCPM-o.cpp:让多模态大模型真正跑在端侧
在大模型技术快速演进的今天,越来越多的开发者希望把多模态能力(文本、语音、图像、视频)带到端侧设备上。然而,推理开销、硬件限制、实时性要求,常常…
ICCV 2025 | LMM-Det:释放大模型原生检测力,告别外挂检测器
研究者们提出了一个名为LMM-Det的简洁而高效的框架,首次证明了LMM无需任何额外的检测模块,仅通过激发和优化其自身潜力,就能胜任目标检测任务…
研究院双篇论文入选ICCV 2025,用技术创新守护生活每个角落
360 AI研究院(research.360.cn)在多模态生成和多模态理解方向的两项工作,刚刚被计算机视觉顶会ICCV 2025收录!作为与C…
揭秘FG-CLIP:细粒度+难负样本,高质量图文对齐数据集FineHARD开源发布
360人工智能研究院在最新跨模态对齐工作FG-CLIP模型开源的基础上,进一步将FG-CLIP成功背后的“达芬奇密码”:FineHARD高质量图…
告别“图文不符”!FG-CLIP实现细粒度跨模态对齐,360开源模型重塑AI视觉理解
360人工智能研究院最新图文跨模态模型FG-CLIP,宣布以“长文本深度理解”和“细粒度视觉比对”双突破,彻底解决了传统CLIP模型的“视觉近视…
360AI推出DiT架构下"省钱版"ControlNet, 参数量骤减85%性能达到SOTA!
该框架通过优化控制信号的集成方式,在Diffusion Transformer中实现了更加高效且资源优化的控制,从而有效解决了上述问题。 团队对…