FG-CLIP系列模型荣获中国图像图形学学会2026创新技术榜银牌
近日,中国图像图形学学会(CSIG)隆重发布了“2026图像图形领域系列榜单”,聚焦图像图形领域关键技术突破与产业应用价值,通过专家评审与公开公示等流程,遴选具有代表性的年度创新成果。凭借在视觉-语言跨模态理解领域的持续技术探索与扎实的工业级应用表现,360人工智能研究院的 FG-CLIP 系列模型荣获“2026图像图形创新技术榜”银牌。这一奖项是对360人工智能研究院在视觉-语言跨模态人工智能底层技术积淀的客观印证和业界肯定。

核心差异优势:聚焦细粒度跨模态理解
多模态表征学习的核心挑战之一,在于如何实现视觉与语言之间精准、细致的语义对齐。FG-CLIP系列模型的研发正是围绕这一技术痛点展开。在前置工作的积累之上,新一代 FG-CLIP 2 专为细粒度跨模态理解而生。通过重构模型架构与多模态对齐机制,该系列模型系统性地缓解了传统视觉-语言大模型在面对复杂场景时,易出现的局部特征丢失和语义粒度不匹配等问题。
工业级标准:性能最优的中文视觉-语言跨模态模型
作为目前综合性能最好的中文视觉-语言跨模态模型(VLM),FG-CLIP 2 在涵盖8大类、29项具体任务的广泛多模态评测体系中,取得了中英双语任务下的全球领先性能。
团队更在模型推理优化、并发吞吐效能方面进行了大量工程优化,使之能够经受住实际商业产品的的规模化调用考验,目前FG-CLIP 2系列模型已在360集团的互联网、数智化、IoT等众多产品中得到大规模应用和验证。
应用实践:SaaS产品体验开放
FG-CLIP 系列的演进体现了研究院团队长期持续的技术投入。从早期最大的中文图文开源数据Zero,到 FG-CLIP 2 面向双语、多任务与产业场景的系统模型升级,团队逐步建立起覆盖研究创新、数据体系、训练方法与应用落地的完整技术路径。
FG-CLIP 2 已开放在线SaaS接入,支持开发者与企业用户直接体验模型能力,应用且不限于:图文理解与推荐、跨模态检索、多模态RAG、办公细粒度语义匹配等场景。
👉 产品体验地址: https://research.360.cn/products/fg-clip
未来,FG-CLIP 系列将继续围绕高精度跨模态理解与产业应用需求持续迭代,为智能搜索、内容理解、人机交互与多模态 Agent感知提供更加可靠的基础能力。