FG-CLIP系列模型荣获中国图像图形学学会2026创新技术榜银牌

360 AI Research 2026-06-02 43 阅读

近日，中国图像图形学学会（CSIG）隆重发布了“2026图像图形领域系列榜单”，聚焦图像图形领域关键技术突破与产业应用价值，通过专家评审与公开公示等流程，遴选具有代表性的年度创新成果。凭借在视觉-语言跨模态理解领域的持续技术探索与扎实的工业级应用表现，360人工智能研究院的 FG-CLIP 系列模型荣获“2026图像图形创新技术榜”银牌。这一奖项是对360人工智能研究院在视觉-语言跨模态人工智能底层技术积淀的客观印证和业界肯定。

核心差异优势：聚焦细粒度跨模态理解

多模态表征学习的核心挑战之一，在于如何实现视觉与语言之间精准、细致的语义对齐。FG-CLIP系列模型的研发正是围绕这一技术痛点展开。在前置工作的积累之上，新一代 FG-CLIP 2 专为细粒度跨模态理解而生。通过重构模型架构与多模态对齐机制，该系列模型系统性地缓解了传统视觉-语言大模型在面对复杂场景时，易出现的局部特征丢失和语义粒度不匹配等问题。

工业级标准：性能最优的中文视觉-语言跨模态模型

作为目前综合性能最好的中文视觉-语言跨模态模型（VLM），FG-CLIP 2 在涵盖8大类、29项具体任务的广泛多模态评测体系中，取得了中英双语任务下的全球领先性能。

团队更在模型推理优化、并发吞吐效能方面进行了大量工程优化，使之能够经受住实际商业产品的的规模化调用考验，目前FG-CLIP 2系列模型已在360集团的互联网、数智化、IoT等众多产品中得到大规模应用和验证。

应用实践：SaaS产品体验开放

FG-CLIP 系列的演进体现了研究院团队长期持续的技术投入。从早期最大的中文图文开源数据Zero，到 FG-CLIP 2 面向双语、多任务与产业场景的系统模型升级，团队逐步建立起覆盖研究创新、数据体系、训练方法与应用落地的完整技术路径。

FG-CLIP 2 已开放在线SaaS接入，支持开发者与企业用户直接体验模型能力，应用且不限于：图文理解与推荐、跨模态检索、多模态RAG、办公细粒度语义匹配等场景。

👉 产品体验地址： https://research.360.cn/products/fg-clip

未来，FG-CLIP 系列将继续围绕高精度跨模态理解与产业应用需求持续迭代，为智能搜索、内容理解、人机交互与多模态 Agent感知提供更加可靠的基础能力。

返回博客列表