致谢与应用反馈:FG-CLIP 2 在智能养老监护课程项目中的应用

360 AI Research
2025-12-10 135 阅读
致谢与应用反馈:FG-CLIP 2 在智能养老监护课程项目中的应用

近日,我们收到了一封来上海交通大学学生的感谢信。该学生是自动化与感知学院的大一学生,利用研究院多模态模型FG-CLIP 2在细粒度识别和多语言支持方面的强大能力,开发了一套“基于VLM的支持语义客制化的智能养老摄像头”系统。特此来信对我们的开源工作表示感谢!


 
FG-CLIP 2是为细粒度跨模态理解而生的下一代VLM,这项工作通过新的细粒度对齐范式,让模型不仅能识别图像中的主体,还能更准确地理解其中的属性、关系与语义,为 AI 的视觉语言理解能力迈向“更清晰、更精准”开启了新的阶段。FG-CLIP 2在中英文双语任务上全面超越 Google的SigLIP 2与Meta的MetaCLIP 2,在8大类29项任务的双语性能位列全球第一

FG-CLIP 论文地址:https://arxiv.org/abs/2505.05071
FG-CLIP 2 论文地址:https://arxiv.org/pdf/2510.10921
FG-CLIP 2 模型、代码及数据集地址:https://360cvgroup.github.io/FG-CLIP
FG-CLIP 2 API访问地址:https://research.360.cn/sass/fg-clip/fg-clipDocument