研究院双篇论文入选ICCV 2025,用技术创新守护生活每个角落
做为360集团在AI领域的核心研发团队,360 AI研究院(research.360.cn)在多模态生成和多模态理解方向的两项工作,刚刚被计算机视觉顶会ICCV 2025收录!作为与CVPR、ECCV齐名的全球三大视觉顶会,ICCV今年收到11239篇投稿,最终收录2698篇,录用率仅24%,竞争异常激烈。
这两篇论文,藏着让AI更懂生活的秘密——
PlanGen:给AI装上"空间规划脑"
它是行业首个能同时规划物体布局并生成图像的统一模型。简单说,以前AI画场景像"闭着眼瞎画",现在会先想清楚"沙发放左边、茶几在中间",再落笔生成画面。这种"先规划后创作"的能力,让图像生成更精准,比如想生成"儿童房里玩具车在地毯上、绘本放书架"的场景,AI能严格按空间逻辑呈现,误差率比传统方法降低40%。

LMM-Det:让AI练就"火眼金睛"
这是首个不用额外插件就能精准定位照片中目标的多模态大模型。多模态大模型包括GPT-4o在内擅长图片内容的描述,但在目标的精确定位上一直远远落后于专业小模型。LMM-Det在保持多模态大模型图片描述能力的同时,将目前检测准确率提升至专业模型的水平,能够同时锁定"画面里的钥匙、远处的飞鸟、角落里的充电器",且识别速度比传统方案快2倍。

坚定AI战略,加速技术落地
360集团始终将AI作为核心战略方向,持续加大研发投入,360的各项产品也正在大量融入AI技术的赋能。360 纳米 AI 搜索可跨平台搜索,能自动规划任务,输出多种格式报告。360 智能摄像头和智能门铃可识别访客身份与行为,推送警报。儿童手表接入 360 VL和智脑大模型,有 AI 语音助手、拍照学英文等功能,覆盖多种生活学习场景。