360人工智能研究院 360人工智能研究院
  • 首页
    • RzenEmbed
    • FG-CLIP v2 base
  • 技术Blog
  • 关于我们
登录 免费注册
工作台

工作台

请先登录

立即登录
信息总览
API Keys 费用中心

Models

模型介绍 接口文档
模型介绍 接口文档
RzenEmbed
RzenEmbed
Active

RzenEmbed

多模态嵌入模型 RzenEmbed,突破多模态检索壁垒,重点发力企业文档智能,可为文本、图像、视频、图文混排文档等多种模态生成统一、高质量语义向量,适用于跨模态检索、多模态 RAG 与复杂文档理解场景。

模型方法

两阶段训练范式

RzenEmbed 采用“基础预训练 + 精细微调”的两阶段训练模式,通过高质量的训练数据,在通用能力与企业特定场景,如文档检索、视频分析等适配之间取得了卓越的平衡。

改进对比学习机制

通过假阴性缓解机制和基于相似度阈值的智能筛选策略,引入指数加权机制放大高相似度难样本的损失贡献,让模型精准捕捉细微差异。

可学习的“温度”参数

针对图像分类、文档检索、视频问答等 7 大类核心任务,分别设计独立的可学习温度参数,通过参数化方式为不同业务场景量身定制优化目标。

采用模型融合技术

先通过不同任务与方法训练多个专家模型,再通过模型融合技术合成一个强大的模型,仅需单次推理即可生成更具区分度的检索向量。

评测结果

在国际权威多模态嵌入基准 MMEB 评测中,RzenEmbed 凭借专为企业场景优化的技术设计,曾登顶综合总榜,并长期保持 VisDoc 企业级多模态文档检索专项 的行业顶尖水平。

其中,RzenEmbed-v2-7B 版本在核心的 VisDoc 专项上,性能超越更大参数量的 Seed-1.6-embedding 闭源模型,且大幅领先同规模开源方案。

MMEB 综合榜单结果RzenEmbed MMEB 综合榜单结果
MMEB-V2 Benchmark 结果RzenEmbed MMEB-V2 Benchmark 结果
模型特点

多语言多种模态精准检索

可理解中英文等多语言的文字、图片、视频内容,支持多语言检索。可根据用户自定义指令,精准筛选特定模态、特定类型的语料。

极致存储与算力优化

按需维度裁剪,大幅降低向量存储占用与检索算力开销。内置 int8 无损量化能力,可进一步压缩 50% 以上存储空间,且不影响检索效果。

专为企业文档智能设计

企业级知识检索,为企业打造更精准、更全面、更智能的知识服务体系,让 AI 真正成为赋能业务增长的“超级大脑”。

模型价格
计费方式
按输入 tokens 计费,输出免费
输入价格
¥4.02 / 1M tokens
输出价格
¥0 / 1M tokens
默认输出维度
2048 维
可选输出维度
256 / 512 / 768 / 1024 / 1536 / 2048
360人工智能研究院 360人工智能研究院

让AI变得简单,让智能触手可及。

360人工智能研究院致力于前沿人工智能技术研发与创新。

订阅我们,了解更多资讯 RSS Blog Feed

联系我们

  • 010-52448983

    周一至周五 09:30 - 18:30

  • 北京市朝阳区酒仙桥路6号院

    电子城 · 国际电子城总部

  • 360ai@360.cn

模型开源

  • Github
  • Hugging Face

条款与政策

  • 用户协议
  • 隐私政策

Copyright©2026 360.CN All Rights Reserved 360互联网安全中心

京公网安备 11000002002063号 京ICP证080047号[京ICP备08010314号-6]