ReadCai财经资讯
当前位置:首页 » 13. 科技 » 人工智能

阿里开源千问3向量模型性能提升40%

2025-06-09

数据:

阿里开源的Qwen3-Embedding向量模型系列(千问3向量模型)专门优化了文本表征、检索和排序,性能相比上一版本提升40%。该模型超越谷歌和OpenAI的同类产品,支持超100种语言和多种编程语言。

线索:

此次阿里开源千问3向量模型带来了显著的技术进步,可能会对相关的AI和数据处理行业带来投资机会,尤其是在文本检索、聚类及分类等领域。与此同时,随着这些模型的开源,可能会增加市场竞争,加速相关技术的普及和应用。此外,跨语言和代码检索能力的加强,可能会推动全球化业务和多语言产品的开发。

正文:

阿里公司于2025年6月6日正式开源了全新的Qwen3-Embedding向量模型系列,简称千问3向量模型。该模型基于千问3,特别为文本表征、检索和排序等核心任务进行了优化训练,性能较前一版本提升了最高40%。在多个专项榜单中,Qwen3-Embedding-8B超越了谷歌的Gemini嵌入模型、OpenAI的text-embedding-3-large,以及微软的multilingual-e5-large-instruct等顶尖模型,达到了同类模型的最佳性能。

向量模型可看作是AI的“翻译器”,它将非结构化的信息如文本和图片映射到更易于机器理解的向量空间,从而实现高效的信息分类、检索或排序。通义团队采用对比训练、SFT以及模型融合等方法,开发出了全新的千问3向量模型。这一系列模型包含了Qwen3-Embedding文本嵌入模型和Qwen3-Reranker文本排序模型。

千问3向量模型系列具备强大的多语言支持,能够处理超过100种语言及多种编程语言,实现了出色的多语言和跨语言检索能力。目前,这次开源的千问3向量模型包括9款不同尺寸的模型,从0.6B到8B不等,以及GGUF版本。开发者可以选择最符合需求的模型,自由组合模块,并可自定义向量和指令,以实现深度优化。千问3 Embedding和Reranker模型已在魔搭社区、Hugging Face和GitHub等平台上开源,开发者还可通过阿里云百炼使用API服务。自4月29日开源以来,千问3大模型已在多个榜单上获得全球开源冠军。

发布时间:

2025-06-06 14:22:07

相关推荐

评论 ( 0 )

2.9 W

文章

40.7 W

点赞

回顶部