ReadCai财经资讯
当前位置:首页 » 13. 科技 » 人工智能

阿里巴巴Qwen2.5-Max大语言模型全球排名第7

2025-02-06

数据:

阿里最新大语言模型Qwen2.5-Max排名第7,在数学和编程方面排名第一,处理复杂任务的硬提示(hard prompts)方面排名第二。模型使用了超过20万亿个token的预训练数据,并且采用先进的专家混合(MoE)模型架构。

线索:

阿里Qwen2.5-Max在全球AI模型评测中表现优异,超越了如DeepSeek V3等顶级模型,显示出中国在AI领域追赶国际顶级企业的潜力。市场对该模型的关注及其性能的预期可能为相关企业带来投资机会,但同时也可能引发技术竞争风险,尤其是在AI领域的迅速进步和变化中。

正文:

阿里巴巴最近发布了其最新的大语言模型Qwen2.5-Max,该模型在全球大模型榜单中排名第7,超越了多款顶级专有大语言模型,如DeepSeek V3、O1-Mini和Claude-3.5-Sonnet。在技术细分方面,Qwen2.5-Max在数学和编程领域位列第一,而在处理复杂任务的硬提示(hard prompts)上排名第二。

Qwen2.5-Max是在2025年1月29日发布的,发布后迅速在多个基准测试中显现出优异的性能。该模型采用了先进的专家混合(MoE)架构,预训练数据量超过20万亿个token,并结合监督微调(SFT)和人类反馈强化学习(RLHF)技术进行优化,表现出色。

与此同时,阿里不断扩展Qwen模型家族,推出涵盖文本、音频和视觉格式的多种规模模型,以满足全球日益增长的AI需求。全球开发者和企业可以通过阿里云的生成式AI开发平台Model Studio访问这一新模型。

有分析认为,由于之前对DeepSeek的过度关注,很多人忽视了包括阿里在内的中国AI整体性追赶。其中有观点认为,如果Qwen2.5-Max的性能确实超越DeepSeek V3,那么对此模型的推理能力可以寄予更大期待。Qwen2.5-Max发布后受到多方关注,有用户将其视为“中文版的ChatGPT”,并且认为其水平高于后者。

关于其视频生成功能,Qwen2.5-Max也获得了不错的评价,甚至超过了OpenAI的Sora。用户普遍感受到该模型的强大,有人表示,Qwen2.5-Max已经压制了ChatGPT和DeepSeek,另一些用户则通过梗图表达对其未来潜力的期待。

发布时间:

2025-02-05 14:23:41

相关推荐

评论 ( 0 )

3.5 W

文章

70.3 W

点赞

回顶部