数据:
阿里通义千问下载量达1.8亿,衍生模型总数达9万,Qwen2.5-Max超越DeepSeek-V3,18T的预训练数据量,支持29种语言。
线索:
阿里巴巴的通义千问系列成为全球最大的开源模型系列,未来的推理模型有望进一步提升性能,市场需求强劲,特别是在多语言支持上以及AI智能体的应用。因此,围绕这些技术的投资机会将大幅增加,但也需警惕可能的竞争风险和市场动态变化带来的不确定性。
正文:
在全球开发者大会(GDC)上,阿里巴巴通义实验室的黄斐科学家宣布,通义千问(Qwen)系列已成为全球最大的开源模型系列,目前下载量达到1.8亿,累计衍生模型数量已超过9万个,超越了Meta的Llama系列,标志着进入了“千问时代”。
今年1月底,阿里发布了AI基础大模型Qwen2.5-Max,此模型在权威评测中表现领先。黄斐提到,尽管Qwen2.5-Max的性能已超越DeepSeek-V3,但仍未超越专注推理的DeepSeek-R1。阿里将基于Qwen2.5-Max继续开发推理模型,预计很快上线。
Qwen2.5系列共包含7个不同规模的Dense模型,遵循传统Transformer架构,规模从0.5B到72B不等,以适应不同场景的需求。预训练数据规模显著增长,从Qwen1.5时代的3T扩展至Qwen2.5的18T。Qwen2.5还推出了3个基于MoE架构的API模型,包括Turbo、Plus和Max,以减少训练成本。
黄斐还强调,其千问系列支持29种语言,包括中文、英文、日语及韩语等,且在东南亚使用频繁,具有优于其他模型的多语言支持。对于未来发展,黄斐提到,“推理模型”和“更智慧的模型”是重点,强调未来发布的推理模型将会有更好的表现。他提及“全能模型”会实现更自由的输入输出,结合多模态。
此外,AI Agent也是未来需重点关注的领域,能够协助解决复杂任务,并预示着广泛应用的潜力。魔搭社区自2022年创建以来,模型总数已超4.5万个,服务超过1100万开发者。
在GDC大会上,阿里云首次推出Step-Video-T2V和Step-Audio两款新模型,其中Step-Video-T2V为全球参数量最大的开源视频生成模型,而Step-Audio则是行业首款产品级开源语音模型,可供体验和下载。
阿里巴巴集团公布新季度财务业绩,营收2801.5亿元,同比增长8%。阿里云的季度营收为317.42亿元,同比增长13%。阿里巴巴CEO吴泳铭指出,未来将继续专注于电商业务、AI+云计算科技以及互联网平台,预计在未来三年,AI基础设施的投入将超过过去十年的总和。
发布时间:
2025-02-21 22:43:07
评论 ( 0 )