ReadCai财经资讯
当前位置:首页 » 13. 科技 » 人工智能

华为上线DeepSeek系列模型提升AI性能

2025-02-06

数据:

华为DeepSeek系列模型DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上线昇腾社区,支持一键获取,支持昇腾硬件平台即插即用。DeepSeek-V3在多项评测中超越Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上与顶尖闭源模型相当。

线索:

华为的新模型上线可能带来新的投资机会,尤其是在AI硬件和软件市场。随着AI技术的快速发展,企业可能会更倾向于采用华为的解决方案,从而促进其硬件销售。此外,DeepSeek V3的高性能意味着可能会吸引更多开发者与公司选择其技术,增强华为在市场中的地位。然而,市场竞争激烈,若无法维持技术领先,可能会面临技术滞后的风险。

正文:

华为于2025年2月5日宣布,DeepSeek系列模型正式上线昇腾社区,具体包括DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro。用户现在可以通过昇腾社区一键获取这些模型,且支持在昇腾硬件平台上即插即用。DeepSeek-V3的首个版本于2024年发布,并完成开源工作,其自研MoE模型具有671B参数和激活37B,在14.8T token上进行了预训练。

DeepSeek所提供的信息显示,DeepSeek-V3在多个性能评测中超越了开源模型Qwen2.5-72B和Llama-3.1-405B,且与封闭模型如GPT-4o和Claude-3.5-Sonnet的表现不相上下。以DeepSeek-V3为例,用户可在昇腾社区有效获取和使用该模型。

进行DeepSeek-V3模型的部署时,用户需具备4台Atlas 800I A2(864G)服务器资源。使用模型时,要经过以下步骤:

1. 权重转换,包括GPU和NPU的不同操作。

2. 加载适配DeepSeek-V3的镜像包,确认镜像名称与标签。

3. 启动容器,准备所需的模型推理脚本,并确保相应的权限设置。

4. 配置服务化环境变量,并启动服务,确保服务成功运行。

发布时间:*

2025-02-05 17:22:00

相关推荐

评论 ( 0 )

3.7 W

文章

73.0 W

点赞

回顶部