华为上线DeepSeek系列模型提升AI性能

2025-02-06

数据：

华为DeepSeek系列模型DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上线昇腾社区，支持一键获取，支持昇腾硬件平台即插即用。DeepSeek-V3在多项评测中超越Qwen2.5-72B和Llama-3.1-405B等其他开源模型，并在性能上与顶尖闭源模型相当。

线索：

华为的新模型上线可能带来新的投资机会，尤其是在AI硬件和软件市场。随着AI技术的快速发展，企业可能会更倾向于采用华为的解决方案，从而促进其硬件销售。此外，DeepSeek V3的高性能意味着可能会吸引更多开发者与公司选择其技术，增强华为在市场中的地位。然而，市场竞争激烈，若无法维持技术领先，可能会面临技术滞后的风险。

正文：

华为于2025年2月5日宣布，DeepSeek系列模型正式上线昇腾社区，具体包括DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro。用户现在可以通过昇腾社区一键获取这些模型，且支持在昇腾硬件平台上即插即用。DeepSeek-V3的首个版本于2024年发布，并完成开源工作，其自研MoE模型具有671B参数和激活37B，在14.8T token上进行了预训练。

DeepSeek所提供的信息显示，DeepSeek-V3在多个性能评测中超越了开源模型Qwen2.5-72B和Llama-3.1-405B，且与封闭模型如GPT-4o和Claude-3.5-Sonnet的表现不相上下。以DeepSeek-V3为例，用户可在昇腾社区有效获取和使用该模型。

进行DeepSeek-V3模型的部署时，用户需具备4台Atlas 800I A2（864G）服务器资源。使用模型时，要经过以下步骤：

1. 权重转换，包括GPU和NPU的不同操作。

2. 加载适配DeepSeek-V3的镜像包，确认镜像名称与标签。

3. 启动容器，准备所需的模型推理脚本，并确保相应的权限设置。

4. 配置服务化环境变量，并启动服务，确保服务成功运行。

发布时间：*

2025-02-05 17:22:00

华为上线DeepSeek系列模型提升AI性能

相关推荐

评论 ( 0 )

取消回复

华为上线DeepSeek系列模型提升AI性能

相关推荐

评论 ( 0 )

取消回复

ReadCai财经资讯站