数据:
华为DeepSeek系列模型DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上线昇腾社区,支持一键获取,支持昇腾硬件平台即插即用。DeepSeek-V3在多项评测中超越Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上与顶尖闭源模型相当。
线索:
华为的新模型上线可能带来新的投资机会,尤其是在AI硬件和软件市场。随着AI技术的快速发展,企业可能会更倾向于采用华为的解决方案,从而促进其硬件销售。此外,DeepSeek V3的高性能意味着可能会吸引更多开发者与公司选择其技术,增强华为在市场中的地位。然而,市场竞争激烈,若无法维持技术领先,可能会面临技术滞后的风险。
正文:
华为于2025年2月5日宣布,DeepSeek系列模型正式上线昇腾社区,具体包括DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro。用户现在可以通过昇腾社区一键获取这些模型,且支持在昇腾硬件平台上即插即用。DeepSeek-V3的首个版本于2024年发布,并完成开源工作,其自研MoE模型具有671B参数和激活37B,在14.8T token上进行了预训练。
DeepSeek所提供的信息显示,DeepSeek-V3在多个性能评测中超越了开源模型Qwen2.5-72B和Llama-3.1-405B,且与封闭模型如GPT-4o和Claude-3.5-Sonnet的表现不相上下。以DeepSeek-V3为例,用户可在昇腾社区有效获取和使用该模型。
进行DeepSeek-V3模型的部署时,用户需具备4台Atlas 800I A2(864G)服务器资源。使用模型时,要经过以下步骤:
1. 权重转换,包括GPU和NPU的不同操作。
2. 加载适配DeepSeek-V3的镜像包,确认镜像名称与标签。
3. 启动容器,准备所需的模型推理脚本,并确保相应的权限设置。
4. 配置服务化环境变量,并启动服务,确保服务成功运行。
发布时间:*
2025-02-05 17:22:00



评论 ( 0 )