正文内容 评论(0

华为官宣!DeepSeek系列模型正式上线昇腾社区
2025-02-05 15:43:36  出处:快科技 作者:拾柒 编辑:拾柒     评论(0)点击可以复制本篇文章的标题和链接对文章内容进行纠错

快科技2月5日消息,今日,华为宣布,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上线昇腾社区,支持一键获取DeepSeek系列模型,支持昇腾硬件平台上开箱即用。

据了解,DeepSeek-V3首个版本于2024年上线并同步开源,为自研MoE模型,671B 参数,激活37B,在14.8T token上进行了预训练。

据DeepSeek介绍,DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B 等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

以下以Deepseek-V3为例,演示在昇腾社区如何高效获取模型及使用

华为官宣!DeepSeek系列模型正式上线昇腾社区

一、硬件要求

部署DeepSeek-V3模型需配置4台Atlas 800I A2(8*64G)服务器资源

二、模型调用实践

1、权重转换

GPU:

华为官宣!DeepSeek系列模型正式上线昇腾社区

NPU:

华为官宣!DeepSeek系列模型正式上线昇腾社区

2、加载镜像

在昇腾社区/开发资源下载适配DeepSeek-V3的镜像包:

mindie:1.0.T71-800I-A2-py311-ubuntu22.04-arm64

完成之后,请使用docker images命令确认查找具体镜像名称与标签。

华为官宣!DeepSeek系列模型正式上线昇腾社区

3、容器启动

提供的MindIE镜像预置了DeepSeek-V3模型推理脚本,从您信任的来源自行获取权重后,放置在从上述下载的模型代码的主目录下,修改模型文件夹属组为1001,执行权限为750,启动容器。

华为官宣!DeepSeek系列模型正式上线昇腾社区

华为官宣!DeepSeek系列模型正式上线昇腾社区

4、服务化测试

配置服务化环境变量,expandable_segments-使能内存池扩展段功能,即虚拟内存特性。

华为官宣!DeepSeek系列模型正式上线昇腾社区

修改服务化参数

华为官宣!DeepSeek系列模型正式上线昇腾社区

拉起服务化

出现“Daemon start success!”,则认为服务成功启动。

华为官宣!DeepSeek系列模型正式上线昇腾社区

【本文结束】如需转载请务必注明出处:快科技

责任编辑:拾柒

文章内容举报

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |
本文收录在
#华为#DeepSeek#昇腾

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...