搜索_华为云

在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

没有，建议申请一台弹性云服务器并购买弹性公网IP，并在准备好的机器上安装必要的软件。 ModelArts提供了ubuntu系统的脚本，方便安装docker。本地Linux机器的操作等同ECS服务器上的操作，请参考本案例。登录ECS控制台，购买弹性云服务器，镜像选择“公共镜像”，推荐使用ubuntu18

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook
训练作业找不到GP - AI开发平台ModelArts

程序可见的GP： os.environ['CUDA_VISIBLE_DEVICES'] = '0,1,2,3,4,5,6,7' 其中，0为服务器的GP编号，可以为0，1，2，3等，表明对程序可见的GP编号。如果未进行添加配置则该编号对应的GP不可用。父主题： GP相关问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GP相关问题
场景介绍 - 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

Standard上的预训练和全量微调方案。本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。提示：本文档适用于仅使用OBS对象存储服务（Object Storage Service）作为存储的方案，OBS用于存储模型文件、训练数据、代码、日志等，提供了高可靠性的数据存储解决方案。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912）
版本说明和要求 - AI开发平台ModelArts

Server资源开通，购买Lite Server资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
推理场景介绍 - 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

Cluster上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬件，为用户提供推理部署方案，帮助用户使能大模型业务。约束限制本方案目前仅适用于部分企业客户。本文档适配昇腾云ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
推理场景介绍 - 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

Server上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬件，为用户提供推理部署方案，帮助用户使能大模型业务。约束限制本方案目前仅适用于部分企业客户。本文档适配昇腾云ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909）
场景介绍 - 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

本案例在Notebook上部署推理服务进行调试，因此需要创建Notebook。部署推理服务在Notebook调试环境中部署推理服务介绍如何在Notebook中配置NPU环境，部署并启动推理服务，完成精度测试和性能测试。如果需要部署量化模型，需在Notebook中进行模型权重转换后再部署推理服务。在推理生产环境中部署推理服务

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
推理场景介绍 - 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

Server上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬件，为用户提供推理部署方案，帮助用户使能大模型业务。约束限制本方案目前仅适用于部分企业客户。本文档适配昇腾云ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910）
推理场景介绍 - 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

Cluster上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬件，为用户提供推理部署方案，帮助用户使能大模型业务。约束限制本方案目前仅适用于部分企业客户。本文档适配昇腾云ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
模型的自定义镜像制作流程 - AI开发平台ModelArts

如果需要支持滚动升级的过程中不中断业务，那么需要将服务的Http的“keep-alive”参数设置为200s。以gunicorn服务框架为例，gunicorn缺省情形下不支持keep-alive，需要同时安装gevent并配置启动参数“--keep-alive 200 -k gevent”。不同服务框架参数设置有区别，请以实际情况为准。

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
Prefix Caching - AI开发平台ModelArts

--enable-prefix-caching 执行推理参考配置服务化参数。Ascend vllm使用该特性需参考表1和表2，其它参数请启动推理服务。启动服务。具体请参考启动推理服务。精度评测和性能评测。具体请参考推理服务精度评测和推理服务性能评测。父主题：推理关键特性使用

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
VAR/XAR/RandAR/Infinity自回归图像生成模型基于Lite Server适配NPU推理指导（6.5.905) - AI开发平台ModelArts

本文主要介绍如何在ModelArts的Lite Server环境中，使用NPU卡将视觉自回归模型（包括VAR/XAR/RandAR/Infinity模型）的推理任务迁移到昇腾服务器上。完成本方案的部署，需要先联系您所在企业的华为方技术支持购买Server资源。资源规格要求建议使用Lite Server环境中的Ascend

帮助中心 > AI开发平台ModelArts > 最佳实践 > 图像生成模型训练推理
为什么项目删除完了，仍然还在计费？ - AI开发平台ModelArts

为什么项目删除完了，仍然还在计费？如果ModelArts的Notebook实例、训练作业或在线服务，都已经处于停止状态，即总览页面没看到收费项目，仍然发现账号还在计费。有以下几种可能情况：因为您在使用ModelArts过程中，将数据上传至OBS进行存储，OBS会根据实际存储

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ
欠费后，ModelArts的资源是否会被删除？ - AI开发平台ModelArts

欠费后，ModelArts的资源是否会被删除？欠费后，ModelArts的资源不会被立即删除。欠费后，您可以在“费用中心”查看欠费详情。为了防止相关资源不会被停止服务或者逾期释放，您需要及时进行还款或充值。查询欠费步骤登录管理控制台。单击页面右上角的“费用”进入“费用中心”页面。在“总览”页面可以查看到当前的欠费金额。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ
在ModelArts上如何提升训练效率并减少与OBS的交互？ - AI开发平台ModelArts

在ModelArts上如何提升训练效率并减少与OBS的交互？场景描述在使用ModelArts进行自定义深度学习训练时，训练数据通常存储在对象存储服务（OBS）中，且训练数据较大时（如200GB以上），每次都需要使用GP资源池进行训练，且训练效率低。希望提升训练效率，同时减少与对象存储

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
重启DevServer实例 - AI开发平台ModelArts

EndpointsRes objects 服务器的私有IP信息。 image ServerImageResponse object 服务器镜像信息。 category String 服务器归属类型。 HPS：超节点服务器 SPOD：整柜服务器 SERVER：单台服务器 server_hps ServerHpsInfo

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
查询用户所有超节点实例详情 - AI开发平台ModelArts

EndpointsRes objects 服务器的私有IP信息。 image ServerImageResponse object 服务器镜像信息。 category String 服务器归属类型。 HPS：超节点服务器 SPOD：整柜服务器 SERVER：单台服务器 server_hps ServerHpsInfo

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
在ModelArts Studio（MaaS）应用广场一键复制应用 - AI开发平台ModelArts

MCP服务返回的内容将被计入输入Token消耗。调用MCP服务时，可能会涉及到第三方平台服务的使用费用，请以第三方平台的计费规则为准。调用计费应用发布后，将托管至函数工作流FunctionGraph服务中。实际计费请以FunctionGraph计费为准，详情请参见FunctionGraph函数工作流计费规

 帮助中心 > AI开发平台ModelArts > ModelArts Studio（MaaS）用户指南 > ModelArts Studio（MaaS）应用中心 > ModelArts Studio（MaaS）应用管理
使用ModelArts Standard自动学习实现垃圾分类 - 快速入门 - AI开发平台ModelArts

在完成预测之后，建议关闭服务，以免产生不必要的计费。停止运行服务预测完成后，单击页面右上角的“停止”，即可停止该服务。单击左上角返回在线服务，在对应的服务名称所在行，单击选择操作列的“更多>停止”，停止该服务。图7 停止服务清除OBS中的数据。在控制台左侧导航栏的服务列表，选择“

帮助中心 > AI开发平台ModelArts > 快速入门
使用ModelArts Standard自动学习实现垃圾分类 - Standard自动学习 - AI开发平台ModelArts

在完成预测之后，建议关闭服务，以免产生不必要的计费。停止运行服务预测完成后，单击页面右上角的“停止”，即可停止该服务。单击左上角返回在线服务，在对应的服务名称所在行，单击选择操作列的“更多>停止”，停止该服务。图7 停止服务清除OBS中的数据。在控制台左侧导航栏的服务列表，选择“

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > Standard自动学习

总条数： 1957

上一页
1
...
67
68
69
...
98
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消