搜索_华为云

不允许子账号使用公共资源池创建作业 - AI开发平台ModelArts

modelarts:service:create：此策略项表示创建推理服务。给子账号配置权限：限制使用公共资源池使用主用户账号登录管理控制台，单击右上角用户名，在下拉框中选择“统一身份认证”，进入统一身份认证（IAM）服务。在统一身份认证服务页面的左侧导航选择“权限管理 > 权限”，单击右上角

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
推理性能测试 - AI开发平台ModelArts

--backend：服务类型，支持tgi、vllm、mindspore、openai等。本文档使用的推理接口是vllm。 --host：服务IP地址，如127.0.0.1。 --port：服务端口，和推理服务端口8080。 --url：如果以vllm接口方式启动服务，API接口公网地

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > LLM大语言模型推理历史版本文档 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

序列说明基于vLLM（v0.6.3）部署推理服务时，不同模型推理支持的最小昇腾卡数和对应卡数下的max-model-len长度说明，如下面的表格所示。以下值是在gpu-memory-utilization为0.9时测试得出，为服务部署所需的最小昇腾卡数及该卡数下推荐的最大ma

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > LLM大语言模型推理历史版本文档 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

序列说明基于vLLM（v0.6.3）部署推理服务时，不同模型推理支持的最小昇腾卡数和对应卡数下的max-model-len长度说明，如下面的表格所示。以下值是在gpu-memory-utilization为0.9时测试得出，为服务部署所需的最小昇腾卡数及该卡数下推荐的最大ma

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > LLM大语言模型推理历史版本文档 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
各模型支持的最小卡数和最大序列 - AI开发平台ModelArts

各模型支持的最小卡数和最大序列基于vLLM（v0.6.3）部署推理服务时，不同模型推理支持的最小昇腾卡数和对应卡数下的max-model-len长度说明，如下面的表格所示。以下值是在gpu-memory-utilization为0.9时测试得出，为服务部署所需的最小昇腾卡数及该卡数下推荐的最大ma

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > LLM大语言模型推理历史版本文档 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 附录
训练作业失败，返回错误码139 - AI开发平台ModelArts

训练作业运行失败，返回错误码139，如下图所示： [Modelarts Service Log]Training end with reeturn code: 139 INFO:root:Using MoXing-v1.17.2-c806a92f INFO;root:Using OBS-Python-SDK-3

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
ModelArts统一镜像列表 - AI开发平台ModelArts

统一镜像列表 ModelArts提供了ARM+Ascend规格的统一镜像，包括MindSpore、PyTorch。适用于开发环境，模型训练，服务部署，请参考统一镜像列表。表1 MindSpore 预置镜像适配芯片适用范围 mindspore_2.3.0-cann_8.0.rc1-py_3

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 制作自定义镜像用于ModelArts Standard > ModelArts支持的预置镜像列表
创建网络资源 - AI开发平台ModelArts

参数解释：网络对端连接的状态列表。约束限制：不涉及。取值范围：不涉及。默认取值：不涉及。 sfsTurboStatus Array of sfsTurboStatus objects 参数解释：网络连接SFS Turbo的状态列表。约束限制：不涉及。取值范围：不涉及。默认取值：不涉及。表17

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
Lite Server资源开通（新版页面） - AI开发平台ModelArts

裸金属服务器：是一款兼具弹性云服务器和物理机性能的计算类服务器，为您和您的企业提供专属的云上物理服务器。弹性云服务器：是一种可随时自助获取、可弹性伸缩的云服务器，可帮助您打造可靠、安全、灵活、高效的应用环境，确保服务持久稳定运行，提升运维效率。超节点服务器：是一种高性能服务器配

 帮助中心 > AI开发平台ModelArts > ModelArts Lite Server用户指南
准备代码 - 准备工作 - AI开发平台ModelArts

使用root用户以SSH的方式登录服务器。将AscendCloud代码包AscendCloud-xxx-xxx.zip上传到${workdir}目录下并解压缩，如SFS Turbo的路径：/mnt/sfs_turbo目录下，以下都以/mnt/sfs_turbo为例，请根据实际修改。 unzip

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > LLM大语言模型训练历史版本文档 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
准备代码 - 准备工作 - AI开发平台ModelArts

使用root用户以SSH的方式登录服务器。将AscendCloud代码包AscendCloud-xxx-xxx.zip上传到${workdir}目录下并解压缩，如SFS Turbo的路径：/mnt/sfs_turbo目录下，以下都以/mnt/sfs_turbo为例，请根据实际修改。 unzip

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > LLM大语言模型训练历史版本文档 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
查询训练作业参数详情 - AI开发平台ModelArts

表6 nfs属性列表参数参数类型说明 id String SFS Turbo 文件系统 ID。 src_path String SFS Turbo 文件系统地址。 dest_path String 训练作业的本地路径。 read_only Boolean dest_path 是否为只读权限，默认为读写权限。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
从MRS导入数据到ModelArts数据集 - AI开发平台ModelArts

ModelArts支持从MRS服务中导入存储在HDFS上的csv格式的数据，首先需要选择已有的MRS集群，并从HDFS文件列表选择文件名称或所在目录，导入文件的列数需与数据集schema一致。MRS的详细功能说明，请参考MRS用户指南。图1 从MRS导入数据集群名称：系统自动将当前账号下的

 帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 数据准备与处理 > 导入数据到ModelArts数据集
ECS获取和上传基础镜像 - 准备镜像 - AI开发平台ModelArts

弹性云服务器。完成网络配置、高级配置等步骤，可根据默认选择，或进行自定义。创建完成后，单击“远程登录”，后续安装Docker等操作均在该ECS上进行。注意：CPU架构必须选择鲲鹏计算，镜像推荐选择EulerOS。图1 购买ECS Step2 创建镜像组织在SWR服务页面创建镜像组织。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Standard+OBS适配MindSpeed-LLM PyTorch NPU训练指导（6.5.901） > 准备工作 > 准备镜像
ECS获取和上传基础镜像 - 准备镜像 - AI开发平台ModelArts

弹性云服务器。完成网络配置、高级配置等步骤，可根据默认选择，或进行自定义。创建完成后，单击“远程登录”，后续安装Docker等操作均在该ECS上进行。注意：CPU架构必须选择鲲鹏计算，镜像推荐选择EulerOS。图1 购买ECS Step2 创建镜像组织在SWR服务页面创建镜像组织。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > LLM大语言模型训练历史版本文档 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作 > 准备镜像
安全配置最佳实践 - AI开发平台ModelArts

安全配置最佳实践场景说明安全性是华为云与您的共同责任。华为云负责云服务自身的安全，提供安全的云；作为租户，您需要合理使用云服务提供的安全能力对数据进行保护，安全地使用云。本文提供了ModelArts使用过程中的安全最佳实践，旨在为提高整体安全能力提供可操作的规范性指导。根据

 帮助中心 > AI开发平台ModelArts > 最佳实践
PD分离部署自动配比调优 - AI开发平台ModelArts

256,2048"，服务会在启动时测算这些输入长度数据的执行时间，该数量会影响服务启动时间，建议不超过10个 --profile-out-len：profiling的输出长度，默认"4,16,64,128"，服务会在启动时测算这些输出长度数据的执行时间，该数量会影响服务启动时间，建议不超过5个

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理关键特性使用 > 分离部署
在ModelArts Studio（MaaS）应用体验中心查看应用解决方案 - AI开发平台ModelArts

用解决方案 ModelArts Studio大模型即服务平台提供了MaaS应用体验中心，为具体的应用场景提供一整套解决方案。应用中心介绍 “MaaS应用体验中心”提供基于行业客户应用场景的AI解决方案。MaaS提供的模型服务和华为云各AI应用层构建工具之间相互连通，通过灵活的组

 帮助中心 > AI开发平台ModelArts > ModelArts Studio（MaaS）用户指南 > ModelArts Studio（MaaS）应用中心
更新网络资源 - AI开发平台ModelArts

参数解释：网络对端连接的状态列表。约束限制：不涉及。取值范围：不涉及。默认取值：不涉及。 sfsTurboStatus Array of sfsTurboStatus objects 参数解释：网络连接SFS Turbo的状态列表。约束限制：不涉及。取值范围：不涉及。默认取值：不涉及。表18

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
运行第一条Workflow - AI开发平台ModelArts

按需计费规格，使用完之后请及时停止Workflow，避免产生不必要的费用。测试推理服务：工作流运行完成后，在服务部署节点右侧单击“实例详情”跳转至推理服务详情页。或者在ModelArts管理控制台，选择“部署上线>在线服务”，找到部署的推理服务，单击服务名称，进入服务详情页。单击“预测”，右边可查看预测结果。图6

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用Workflow实现低代码AI开发

总条数： 1963

上一页
1
...
33
34
35
...
99
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消