搜索_华为云

pipeline代码适配 - AI开发平台ModelArts

thread_affinity_mode = 2 return context def __call__(self, **kwargs): if not self.use_ascend: return self.onnx_runtime_model(**kwargs)

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 案例：SD1.5推理迁移 > 应用迁移
guided-decoding - 推理关键特性使用 - AI开发平台ModelArts

preferred Armor, Weapon, and Strength", "max_tokens": 200, "temperature": 0, "guided_json": "{\"title\": \"Character\", \"type\": \"object\"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理关键特性使用
guided-decoding - 推理关键特性使用 - AI开发平台ModelArts

preferred Armor, Weapon, and Strength", "max_tokens": 200, "temperature": 0, "guided_json": "{\"title\": \"Character\", \"type\": \"object\"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
基于K8s Deployment单机部署推理服务 - AI开发平台ModelArts

initialDelaySeconds: 600 # 容器启动后，开始探测vllm服务的时长，需要根据sfs_turbo读取速度调整 periodSeconds: 10 timeoutSeconds: 10

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server&Cluster适配Ascend-vLLM PyTorch NPU推理指导（6.5.905） > Cluster部署推理服务
如何根据Cluster节点故障自动恢复业务 - AI开发平台ModelArts

for { select { case <-termCh: return case event, ok := <-watcher.ResultChan(): if

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
训练作业卡死检测定位 - AI开发平台ModelArts

果没有变化，则判定作业卡死。全实例检测资源利用率：当作业在一段时间内所有实例的GP利用率或者NPU利用率都没有变化，则判定作业卡死。系统预置了卡死检测的环境变量“MA_HANG_DETECT_TIME=30”，表示检测到指标异常并持续30分钟则判定作业卡死。如果需要修改卡死

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
训练作业卡死检测 - AI开发平台ModelArts

果没有变化，则判定作业卡死。全实例检测资源利用率：当作业在一段时间内所有实例的GP利用率或者NPU利用率都没有变化，则判定作业卡死。系统预置了卡死检测的环境变量“MA_HANG_DETECT_TIME=30”，表示检测到指标异常并持续30分钟则判定作业卡死。如果需要修改卡死

 帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用ModelArts Standard训练模型 > 模型训练高可靠性
更新服务配置 - AI开发平台ModelArts

挂载在系统目录下，如“/”、“/var/run”等，会导致容器异常。建议挂载在空目录下，若目录不为空，请确保目录下无影响容器启动的文件，否则文件会被替换，导致容器启动异常，工作负载创建失败。 storage_type 否 String 挂载类型sfs_turbo极速文件系统挂载。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
上传本地文件至JupyterLab - AI开发平台ModelArts

对于大小不超过100MB的文件直接上传，并展示文件大小、上传进度及速度等详细信息。对于大小超过100MB不超过50GB的文件可以使用OBS中转，系统先将文件上传OBS（对象桶或并行文件系统），然后从OBS下载到Notebook，上传完成后，会将文件从OBS中删除。 50GB以上的文件上传通过调用ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例 > 上传文件至JupyterLab
Senna模型基于ModelArts Lite Server适配PyTorch NPU训练指导 - AI开发平台ModelArts

Snt9B23或Ascend Snt9B开展Senna模型的训练过程。 Senna是一种结合了大型视觉语言系统（Senna-VLM）和端到端模型（Senna-E2E）的自动驾驶系统。端到端模型虽然有着强大的规划能力，但是在面对复杂场景的规划表现不佳，大型视觉-语言模型（LVLM）在场

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 自动驾驶模型训练推理
Lite Server高危操作一览表 - AI开发平台ModelArts

高：对于可能直接导致业务失败、数据丢失、系统不能维护、系统资源耗尽的高危操作。中：对于可能导致安全风险及可靠性降低的高危操作。低：高、中风险等级外的其他高危操作。表1 高危操作一览表操作对象操作名称风险描述风险等级应对措施操作系统升级/修改操作系统内核或者驱动。如果升级/修改操作系统内核或者

 帮助中心 > AI开发平台ModelArts > ModelArts Lite Server用户指南 > Lite Server使用前必读
run.sh脚本测试ModelArts训练整体流程 - AI开发平台ModelArts

##认证用的AK和SK硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。 ##本示例以AK和SK保存在环境变量中来实现身份验证为例，运行本示例前请先在本地环境中设置环境变量HUAWEICLOUD_SDK_AK和HUAWEICLOUD_SDK_SK。 ##安

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
配置用户缺失的ModelArts Studio（MaaS）相关服务权限 - AI开发平台ModelArts

创建自定义策略。在“访问受限”对话框，单击“一键复制”，保存权限缺失内容，单击“确定”。图5 访问受限提示鼠标悬停至右上角账号处，单击“统一身份认证”。在IAM控制台左侧导航栏，选择“权限管理 > 权限”。在“权限”页面右上角，单击“创建自定义策略”。在“创建自定义策略”页面，配置相关信息，单击“确定”。

帮助中心 > AI开发平台ModelArts > ModelArts Studio（MaaS）用户指南 > 配置ModelArts Studio（MaaS）访问授权
使用ModelArts Studio（MaaS）的Qwen2-7B模型框架实现对话问答 - AI开发平台ModelArts

户配置委托授权，允许访问这些依赖服务。使用华为云账号登录ModelArts管理控制台，按照版本选择以下操作。新版本：在左侧导航栏选择“系统管理 > 权限管理”。旧版本：在左侧导航栏选择“全局配置”。单击“添加授权”，配置相关参数。下文以IAM子用户为例进行说明，您可以按需修改。

帮助中心 > AI开发平台ModelArts > 快速入门
Ascend-vLLM介绍 - 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） - AI开发平台ModelArts

分离部署 PD分离部署全量、增量分离部署，提高资源利用率，提升体验。剪枝 FASP (Fast and Accurate Structured Pruning) 剪枝 FASP剪枝是一种结构化稀疏剪枝方法，能有效降低模型显存以及需要部署的资源依赖，减小推理过程中的计算量，降低增量推理时延，提升吞吐。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901）
Ascend-vLLM介绍 - 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） - AI开发平台ModelArts

分离部署 PD分离部署全量、增量分离部署，提高资源利用率，提升体验。剪枝 FASP (Fast and Accurate Structured Pruning) 剪枝 FASP剪枝是一种结构化稀疏剪枝方法，能有效降低模型显存以及需要部署的资源依赖，减小推理过程中的计算量，降低增量推理时延，提升吞吐。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
Lite Cluster高危操作一览表 - AI开发平台ModelArts

下表可帮助您定位异常出现的原因，风险操作包括但不限于以下内容。高危操作风险等级说明：高：对于可能直接导致业务失败、数据丢失、系统不能维护、系统资源耗尽的高危操作。中：对于可能导致安全风险及可靠性降低的高危操作。低：高、中风险等级外的其他高危操作。表1 操作及其对应风险

 帮助中心 > AI开发平台ModelArts > ModelArts Lite Cluster用户指南 > Lite Cluster使用前必读
基于KubeInfer多机部署推理服务 - AI开发平台ModelArts

initialDelaySeconds: 2400 # 容器启动后，开始探测vllm服务的时长，需要根据sfs_turbo读取速度调整 periodSeconds: 10 timeoutSeconds:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server&Cluster适配Ascend-vLLM PyTorch NPU推理指导（6.5.905） > Cluster部署推理服务
在ModelArts Standard使用run.sh脚本实现OBS和训练容器间的数据传输 - AI开发平台ModelArts

##认证用的AK和SK硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。 ##本示例以AK和SK保存在环境变量中来实现身份验证为例，运行本示例前请先在本地环境中设置环境变量HUAWEICLOUD_SDK_AK和HUAWEICLOUD_SDK_SK。 ##安

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
剪枝 - AI开发平台ModelArts
剪枝 - AI开发平台ModelArts

以及需要部署的资源依赖，减小推理过程中的计算量，降低增量推理时延，提升吞吐。 FASP (Fast and Accurate Structured Pruning) 一种针对LLM进行结构化剪枝的算法，可以减少大模型对于内存和计算资源的需求，提升推理速度，同时其具备比较高的剪枝速

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理关键特性使用

总条数： 915

上一页
1
...
25
26
27
...
46
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消