搜索_华为云

准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

"conversation_id": 1, "meta_instruction": "", "num_turns": 3, "chat": { "turn_1": { "Human": "<|Human|>: 如何保障工作中遵循正确的安全准则？<eoh>\n"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
调用ModelArts API接口创建训练作业和部署服务时，如何填写资源池的参数？ - AI开发平台ModelArts

调用ModelArts API接口创建训练作业和部署服务时，如何填写资源池的参数？调用API接口创建训练作业时，“pool_id”为“资源池ID”。调用API接口部署在线服务时，“pool_name”为“资源池ID” 。图1 资源池ID 父主题： API/SDK

帮助中心 > AI开发平台ModelArts > 常见问题 > API/SDK
训练的数据集预处理说明 - 训练脚本说明 - AI开发平台ModelArts

labels = [], [] for turn in sample["chat"].values(): if not turn: continue user = turn["Human"].replace("<eoh>"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明
训练的数据集预处理说明 - 训练脚本说明 - AI开发平台ModelArts

labels = [], [] for turn in sample["chat"].values(): if not turn: continue user = turn["Human"].replace("<eoh>"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明
查看ModelArts相关审计日志 - AI开发平台ModelArts

查看ModelArts相关审计日志在您开启了云审计服务后，系统会记录ModelArts的相关操作，且控制台保存最近7天的操作记录。本节介绍如何在云审计服务管理控制台查看最近7天的操作记录。操作步骤登录云审计服务管理控制台。在管理控制台左上角单击图标，选择区域。在左侧导航

 帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用CTS审计ModelArts Standard服务
训练的数据集预处理说明 - 训练脚本说明 - AI开发平台ModelArts

labels = [], [] for turn in sample["chat"].values(): if not turn: continue user = turn["Human"].replace("<eoh>"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明
训练的数据集预处理说明 - 训练脚本说明参考 - AI开发平台ModelArts

labels = [], [] for turn in sample["chat"].values(): if not turn: continue user = turn["Human"].replace("<eoh>"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明参考
使用CES监控Lite Server单节点NPU资源 - AI开发平台ModelArts

为用户提供服务器的系统级、主动式、细颗粒度监控服务。当前账户需要给CES授权委托，请参考创建用户并授权使用云监控服务。如果在创建Server资源时，开启了“CES主机监控授权”，此处无需重复执行授权操作。当前还不支持在CES界面直接一键安装监控，需要登录到服务器上执行以下命

 帮助中心 > AI开发平台ModelArts > ModelArts Lite Server用户指南 > 监控Lite Server资源
查询训练作业参数详情 - AI开发平台ModelArts

表6 nfs属性列表参数参数类型说明 id String SFS Turbo 文件系统 ID。 src_path String SFS Turbo 文件系统地址。 dest_path String 训练作业的本地路径。 read_only Boolean dest_path 是否为只读权限，默认为读写权限。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
使用DCGM监控Lite Server GPU资源 - AI开发平台ModelArts

Server上的GPU资源。 DCGM是用于管理和监控基于Linux系统的NVIDIA GPU大规模集群的一体化工具，提供多种能力，包括主动健康监控、诊断、系统验证、策略、电源和时钟管理、配置管理和审计等。约束限制仅适用于GPU资源监控。前提条件裸金属服务器需要安装driver、cuda、fabric-manager软件包。

帮助中心 > AI开发平台ModelArts > ModelArts Lite Server用户指南 > 监控Lite Server资源
GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed to initialize NVML - AI开发平台ModelArts

GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed to initialize NVML 问题现象华为云裸金属服务器，NVIDIA驱动卸载后重新安装。（1）已卸载原有版本NVIDIA驱动和CUDA版本，且已安装新版本的NVIDIA驱动和CUDA版本

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
安全边界 - AI开发平台ModelArts
安全边界 - AI开发平台ModelArts

安全边界云服务的责任共担模型是一种合作方式，其中云服务提供商和云服务客户共同承担云服务的安全和合规性责任。这种模型是为了确保云服务的安全性和可靠性而设计的。根据责任共担模型，云服务提供商和云服务客户各自有一些责任。云服务提供商负责管理云基础架构，提供安全的硬件和软件基础设施，

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
管理AI Gallery模型 - AI开发平台ModelArts

镜像规范，否则该镜像无法正常使用AI Gallery工具链服务。说明：建议写清楚模型的使用方法，方便使用者更好的完成训练、推理任务。表2 任务类型支持的AI Gallery工具链服务任务类型微调大师在线推理服务 AI应用文本问答/文本生成支持支持支持其他类型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型
ModelArts支持云审计的关键操作 - AI开发平台ModelArts

deleteConvert 服务管理支持审计的关键操作列表表5 服务管理支持审计的关键操作列表操作名称资源类型事件名称部署服务 service addService 删除服务 service deleteService 更新服务 service updateService 启停服务 service

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用CTS审计ModelArts Standard服务
创建Notebook实例 - 开发环境管理 - AI开发平台ModelArts

登录弹性文件服务控制台，在文件系统列表中，单击文件系统名称进入详情页。其中，“共享路径”即为此参数的参数值。 id 否 String EFS专属存储盘ID，只有当category为EFS，同时ownership为DEDICATED时必填。参数值获取方式如下：登录弹性文件服务控制台，

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
训练作业失败，返回错误码139 - AI开发平台ModelArts

训练作业运行失败，返回错误码139，如下图所示： [Modelarts Service Log]Training end with reeturn code: 139 INFO:root:Using MoXing-v1.17.2-c806a92f INFO;root:Using OBS-Python-SDK-3

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
创建Notebook实例 - 使用Notebook进行AI开发调试 - AI开发平台ModelArts

景下的模型训练和调测。 “存储配置” 包括“云硬盘EVS”、“弹性文件服务SFS”、“对象存储服务OBS”和“并行文件系统PFS”。请根据界面实际情况和需要选择。说明： “对象存储服务OBS”、“并行文件系统PFS”是白名单功能，如果有试用需求，请提工单申请权限。选择“云硬盘EVS”作为存储位置。

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用Notebook进行AI开发调试
GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？ - AI开发平台ModelArts

A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？场景描述本文指导如何进行节点内NVLINK带宽性能测试，适用的环境为：Ant8或者Ant1 GPU裸金属服务器，且服务器中已经安装相关GPU驱动软件，以及Pytorch2.0。 GPU A系列裸金属服务器，单台服务

 帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
训练的数据集预处理说明 - 训练脚本说明 - AI开发平台ModelArts

labels = [], [] for turn in sample["chat"].values(): if not turn: continue user = turn["Human"].replace("<eoh>"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.908） > 训练脚本说明
查询所有Notebook实例列表 - AI开发平台ModelArts

service_type String 镜像支持服务类型。枚举值如下： COMMON：通用镜像。 INFERENCE: 建议仅在推理部署场景使用。 TRAIN: 建议仅在训练任务场景使用。 DEV: 建议仅在开发调测场景使用。 UNKNOWN: 未明确设置的镜像支持的服务类型。 size Long 镜像大小（单位KB）。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理

总条数： 1983

上一页
1
...
23
24
25
...
100
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消