检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
新增SFS Turbo挂载配置,并选择用户创建的SFS Turbo文件系统。 云上挂载路径:输入镜像容器中的工作路径 /home/ma-user/work/data 存储位置:输入用户的“子目录挂载”路径。如果默认没有填写,则忽略。 图3 选择SFS Turbo SFS Turbo不能直接挂载到容器的工作路径
创建桶不收取费用,按实际使用的存储容量和时长收费 弹性文件服务SFS Turbo 使用专属资源池进行训练时,支持挂载多个弹性文件服务SFS Turbo。用于存储模型训练的代码及输入输出数据。 具体费用可参见弹性文件服务价格详情。 按需计费 包年/包月 按文件系统所占用的存储空间容量和使用时长收费 存
Studio(MaaS)预置服务中开通商用服务。 预置服务-免费服务 在“预置服务 > 免费服务”页签提供的免费服务。更多信息,请参见在ModelArts Studio(MaaS)预置服务中体验免费服务。 预置服务-自定义接入点 在“预置服务 > 自定义接入点”页签创建的接入点服务。更多信息,请参见在ModelArts
signature_defs: signature.append(signature_def) if len(signature) == 1: model_signature = signature[0]
调优模型:使用不同的调优参数去训练模型。 部署模型服务:将调优后的模型部署成模型服务。 使用模型服务:在MaaS体验模型服务,测试推理结果。 结果分析:分析模型的调优结果和推理结果,对比新闻分类效果。 方案优势 高准确性:利用模型强大的语义理解能力,系统能够准确识别新闻内容的主题和关键词,实现高准确率的自动分类。
ModelArts提供AI工具链、AI算力,成本由AI算力的资源成本和运维成本构成。 成本分配 ModelArts支持企业项目管理,可以由企业项目服务来管理同一账号下不同项目的成本。 成本分析 通过华为云费用账单来分析账号下的成本支出情况。 成本优化 长期使用的资源,建议客户使用更优惠的
2文件,且/etc/nsswitch.conf配置了使用systemd方式进行用户信息校验。当SSH服务端在处理未携带用户名的连接请求时,触发了段错误。 频繁执行SSH连接命令,SSH服务端在段错误后进入90秒的拒绝服务状态,导致服务长时间无法访问。 解决方案 修改自定义镜像中/etc/nsswitch.c
参数解释:支持的存储类型。不同存储类型的差异,详见开发环境中如何选择存储。 取值范围:枚举类型,取值如下: SFS:弹性文件服务 EVS:云硬盘 OBS:对象存储服务 OBSFS:并行文件系统 EFS:弹性文件服务(SFS Turbo) mount_path String 参数解释:存储挂载至Notebook实例的目
场景,如内网系统之间的API调用。在ModelArts中,支持在部署在线服务时开启AppCode认证(部署模型为在线服务中的“支持APP认证”参数)。对于已部署的在线服务,ModelArts支持修改其配置开启AppCode认证。 本文主要介绍如何修改一个已有的在线服务,使其支持AppCode认证并进行在线预测。
放到Failed字段上,将弹出具体的失败原因。诊断报告详细介绍请查看查看诊断报告。 图9 查看性能诊断报告 OBS路径仅支持OBS并行文件系统。 Report页面将每隔5s自动刷新一次。 父主题: 性能调优: MA-Advisor性能诊断
从表2的“model参数值”列获取。 在“预置服务 > 商用服务”页签的服务名称左侧,单击图标,在“model参数”列查看取值。更多信息,请参见在ModelArts Studio(MaaS)预置服务中开通商用服务。 在预置服务-自定义接入点页签的“model参数”列查看取值。更多信息,请参见在ModelArts
参数解释:支持的存储类型。不同存储类型的差异,详见开发环境中如何选择存储。 取值范围:枚举类型,取值如下: SFS:弹性文件服务 EVS:云硬盘 OBS:对象存储服务 OBSFS:并行文件系统 EFS:弹性文件服务(SFS Turbo) mount_path String 参数解释:存储挂载至Notebook实例的目
上开发环境,包含标准化昇腾算力资源和完整的迁移工具链,帮助用户完成昇腾迁移的调测过程,进一步可在平台上将迁移的模型一键部署成为在线服务向外提供推理服务,或者运行到自己的运行环境中。 MindSpore Lite 华为自研的AI推理引擎,后端对于昇腾有充分的适配,模型转换后可以在昇
参数解释:支持的存储类型。不同存储类型的差异,详见开发环境中如何选择存储。 取值范围:枚举类型,取值如下: SFS:弹性文件服务 EVS:云硬盘 OBS:对象存储服务 OBSFS:并行文件系统 EFS:弹性文件服务(SFS Turbo) mount_path String 参数解释:存储挂载至Notebook实例的目
到flash attention算子耗时最长且降频比率最高,因此降频严重影响了整体的训练性能。对于降频问题,用户通常无法自行解决,需要联系服务方如华为云技术支持排查机器的温度和功耗。 图11 降频分析 AICPU Issues 下图展示了高优先级的AICPU问题,AICPU算子单
梯度监控 梯度监控工具提供了将模型梯度数据导出的能力。使用梯度监控工具,可以实现对训练过程模型每一层梯度信息进行监控,目前支持两种能力: 将模型权重的梯度数据导出。这种功能可以将模型权重的梯度值以统计量的形式采集出来,用以分析问题,例如检测确定性问题,使用训练状态监控工具监控NPU训练过程中的确定性计算问题。
“在线服务名称-模型的ID”,由此可得到在线服务的名称。 当账单中的资源ID中出现多个“-”符号相连时,可复制第一个“-”符号前的内容用于后续查询操作。 根据资源名称在云服务的控制台查找资源并删除。 在ModelArts管理控制台,选择“模型部署 > 在线服务”。 在服务列表上方
断点续训练。 SFS Turbo 当ModelArts和SFS Turbo间网络直通时,训练作业支持挂载多个SFS Turbo存放训练数据。单击“增加挂载配置”,填写如下参数。 “文件系统”:选择一个SFS Turbo。 “云上挂载路径”:输入SFS Turbo对应在训练容器内的云上挂载路径。
String 参数解释:服务器镜像名称。表示服务器镜像的名称。 约束限制:不涉及。 取值范围:1 - 256字符 默认取值:不涉及。 server_type String 参数解释:服务器类型。 取值范围: BMS:裸金属服务器 ECS:弹性云服务器 HPS:超节点服务器 status String
部署准备 步骤一:检查环境 步骤一:检查环境,检查NPU设备、容器内的网络访问等情况。 步骤二:获取基础镜像 建议使用官方提供的镜像部署推理服务。镜像地址{image_url}获取请参见表 基础容器镜像地址。 docker pull {image_url} 步骤三:上传模型权重文件