检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
父主题: DevServer管理
查询训练作业列表 功能介绍 根据指定条件查询用户创建的训练作业。 URI GET /v1/{project_id}/training-jobs 参数说明如表1所示。 表1 路径参数 参数 是否必选 参数类型 说明 project_id 是 String 用户项目ID。获取方法请参见获取项目
原因分析 在不使用动态加载的情况下,系统对单个模型文件的限制大小为5G,超过时无法进行导入。 处理方法 精简模型文件后,重新导入。 使用动态加载功能进行导入。 图1 使用动态加载 父主题: 模型管理
父主题: DevServer管理
将数据预热到SFS Turbo 训练任务开始前可通过数据预热功能将文件元数据和数据内容全部从OBS导入到SFS Turbo高性能文件存储中,数据预热功能的具体操作请参考创建SFS Turbo 和 OBS 之间的联动任务。
约束限制 训练作业的事件信息系统会自动保存30天,过期会被清除。 查看操作 在ModelArts管理控制台的左侧导航栏中选择“模型训练 > 训练作业”。 在训练作业列表中,单击作业名称进入训练作业详情页面。 在训练作业详情页面,单击“事件”页签查看事件信息。
查询可视化作业详情 功能介绍 根据作业名称查看指定的可视化作业详情。 URI GET /v1/{project_id}/visualization-jobs/{job_id} 参数说明如表1所示。 表1 参数说明 参数 是否必选 参数类型 说明 project_id 是 String
更新可视化作业描述 功能介绍 更新可视化作业的描述。 URI PUT /v1/{project_id}/visualization-jobs/{job_id} 参数说明如表1所示。 表1 参数说明 参数 是否为必选 参数类型 说明 project_id 是 String 用户项目ID
不同的是,run_vllm_multi_node.sh可在多节点上执行,并且通过Ray管理多节点的分布式推理服务。
释放被冻结的“包年/包月”的Lite Server资源 包周期节点、整柜资源或超节点资源被冻结锁定时,无法通过“退订”功能释放资源,此时系统支持直接通过“释放”功能释放资源。 登录ModelArts管理控制台。
训练作业的资源占用情况系统会自动保存30天,过期会被清除。 如何查看训练作业资源使用详情 在ModelArts管理控制台的左侧导航栏中选择“模型训练 > 训练作业”。 在训练作业列表中,单击作业名称进入训练作业详情页面。
原因分析 自定义镜像导入不支持配置运行时依赖,系统不会自动安装所需要的pip依赖包。 处理方法 重新构建镜像。 在构建镜像的dockerfile文件中安装pip依赖包,例如安装Flask依赖包。
父主题: 数据管理(旧版)
父主题: 数据管理(旧版)
添加授权 登录ModelArts管理控制台,在左侧导航栏选择“系统管理 > 权限管理”,进入“权限管理”页面。 ModelArts旧版导航页面中,在左侧导航栏选择“全局配置”,进入权限配置页面。 单击“添加授权”,进入“添加授权”配置页面,根据参数说明进行配置。
父主题: Lite Server资源管理
获取训练作业日志的文件名 功能介绍 获取训练作业日志的文件名。 URI GET /v1/{project_id}/training-jobs/{job_id}/versions/{version_id}/log/file-names 参数说明如表1所示。 表1 参数说明 参数 是否必选
表2 部署方式说明 维度 本地部署 云端部署 定义 将MCP平台直接部署在企业本地数据中心或自有服务器上,系统完全由企业自主管理。 将MCP平台部署在公有云或第三方托管服务上,通过网络远程管理集群。
进入ModelArts,创建Notebook实例 登录ModelArts管理控制台,在左侧菜单栏中选择“开发空间 > Notebook”,进入“Notebook”管理页面。
登录ModelArts管理控制台,在左侧菜单栏中选择“资源管理 > 轻量算力集群(Lite Cluster)”,进入“轻量算力集群 (Lite Cluster)”页面。