检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建并挂载SFS Turbo SFS Turbo为用户提供按需扩展的高性能共享文件存储,还具备高可靠和高可用的特点,支持根据业务需要弹性扩容,且性能随容量增加而提升,可广泛应用于多种业务场景。 在SFS服务控制台上创建文件系统,具体步骤请参考创建SFS Turbo文件系统。同一区域不同
创建并挂载SFS Turbo SFS Turbo为用户提供按需扩展的高性能共享文件存储,还具备高可靠和高可用的特点,支持根据业务需要弹性扩容,且性能随容量增加而提升,可广泛应用于多种业务场景。 在SFS服务控制台上创建文件系统,具体步骤请参考创建SFS Turbo文件系统。同一区域不同
如果使用SFS服务作为存储方案,推荐使用SFS Turbo文件系统。SFS Turbo提供按需扩展的高性能文件存储,还具备高可靠和高可用的特点,支持根据业务需要弹性扩容,且性能随容量增加而提升,可广泛应用于多种业务场景。 在SFS服务控制台上创建文件系统,具体步骤请参考创建SFS Turbo文件系统。同一区域不同
步骤五:Lite Cluster节点主机挂载SFS Turbo文件系统 在弹性文件服务SFS控制台左侧导航栏选择“SFS Turbo”,单击步骤二:创建SFS Turbo文件系统创建的SFS Turbo文件系统名称,进入SFS Turbo文件系统详情界面,复制“Linux挂载命令”。 图5
如果使用SFS服务作为存储方案,推荐使用SFS Turbo文件系统。SFS Turbo提供按需扩展的高性能文件存储,还具备高可靠和高可用的特点,支持根据业务需要弹性扩容,且性能随容量增加而提升,可广泛应用于多种业务场景。 在SFS服务控制台上创建文件系统,具体步骤请参考创建SFS Turbo文件系统。同一区域不同
创建并挂载SFS Turbo SFS Turbo为用户提供按需扩展的高性能共享文件存储,还具备高可靠和高可用的特点,支持根据业务需要弹性扩容,且性能随容量增加而提升,可广泛应用于多种业务场景。 在SFS服务控制台上创建文件系统,具体步骤请参考创建SFS Turbo文件系统。同一区域不同
Server列表中,单击右侧下的““切换操作系统””或“重置操作系统”,在弹出的确认对话框中,确认信息无误,然后单击“确定”,完成操作。 此时Lite Server节点或超节点的状态显示“切换操作系统中”或“重置操作系统中”。 在BMS控制台切换操作系统 获取操作系统镜像。 由云服务官方提供给客户操作系统镜像,在I
购买Snt9b23服务器时,需确保这些服务器实例处于同一超节点网络中。超节点内联通速度更高,优先购买一个较大规格的超节点。 建议配置系统盘空间不少于500GB,建议购买时配置1T以上数据盘空间。 推荐使用SFS Turbo存储模型文件,可不购买或减小数据盘大小。 购买与开通Lite Server资源操作 具体操作请参见Lite
空间。 权重文件存储规划 推荐使用SFS Turbo文件系统存储模型权重文件 选择SFS Turbo文件系统“1000MB/s/TiB”的规格或更高,容量为1.2TB起步且必须为1.2的倍数。容量推荐选择6TB以上,以减少权重加载时间。权重加载时间估算方法参考下述公式: 权重加载时间(s)
删除DevServer超节点标签 查询DevServer超节点标签 重装DevServer服务器操作系统镜像 切换DevServer服务器操作系统镜像 切换DevServer超节点服务器操作系统镜像 查询用户所有超节点实例详情 删除DevServer超节点实例 重启DevServer实例
存储配置 创建并挂载SFS Turbo 创建并挂载EVS(可选) 父主题: 准备Server资源环境
Service仅用于快速验证功能是否正常,正式调用从APIG入口。 推理层的模型权重存储使用SFS Turbo共享文件系统,并挂载至每个节点;同时对于KubeInfer实例Pod,使用hostPath方式访问挂载至节点目录的SFS Turbo目录。【可选】推理层的模型权重可使用EVS云硬盘。 推理层通过Mod
空间。 权重文件存储规划 推荐使用SFS Turbo文件系统存储模型权重文件 选择SFS Turbo文件系统“1000MB/s/TiB”的规格或更高,容量为1.2TB起步且必须为1.2的倍数。容量推荐选择6TB以上,以减少权重加载时间。权重加载时间估算方法参考下述公式: 权重加载时间(s)
制作的镜像仅支持基于Lite Server当前的操作系统制作新的镜像,不支持其他场景制作镜像,例如从ISO开始制作等。 制作操作系统步骤 制作操作系统镜像前需要先清理一些临时文件,否则会导致镜像运行故障。登录Server服务器中,清理操作系统中临时文件。可以执行以下命令,也可以制作成脚本
Standard弹性集群运行环境中存储分为OBS桶和SFS Turbo共享盘,根据存储的不同,数据上传地址有差异,客户根据实际选择。 OBS桶 SFS Turbo共享盘 OBS桶 本地完成代码包AscendCloud-LLM-xxx.zip的解压。 # Linux系统 unzip AscendCloud-*
Standard弹性集群运行环境中存储分为OBS桶和SFS Turbo共享盘,根据存储的不同,数据上传地址有差异,客户根据实际选择。 OBS桶 SFS Turbo共享盘 OBS桶 本地完成代码包AscendCloud-LLM-xxx.zip的解压。 # Linux系统 unzip AscendCloud-*
return region_id def gen_collect_gpu_log_shell(self): collect_gpu_log_shell = "nvidia-bug-report.sh" return collect_gpu_log_shell
log.") if self.is_300_iduo: return collect_npu_log_shell return collect_npu_log_shell + hccn_tool_log_shell
REBOOT_FAILED: 重启失败 CHANGINGOS: 切换操作系统中 CHANGINGOS_FAILED: 切换操作系统失败 REINSTALLINGOS: 重装操作系统中 REINSTALLINGOS_FAILED: 重装操作系统失败 vpc_id String 参数解释:实例所在虚拟私有云ID。
参数类型 描述 size 否 Integer 参数解释:系统盘大小。表示分配给系统盘的存储空间大小。 约束限制:不涉及。 取值范围:100 - 1024 GB 默认取值:不涉及。 type 否 String 参数解释:系统盘类型。表示系统盘的存储类型。 约束限制:不涉及。 取值范围: ESSD:极速型SSD云硬盘