检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
推理服务性能评测 语言模型推理性能测试 多模态模型推理性能测试 获取模型推理的Profiling数据 父主题: 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导(6.5.902)
推理服务部署 准备推理环境 启动推理服务 父主题: 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导(6.3.912)
量化 W4A16量化 W8A8量化 W8A16量化 kv-cache-int8量化 父主题: 推理关键特性使用
执行训练任务 执行训练任务(推荐) 执行训练任务(历史版本) 父主题: 主流开源大模型基于Lite Server适配MindSpeed-LLM PyTorch NPU训练指导(6.5.901)
查看日志和性能 查看日志 训练过程中,训练日志会在最后的Rank节点打印。 图1 打印训练日志 训练完成后,如果需要单独获取训练日志文件,可以在${OUTPUT_SAVE_DIR}/log路径下获取。 查看性能 训练性能主要通过训练日志中的2个指标查看,吞吐量和loss收敛情况。
训练脚本说明参考 训练参数配置说明【旧】 训练tokenizer文件说明 断点续训和故障快恢说明 父主题: 主流开源大模型基于Lite Server适配MindSpeed-LLM PyTorch NPU训练指导(6.5.901)
训练性能测试 流程图 训练性能测试流程图如下图所示: 图1 训练性能测试流程 执行性能比较脚本 完成benchmark启动任务。 进入test-benchmark目录执行命令。 ascendfactory-cli performance <cfgs_yaml_file> --baseline
SFT全参微调训练任务 Step1 上传训练权重文件和数据集 如果在准备代码和数据阶段已经上传权重文件和数据集到容器中,可以忽略此步骤。 如果未上传训练权重文件和数据集到容器中,具体参考上传代码和权重文件到工作环境和上传数据到指定目录章节完成。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。
SFT全参微调训练任务 步骤1 上传训练权重文件和数据集 如果在准备代码和数据阶段已经上传权重文件和数据集到容器中,可以忽略此步骤。 如果未上传训练权重文件和数据集到容器中,具体参考上传代码和权重文件到工作环境和上传数据到指定目录章节完成。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。
建生成的镜像包部署到环境。 单人通过:选择的“审核者”中任意一个同意后即可将构建生成的镜像包部署到环境。 设置“审核者”。 可以选择多个,系统自动加载该账号下所有子账号。 单击“确定”。 简易模板 自动添加“构建”模型,对代码库的源码进行编译构建。 选择“简易模板”。 单击“开始创建”。
在Topic列表页面左上方单击“查看变更任务”,进入“后台任务管理 > 即时任务”页面,当任务的“状态”为“成功”时,表示分区平衡完成。 定时任务 系统自动跳转到“后台任务管理 > 定时任务”页面,此页面的状态仅表示定时任务是否开始执行,并非表示任务是否执行成功。 当“状态”为“待执行”时,表示定时分区平衡任务未执行。
bigint 当前节点上高速缓存中发现的磁盘块的个数,即缓存中命中的块数(只包括GaussDB(DWS)缓冲区高速缓存,不包括文件系统的缓存)。 tup_returned bigint 当前节点上该数据库查询返回的行数。 tup_fetched bigint 当前节点上该数据库查询抓取的行数。
提示"error_msg":"Incorrect IAM authentication information: verify aksk signature fail","error_code":"APIG.0301",是因为AK/SK认证失败,请检查AK/SK是否正确、账号是否因欠费等原因
测试验证场景说明 场景 验证方法 华为云日志接入安全云脑 请在“安全分析”中查看是否存在已接入云服务日志。 安全云脑日志转出至第三方系统/产品 请在第三方系统/产品侧确认日志是否接收成功。 第三方(非华为云)日志接入安全云脑 参考本章节进行验证。 测试验证 在安全云脑控制台的采集通道中查看数据。
切换到Android系统并拉起应用 REST URL格式 访问方法 URI POST https://ip/action.cgi?ActionID=WEB_SwitchAndroidWithPackage 接口功能 切换到android系统时可以调用该接口 接口说明 接口用于切换到Android系统并将应用拉起到前台
bigint 当前节点上高速缓存中发现的磁盘块的个数,即缓存中命中的块数(只包括GaussDB(DWS)缓冲区高速缓存,不包括文件系统的缓存)。 tup_returned bigint 当前节点上该数据库查询返回的行数。 tup_fetched bigint 当前节点上该数据库查询抓取的行数。
该字段不存在时,云硬盘默认为不加密。 hw:passthrough String true表示云硬盘的设备类型为SCSI类型,即允许ECS操作系统直接访问底层存储介质。支持SCSI锁命令。 false表示云硬盘的设备类型为VBD (虚拟块存储设备 , Virtual Block De
One)和企业微信OA系统需要互通的场景主要为销售、采购、库存领域的单据审批场景,以某个项目为例,需要对接的场景分别为库存收货、库存发货、采购报价单的审批。具体场景描述参考如下。 应用场景 应用场景描述 单据名称 数据流向 库存发货单类型为‘部门领用’ 用户在SparkPackERP系统创建类型
SUMMARY_STAT_XACT_SYS_TABLES 显示集群内所有节点的Schema中系统表的事务状态统计信息(在CN节点使用,按表名对每个节点中表的事务状态统计信息汇总求和),如表1所示。 表1 SUMMARY_STAT_XACT_SYS_TABLES字段 名称 类型 描述
FunctionGraph Administrator 存储管理组 账号 该组成员负责统一管理和运维账号下所有的存储资源,包括云硬盘、对象存储、弹性文件系统等;同时负责管理备份容灾资源,如云备份、存储容灾服务等 EVS FullAccess OBS Administrator SFS FullAccess