检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
rolcreatedb boolean - 该角色是否可以创建数据库。 rolcatupdate boolean - 该角色是否可以直接更新系统表。只有usesysid=10的初始系统管理员拥有此权限。其他用户无法获得此权限。 rolcanlogin boolean - 该角色是否可以登录数据库。 rolreplication
错误码。 最小长度:1 最大长度:128 状态码: 500 表7 响应Body参数 参数 参数类型 描述 error_msg String 系统内部错误。 最小长度:1 最大长度:128 error_code String 错误码。 最小长度:1 最大长度:128 请求示例 POST
如需查看某个实例的详细信息,可以单击任一实例名称,进入实例图页面,可查看实例流程图、流程节点、运行开始时间、结束时间等信息。 表1 实例列表参数 参数名称 参数说明 实例名称 系统生成的实例的名称。 剧本名称 实例对应的剧本名称。 数据类 剧本的运营对象,即数据类。 触发方式 实例的触发方式。 定时触发 事件触发 状态
审批流查询(ApprovalRequests) 接口地址 /id/b1s/v1/ ApprovalRequests 接口API功能描述 查询审批流信息 调用方式 Get 请求地址参数 参数名称 参数说明 地址示例 () 在地址中加入(审批流唯一标识-Code)返回指定单据 /id
草稿单审批(ApprovalRequests) 接口地址 /id/b1s/v1/ApprovalRequests(x) 接口API功能描述 发送审批流审批结果 调用方式 patch 请求地址参数 参数名称 参数说明 地址示例 () 在地址中加入(审批流唯一标识-Code)审批指定单据
整数、枚举型和文本型全局变量添加 操作步骤 登录性能测试服务控制台,在左侧导航栏中选择“PerfTest测试工程”。 在待编辑PerfTest测试工程所在行,单击工程名称进入测试工程详情页面。 选择“测试用例”页签,单击“全局变量”。 通过手工输入方式添加全局变量。 单击“添加变量”。
部署组件到指定CCE集群 本章节指导您部署组件到使用前准备时已经创建好的指定环境(例如:env-cce-az1)下的CCE集群。 操作步骤 登录ServiceStage控制台。 单击“应用管理”,进入应用列表。 单击创建应用时创建的应用名称(例如:test-app)“操作”栏的“新增组件”。
查看日志和性能 查看日志 训练过程中,训练日志会在最后的Rank节点打印。 图1 打印训练日志 训练完成后,如果需要单独获取训练日志文件,可以在${SAVE_PATH}/logs路径下获取。 本示例日志路径为/home/ma-user/ws/saved_dir_for_ma_output/Qwen-14B/logs
准备环境 本文档中的模型运行环境是ModelArts Lite的DevServer。请参考本文档要求准备DevServer机器。 资源规格要求 计算规格:单机训练需要使用单机8卡,多机训练需要使用2机16卡。 硬盘空间:至少200GB。 Ascend资源规格: Ascend: 1
准备数据(可选) 此小节为自定义数据集执行过程,如非自定义数据集此小节忽略。 本教程使用到的是LLamaFactory代码包自带数据集。您也可以自行准备数据集,目前支持alpaca格式和sharegpt格式的微调数据集;使用自定义数据集时,请更新代码目录下data/dataset_info
训练中的权重转换说明 以 llama2-13b 举例,运行 0_pl_pretrain_13b.sh 脚本。脚本同样还会检查是否已经完成权重转换的过程。 若已完成权重转换,则直接执行预训练任务。若未进行权重转换,则会自动执行 scripts/llama2/2_convert_mg_hf
使用AWQ量化 AWQ(W4A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见表3。 本章节介绍如何使用AWQ量化工具实现推理量化。 量化方法:per-group Step1 模型量化 可以在Huggingfac
使用SmoothQuant量化 SmoothQuant(W8A8)量化方案能降低模型显存以及需要部署的卡数。也能同时降低首token时延和增量推理时延。支持SmoothQuant(W8A8)量化的模型列表请参见表3。 本章节介绍如何使用SmoothQuant量化工具实现推理量化。
使用GPTQ量化 当前版本使用GPTQ量化仅支持W8A16 perchannel的量化形式,使用W8A16的量化不仅可以保证精度在可接受的范围内,同时也有一定的性能收益。 GPTQ W8A16量化支持的模型请参见表3。 本章节介绍如何在GPU的机器上使用开源GPTQ量化工具GPTQ
附录:大模型推理常见问题 问题1:在推理预测过程中遇到NPU out of memory。 解决方法:调整推理服务启动时的显存利用率,将--gpu-memory-utilization的值调小。 问题2:在推理预测过程中遇到ValueError:User-specified max_model_len
参考如何进入经典开发环境中操作,开发者登录要进行应用代码托管的AstroZero开发环境,在首页上方单击“管理”,进入经典版管理中心。 在左侧导航栏中,选择“系统管理 > 代码库配置”。 在右侧租户级代码库配置页面,单击,参考表1设置对接参数,单击“保存”。 图7 配置对接参数 表1 代码仓参数说明
BPM元数据中定义的变量,包括自定义变量和系统变量, key-value形式,key为变量名字,value为变量的值。如果需要在启动BPM前设置BPM的变量,可以填写该参数。如需启动时设置变量,可以在variables中设置系统变量$Flow.BusinessKey;如需设置工作流的title,可以设置系统变量$Flow
逻辑。当选择该类型时,您需要配置具体的事件以及条件规则。 标签:新建服务编排的标签名,用于在界面展示。 名称:服务编排在系统中的唯一标识,创建后不支持修改。系统会自动在名称前添加“{命名空间}__”,当其他功能调用服务编排时,调用的是服务编排的名称,而不是标签。 描述:新建服务编
是否必填 默认值 输出分隔符 配置分隔符。 string 是 无 换行符 用户根据数据实际情况,填写字符串作为换行符。支持任何字符串。默认使用操作系统的换行符。 string 否 \n 输出字段 配置输出信息: 位置:配置输出字段的位置。 字段名:配置输出字段的字段名。 类型:配置字段类
GS_JOB_ATTRIBUTE GS_JOB_ATTRIBUTE系统表提供了DBE_SCHEDULER定时任务的相关属性信息,其中包括定时任务,定时任务类,证书,授权,程序和调度的基本属性。新安装数据库实例普通用户无权限访问。 表1 GS_JOB_ATTRIBUTE字段 名称 类型