检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
DDL操作对磁盘空间的要求 为了确保业务正常,您应该避免在业务高峰进行DDL(Data Definition Language)等可能导致磁盘空间暴增的操作。必须进行DDL操作时,请务必确保磁盘空间大于等于表空间两倍大小+10GB,即:假设您的表空间为500GB,那么,您在进行D
安装RemoteApp程序 V3.3.26.0及以上版本需要在应用发布服务器中安装RemoteAppProxy跳板工具。 前提条件 已获取服务器管理员账号与密码。 操作步骤 使用管理员账号登录服务器。 在服务器中,下载RemoteAPPProxyInstaller_xxx.zip(xxx为版本号)压缩包。
安装RemoteApp程序 V3.3.26.0及以上版本需要在应用发布服务器中安装RemoteAppProxy跳板工具。 前提条件 已获取服务器管理员账号与密码。 操作步骤 使用管理员账号登录服务器。 在服务器中,下载RemoteAPPProxyInstaller_xxx.zip(xxx为版本号)压缩包。
添加事件源 添加APIG触发器(每个函数分别创建触发器),通过HTTP请求调用函数。 如图1所示为函数创建APIG专享版触发器,若无可用API实例可单击“创建实例”进入创建页面,并为API实例创建分组。 图1 创建触发器 创建后可以获得一个调用URL,通过这个URL进行函数的调用,如图2所示。
推理场景介绍 方案概览 本方案介绍了在ModelArts的Lite Server上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬件,为
推理精度测试 本章节介绍如何使用opencompass工具开展语言模型的推理精度测试,数据集是ceval_gen、mmlu_gen、math_gen、gsm8k_gen、humaneval_gen。 约束限制 确保容器可以访问公网。 当前的精度测试仅适用于语言模型精度验证,不适用
推理精度测试 本章节介绍两个精度测评工具。如何使用opencompass工具开展语言模型的推理精度测试,数据集是ceval_gen、mmlu_gen、math_gen、gsm8k_gen、humaneval_gen;以及使用lm-eval工具开展语言模型的推理精度测试,数据集包含
推理精度测试 本章节介绍两个精度测评工具。如何使用opencompass工具开展语言模型的推理精度测试,数据集是ceval_gen、mmlu_gen、math_gen、gsm8k_gen、humaneval_gen;以及使用lm-eval工具开展语言模型的推理精度测试,数据集包含
主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导(6.5.901) Ascend-vLLM介绍 支持的模型列表 版本说明和要求 推理服务部署 推理关键特性使用 推理服务精度评测 推理服务性能评测 附录 父主题: LLM大语言模型推理
主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导(6.5.902) Ascend-vLLM介绍 支持的模型列表 版本说明和要求 准备推理环境 启动推理服务 Reasoning Outputs 推理服务精度评测 推理服务性能评测 附录
推理精度测试 本章节介绍如何进行推理精度测试,数据集是ceval_gen、mmlu_gen、math_gen、gsm8k_gen、humaneval_gen。 前提条件 确保容器可以访问公网。 Step1 配置精度测试环境 获取精度测试代码。精度测试代码存放在代码包AscendC
查询导入的PVC 功能介绍 查询指定命名空间下的PVC。 URI GET /api/v1/namespaces/{namespace}/extended-persistentvolumeclaims 表1 Path参数 参数 是否必选 参数类型 描述 namespace Yes String
使用Keytab文件进行JDBC安全认证 功能简介 使用keytab文件进行JDBC认证。 准备操作 登录FusionInsight Manager,选择“系统 > 权限 > 用户”,下载参考准备MRS应用开发用户准备的开发用户的认证凭据。 代码样例 以下代码片段仅为演示,具体代码参见“com.huawei
检查containerd是否安装 在创建CCE集群时,会选择 containerd 作为容器引擎,并默认给机器安装。如尚未安装,说明机器操作系统安装错误。需要重新纳管机器,重新安装操作系统。 安装nerdctl工具。nerdctl是containerd的一个客户端命令行工具,使用方式和docker命令基本一致,可用于后续镜像构建步骤中。
SparkPack 企业ERP创建生产收货接口 步骤1 同上步骤1 步骤2 选择执行动作-创建执行动作,填写“基本信息”,“配置输入”,“配置输出”: 基本信息: 配置输入: 输入字段较多,可以通过导入请求样例json快速添加。 配置输出: 步骤3 保存。 父主题: SparkPack
SparkPackERP查询审批流接口 集成工作台-连接器,选择刚创建的SparkPackERP连接器,进入连接器详情页面 选择执行动作-创建执行动作,填写“基本信息”,“请求信息”,“响应信息”: 基本信息填入“执行动作ID”、“执行动作名称”、“描述”信息,如下执行动作名称为“查询审批流”;
STAT_SYS_INDEXES 显示当前节点pg_catalog、information_schema以及pg_toast模式中所有系统表的索引状态信息。 表1 STAT_SYS_INDEXES字段 名称 类型 描述 relid oid 该索引的表的OID。 indexrelid
提供整个集群中所有正常节点下的操作系统运行状态信息,如表1所示。 表1 GLOBAL_OS_RUNTIME字段 名称 类型 描述 node_name name 节点名称。 id integer 编号。 name text 操作系统运行状态名称。 value numeric 操作系统运行状态值。 comments
STAT_SYS_TABLES 显示当前节点内pg_catalog、information_schema以及pg_toast模式下所有系统表的状态信息。 表1 STAT_SYS_TABLES字段 名称 类型 描述 relid oid 表的OID。 schemaname name 该表所在的Schema名。
采集效率越高。Xmn必须小于等于Xmx -Xmx string 2048M 采集器堆空间的最大值,合理设置这个参数可以避免JVM过度消耗系统资源,从而提高应用程序的稳定性和性能。此值设置过低会导致采集器频繁进行内存回收,影响正常采集能力 -Djruby.jit.threshold