检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
STATEMENT_WLMSTAT_COMPLEX_RUNTIME STATEMENT_WLMSTAT_COMPLEX_RUNTIME视图显示和当前用户执行作业正在运行时的负载管理相关信息,如表1所示。 表1 STATEMENT_WLMSTAT_COMPLEX_RUNTIME字段
执行“执行Docker命令”步骤,参数错误问题 问题现象 日志信息提示“requires exactly 1 argument”。 日志信息提示“unknown shorthand flag”。 原因分析 部署“执行Docker命令”步骤时,命令中的参数未填写或填写错误。 处理方法
执行“执行Docker命令”步骤,关于权限不够问题 问题现象 部署主机相关的应用时,出现“权限不够”日志提示时,说明当前用户对当前文件或文件夹没有操作权限。 原因分析 当前用户对当前文件或文件夹没有操作权限。 处理方法 采用对当前用户可以访问的文件。 使用权限更高的用户,如:root。
执行“安装/卸载Docker”步骤,关于参数含反斜杠“\”(特例)问题 问题现象 当部署主机相关的应用时,出现如下日志: 以路径为例,有以下几种常见现象: 输入的路径参数有“\b”特殊字符导致部署报错,如下图所示。 图1 日志信息 输入的路径参数有“\f”特殊字符导致部署报错,如下图所示。
执行“安装/卸载Docker”步骤,关于windows主机部署应用失败问题 问题现象 日志信息提示如下图所示。 图1 日志信息 原因分析 由于windows主机连通性验证时,缺失指定补丁包导致。 处理方法 按照windows配置文档重新进行连通性验证 。 父主题: 安装/卸载Docker
聚合操作 Union/Union ALL/Intersect/Except 语法格式 1 query UNION [ ALL ] | Intersect | Except query 语法说明 UNION返回多个查询结果的并集。 Intersect返回多个查询结果的交集。 Except返回多个查询结果的差集。
JOIN Equi-join 语法格式 1 2 FROM tableExpression INNER | LEFT | RIGHT | FULL JOIN tableExpression ON value11 = value21 [ AND value12 = value22]
登录RDS实例时能使用加密密码认证吗 登录云数据库RDS实例时,直接使用在界面上设置的密码认证,不支持使用加密密码认证。 父主题: 产品咨询
DDL操作对磁盘空间的要求 为了确保业务正常,您应该避免在业务高峰进行DDL(Data Definition Language)等可能导致磁盘空间暴增的操作。必须进行DDL操作时,请务必确保磁盘空间大于等于表空间两倍大小+10GB,即:假设您的表空间为500GB,那么,您在进行D
安装RemoteApp程序 V3.3.26.0及以上版本需要在应用发布服务器中安装RemoteAppProxy跳板工具。 前提条件 已获取服务器管理员账号与密码。 操作步骤 使用管理员账号登录服务器。 在服务器中,下载RemoteAPPProxyInstaller_xxx.zip(xxx为版本号)压缩包。
安装RemoteApp程序 V3.3.26.0及以上版本需要在应用发布服务器中安装RemoteAppProxy跳板工具。 前提条件 已获取服务器管理员账号与密码。 操作步骤 使用管理员账号登录服务器。 在服务器中,下载RemoteAPPProxyInstaller_xxx.zip(xxx为版本号)压缩包。
添加事件源 添加APIG触发器(每个函数分别创建触发器),通过HTTP请求调用函数。 如图1所示为函数创建APIG专享版触发器,若无可用API实例可单击“创建实例”进入创建页面,并为API实例创建分组。 图1 创建触发器 创建后可以获得一个调用URL,通过这个URL进行函数的调用,如图2所示。
主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导(6.5.901) Ascend-vLLM介绍 支持的模型列表 版本说明和要求 推理服务部署 推理关键特性使用 推理服务精度评测 推理服务性能评测 附录 父主题: LLM大语言模型推理
主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导(6.5.902) Ascend-vLLM介绍 支持的模型列表 版本说明和要求 准备推理环境 启动推理服务 Reasoning Outputs 推理服务精度评测 推理服务性能评测 附录
推理精度测试 本章节介绍如何进行推理精度测试,数据集是ceval_gen、mmlu_gen、math_gen、gsm8k_gen、humaneval_gen。 前提条件 确保容器可以访问公网。 Step1 配置精度测试环境 获取精度测试代码。精度测试代码存放在代码包AscendC
查询导入的PVC 功能介绍 查询指定命名空间下的PVC。 URI GET /api/v1/namespaces/{namespace}/extended-persistentvolumeclaims 表1 Path参数 参数 是否必选 参数类型 描述 namespace Yes String
推理场景介绍 方案概览 本方案介绍了在ModelArts的Lite Server上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬件,为
推理精度测试 本章节介绍如何使用opencompass工具开展语言模型的推理精度测试,数据集是ceval_gen、mmlu_gen、math_gen、gsm8k_gen、humaneval_gen。 约束限制 确保容器可以访问公网。 当前的精度测试仅适用于语言模型精度验证,不适用
推理精度测试 本章节介绍两个精度测评工具。如何使用opencompass工具开展语言模型的推理精度测试,数据集是ceval_gen、mmlu_gen、math_gen、gsm8k_gen、humaneval_gen;以及使用lm-eval工具开展语言模型的推理精度测试,数据集包含
推理精度测试 本章节介绍两个精度测评工具。如何使用opencompass工具开展语言模型的推理精度测试,数据集是ceval_gen、mmlu_gen、math_gen、gsm8k_gen、humaneval_gen;以及使用lm-eval工具开展语言模型的推理精度测试,数据集包含