检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Studio平台,进入所需空间。 在左侧导航栏中选择“应用接入”,单击界面右上角“创建应用接入”。 在“关联服务”中,选择“全部服务”,或者在“指定服务”中选择已部署好的大模型服务,单击“确定”。 在“应用接入”列表的“API Key”操作列中可获取API Key值。 父主题: 如何调用REST
Pangu-CV-语义分割-2.1.0 功能介绍 将数字图像细分为多个图像子区域,适用于车道分割、建筑分割、选煤厂筛面状态识别等任务。 服务调用方式: 支持图片推理。 图片推理支持在线和边缘部署。 URI POST /v1/{project_id}/infer-api/proxy
身份认证与访问控制 用户可以通过调用REST网络的API来访问盘古大模型服务,有以下两种调用方式: Token认证:通过Token认证调用请求。 AK/SK认证:通过AK(Access Key ID)/SK(Secret Access Key)加密调用请求。经过认证的请求总是需要
在左侧导航栏中选择“模型开发 > 模型部署”。 获取已部署模型的调用路径。在“我的服务”页签,单击状态为“运行中”的模型名称,在“详情”页签,可获取模型调用路径,如图2。 图2 获取已部署模型的调用路径 获取预置服务的调用路径。在“预置服务”页签中,选择所需调用的科学计算大模型,单击“调用路径”,在“
创建预测大模型评测任务参数说明 参数分类 参数名称 参数说明 选择服务 评测类型 选择“预测大模型”。 评测模型 当前支持预测大模型如下模型场景: 回归表格 分类表格 异常检测表格 回归时序 分类时序 异常检测时序 服务来源 当前仅支持已部署服务 已部署服务:选择部署至ModelArts Studio平台的模型进行评测。
区域项目、全局服务资源。 可以选择“指定区域项目资源”,如指定“西南-贵阳一”区域,即用户组内的IAM用户仅可使用该区域项目中的资源。 可以选择“全局服务资源”,即服务部署时不区分区域,访问全局级服务,不需要切换区域,全局服务不支持基于区域项目授权。如对象存储服务(OBS)、内容分发网络(CDN)等。
Studio平台中,使用数据工程构建三方大模型数据集流程见表1。 表1 三方大模型数据集构建流程 流程 子流程 说明 操作指导 导入数据至盘古平台 创建导入任务 将存储在OBS服务或本地的数据导入至平台统一管理,用于后续加工或发布操作。 说明:执行导入操作时,数据集类型选择“其他”。 导入数据至盘古平台 加工其他类数据集
多模态大模型人工评测任务参数说明 参数分类 参数名称 参数说明 评测对象 评测类型 选择“多模态大模型”。 服务来源 支持已部署服务、外部服务两种选项。单次最多可评测10个模型。 已部署服务:选择部署至ModelArts Studio平台的模型进行评测。 评测配置 评测指标 由用户自定义评测指标并填写评测标准。
包周期资源到期后,如果您想继续使用服务,需要在保留期内进行手动续费,否则不能再对已过保留期的服务进行续费操作,需重新购买对应的服务。了解更多关于续费的信息,请参见续费。 欠费 在使用云服务时,账户的可用额度小于待结算的账单,即被判定为账户欠费。欠费后,可能会影响云服务资源的正常运行,需要及时充值。详细介绍请参见欠费说明。
件、软件、介质、虚拟机、操作系统、数据等)由客户完全控制向客户与华为云共同控制转变,这也就意味着客户需要承担的责任取决于客户所选取的云服务。如图1所示,客户可以基于自身的业务需求选择不同的云服务类别(例如IaaS、PaaS、SaaS服务)。不同的云服务类别中,每个组件的控制权不同
Pangu-CV-物体检测-S-3.1.0 功能介绍 盘古计算机视觉物体检测大模型,任务是找出图像中所有感兴趣的目标,确定它们的位置和类别。 服务调用方式: 支持图片推理。 图片推理支持在线和边缘部署。 URI POST /v1/{project_id}/infer-api/prox
全量升级:新旧版本服务同时运行,直至新版本完全替代旧版本。在新版本部署完成前,旧版本仍可使用。需要该服务所消耗资源的2倍,用于保障全量一次性升级。 滚动升级:部分实例资源空出用于滚动升级,逐个或逐批停止旧版本并启动新版本。滚动升级时可修改实例数。选择缩实例升级时,系统会先删除旧版本,再进行升级,期间旧版本不可使用。
导入数据过程中,为什么无法选中OBS的单个文件进行上传 当前,ModelArts Studio平台针对不同类别的数据集可使用OBS服务导入的文件形式不同: 文本、视频、预测和其他类(自定义)数据集支持文件夹或单个文件导入,导入界面提示用户:“请选择文件夹或文件”。 图1 支持导入单个文件示例
Embedding模型 功能介绍 Embedding模型服务在创建知识库中,文本处理阶段,用于对文本文档进行前片,转换成向量化表示。在知识检索阶段,根据用户输入的query对切片进行召回。 URI 获取URI方式请参见请求URI。 POST /pangu/search/v1/vector/query
订单的购买周期计费,适用于可预估资源使用周期的场景。 按需计费模式:按需付费是后付费方式,可以随时开通/关闭对应资源,支持秒级计费,系统会根据云服务器的实际使用情况每小时出账单,并从账户余额里扣款。 父主题: 计费FAQ
明(基于规则) 参数分类 参数名称 参数说明 选择服务 评测类型 选择“大语言模型”。 服务来源 当前仅支持通过“外部服务”调用API做评测。单次最多可评测10个模型。 外部服务:通过API的方式接入外部模型进行评测。选择外部服务时,需要填写外部模型的接口名称、接口地址、请求体、响应体等信息。
安全护栏 安全护栏 关闭:推理服务不调用安全护栏。 开启并同意授权:在使用推理服务时用户输入和模型输出均会调用盘古安全护栏,保障模型服务安全。 资源配置 计费模式 限时免费模式。 实例数 设置部署模型时所需的实例数。 订阅提醒 订阅提醒 该功能开启后,系统将在任务状态更新时,通过短信或邮件将提醒发送给用户。
全量升级:新旧版本服务同时运行,直至新版本完全替代旧版本。在新版本部署完成前,旧版本仍可使用。需要该服务所消耗资源的2倍,用于保障全量一次性升级。 滚动升级:部分实例资源空出用于滚动升级,逐个或逐批停止旧版本并启动新版本。滚动升级时可修改实例数。选择缩实例升级时,系统会先删除旧版本,再进行升级,期间旧版本不可使用。
全量升级:新旧版本服务同时运行,直至新版本完全替代旧版本。在新版本部署完成前,旧版本仍可使用。需要该服务所消耗资源的2倍,用于保障全量一次性升级。 滚动升级:部分实例资源空出用于滚动升级,逐个或逐批停止旧版本并启动新版本。滚动升级时可修改实例数。选择缩实例升级时,系统会先删除旧版本,再进行升级,期间旧版本不可使用。
频流地址} 模型推理结果需在容器日志中查询,远程登录到部署服务器后,执行docker ps命令获取容器列表及其信息。 记录部署任务名称,进入ModelArts服务的模型部署导航栏中按照模型的部署形式,进入在线服务、边缘服务页签按照任务名称找到对应的任务ID。按创建部署任务时生成的