检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数据保护技术 盘古大模型服务通过多种数据保护手段和特性,保障存储在服务中的数据安全可靠。 表1 盘古大模型的数据保护手段和特性 数据保护手段 简要说明 传输加密(HTTPS) 盘古服务使用HTTPS传输协议保证数据传输的安全性。 基于OBS提供的数据保护 基于OBS服务对用户的数据进行存
提示词写作进阶技巧 设置背景及人设 理解底层任务 CoT思维链 考察模型逻辑 父主题: 提示词写作实践
进行原因分析,多数场景下的问题可以通过日志报错信息直接定位。 如果推理服务部署失败或者在运行过程中异常崩溃,ModelArts Studio会自动识别导致推理服务异常的原因,可首先在服务详情-事件-模型|服务中查看对应的异常报错信息。 更详细的日志,可以查看日志页签,并通过搜索过
模型部署”,在“我的服务”页签,模型部署列表单击模型名称,在“详情”页签中,可获取模型的请求URI。 图1 部署后的模型调用路径 若调用的是用户自己部署的NLP推理服务,可在“API调用”页签中,可获取V1接口URL或者V2接口URI。 图2 NLP服务的调用路径 若调用预置模型,可在左侧导航栏中选择“模型开发
temperature 否 Float 参数解释: 用于控制生成文本的多样性和创造力。参数的取值范围是0到1,其中0表示最低的随机性。一般来说,temperature越低,适合完成确定性的任务。temperature越高,如0.9,适合完成创造性的任务。temperature参数可以
组授权,才能使得用户组中的用户获得对应的权限。授权后,用户就可以基于被授予的权限对云服务进行操作。 服务使用OBS存储训练数据和评估数据,如果需要对OBS的访问权限进行细粒度的控制。可以在盘古服务的委托中增加Pangu OBSWriteOnly、Pangu OBSReadOnly策略,控制OBS的读写权限。
通过NLP大模型对传统的客服系统进行智能化升级,提升智能客服的效果。 企业原智能客服系统: 仅支持回复基础的FAQ,无语义泛化能力,意图理解能力弱,转人工频率极高。 面对活动等时效性场景,智能客服无回答能力。 使用NLP大模型对客服系统升级后: 大模型智能客服可以7x24小时不间断服务,相较于人工
大模型概念类 如何对盘古大模型的安全性展开评估和防护 训练智能客服系统大模型需考虑哪些方面
提示词应用示例 应用提示词实现智能客服系统的意图匹配 应用提示词生成面试题目 父主题: 提示词写作实践
None 服务介绍 盘古大模型服务 视频介绍 02:35 了解什么是盘古大模型服务 RAG科普介绍 视频介绍 07:25 RAG检索增强生成 科普介绍 云容器引擎 CCE 服务介绍 03:23 云容器引擎服务介绍 计算 云容器引擎 CCE 熟悉云容器引擎控制台 02:35 熟悉云容器引擎控制台
产品优势 全面的大模型系列 盘古大模型服务支持盘古NLP、CV、多模态、预测、科学计算五大基础模型能力,支持三方大模型的推理与部署,目前已预置DeepSeek R1/V3及Qwen等模型,多种模态逐步融合。 成熟的行业服务 首创大模型分层架构,基于盘古基础大模型训练行业大模型,支
储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region,通用Region指面向公共租户提供通用云服务的Region;专属Region指只承载同一类业务或只面向特定租户提供业务服务的专用Region。 详情请参见区域和可用区。 可用区(AZ,Availability
欠费说明 在使用云服务时,如果账户的可用额度低于待结算账单金额,即被判定为账户欠费。欠费可能会影响云服务资源的正常运行,因此需要及时充值。预付费模式购买后不涉及欠费。 服务按时长计费的,当余额不足以支付当前费用时,账户将被判定为欠费。由于盘古NLP大模型不涉及物理实体资源,因此无
HTTP请求方法,表示服务正在请求操作类型,包括: GET:请求服务器返回指定资源。 PUT:请求服务器更新指定资源。 POST:请求服务器新增资源或执行特殊操作。 DELETE:请求服务器删除指定资源,如删除对象等。 HEAD:请求服务器资源头部。 PATCH:请求服务器更新资源的部分
ModelArts Studio平台支持从OBS服务导入数据。您可以将本地数据上传至OBS(对象存储服务),然后通过平台提供的“数据导入”功能,将存储在OBS中的数据导入至平台进行使用。 具体操作步骤如下: 上传数据至OBS:将本地数据上传至OBS服务,请详见通过控制台快速使用OBS。 使
审计 云审计服务(Cloud Trace Service,CTS)是华为云安全解决方案中专业的日志审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建、配置追踪器后,CTS可记录用户使用盘古的管理事件和数据事件用于审计。
参数解释: 时序任务的历史窗口大小,该参数主要服务于支持多尺度窗口的模型的推理。 约束限制: 填写时需要保证输入序列长度大于等于该值。 取值范围: min:32。 max:与训练模型的历史窗口大小一致,最大不超过512。 默认取值: -1,-1为当前服务模型的默认大小。 响应参数 状态码:
默认取值: 不涉及 model V1推理接口:否 V2推理接口:是 String 参数解释: 使用的推理服务模型名称,为推理服务部署时指定的Deployed_Model,可在推理服务详情页面查询到。V2推理接口必须指定此参数,V1推理接口不需要此参数。 约束限制: 不涉及 取值范围:
创建并管理工作空间 约束限制 如果当前用户所在的用户组未取得全部云服务管理员(Tenant Administrator)授权,则无法创建工作空间。 创建空间前,请参考创建用户组及创建盘古子用户,赋予当前用户组全部云服务管理员权限,或创建具有全部云服务管理员权限的用户组和对应用户。 创建工作空间 创建工作空间步骤如下:
申请试用ModelArts Studio大模型开发平台 盘古大模型服务为用户提供了服务试用,需提交试用申请。 试用申请步骤如下: 登录ModelArts Studio大模型开发平台。 单击“试用咨询”,进入华为云售前咨询页面。 图1 申请试用 填写姓名、联系电话等用户信息,单击“提交申请”进行表单预约。