检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数据保护技术 盘古大模型服务通过多种数据保护手段和特性,保障存储在服务中的数据安全可靠。 表1 盘古大模型的数据保护手段和特性 数据保护手段 简要说明 传输加密(HTTPS) 盘古服务使用HTTPS传输协议保证数据传输的安全性。 基于OBS提供的数据保护 基于OBS服务对用户的数据进行存
], "temperature": 0.9, "max_tokens": 600 } 单击Postman界面“Send”,发送请求。当接口返回状态为200时,表示NLP大模型API调用成功。 API Key鉴权说明 当用户部署的API服务期望开放给其他用户调用时,原有Token认证无法支持,
temperature 否 Float 参数解释: 用于控制生成文本的多样性和创造力。参数的取值范围是0到1,其中0表示最低的随机性。一般来说,temperature越低,适合完成确定性的任务。temperature越高,如0.9,适合完成创造性的任务。temperature参数可以
组授权,才能使得用户组中的用户获得对应的权限。授权后,用户就可以基于被授予的权限对云服务进行操作。 服务使用OBS存储训练数据和评估数据,如果需要对OBS的访问权限进行细粒度的控制。可以在盘古服务的委托中增加Pangu OBSWriteOnly、Pangu OBSReadOnly策略,控制OBS的读写权限。
大模型概念类 如何对盘古大模型的安全性展开评估和防护 训练智能客服系统大模型需考虑哪些方面
提示词应用示例 应用提示词实现智能客服系统的意图匹配 应用提示词生成面试题目 父主题: 提示词写作实践
提示词写作进阶技巧 设置背景及人设 理解底层任务 CoT思维链 考察模型逻辑 父主题: 提示词写作实践
商业化落地,打造工业级盘古解决方案。 最全工具链平台 ModelArts Studio大模型开发平台打造业界最强、最全的大模型工具链平台,数据工程、评测中心、模型开发、Agent开发等沉淀华为大模型开发先进经验,做到国内行业首选工具链平台。 零代码开发平台 ModelArts S
对于包年/包月计费模式的资源,用户在购买时会一次性付费,服务将在到期后自动停止使用。 如果在计费周期内不再使用包年/包月资源,您可以执行退订操作,系统将根据资源是否属于五天无理由退订、是否使用代金券和折扣券等条件返还一定金额到您的账户。详细的退订规则请参见云服务退订规则概览。 按需计费资源 对于按需
进行原因分析,多数场景下的问题可以通过日志报错信息直接定位。 如果推理服务部署失败或者在运行过程中异常崩溃,ModelArts Studio会自动识别导致推理服务异常的原因,可首先在服务详情-事件-模型|服务中查看对应的异常报错信息。 更详细的日志,可以查看日志页签,并通过搜索过
储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region,通用Region指面向公共租户提供通用云服务的Region;专属Region指只承载同一类业务或只面向特定租户提供业务服务的专用Region。 详情请参见区域和可用区。 可用区(AZ,Availability
模型部署”,在“我的服务”页签,模型部署列表单击模型名称,在“详情”页签中,可获取模型的请求URI。 图1 部署后的模型调用路径 若调用的是用户自己部署的NLP推理服务,可在“API调用”页签中,可获取V1接口URL或者V2接口URI。 图2 NLP服务的调用路径 若调用预置模型,可在左侧导航栏中选择“模型开发
管理加工算子 系统预置加工算子介绍 自定义数据集加工算子 父主题: 加工数据集
temperature 否 Float 参数解释: 用于控制生成文本的多样性和创造力。参数的取值范围是0到1,其中0表示最低的随机性。一般来说,temperature越低,适合完成确定性的任务。temperature越高,如0.9,适合完成创造性的任务。temperature参数可以
通过NLP大模型对传统的客服系统进行智能化升级,提升智能客服的效果。 企业原智能客服系统: 仅支持回复基础的FAQ,无语义泛化能力,意图理解能力弱,转人工频率极高。 面对活动等时效性场景,智能客服无回答能力。 使用NLP大模型对客服系统升级后: 大模型智能客服可以7x24小时不间断服务,相较于人工
欠费说明 在使用云服务时,如果账户的可用额度低于待结算账单金额,即被判定为账户欠费。欠费可能会影响云服务资源的正常运行,因此需要及时充值。预付费模式购买后不涉及欠费。 服务按时长计费的,当余额不足以支付当前费用时,账户将被判定为欠费。由于盘古大模型不涉及物理实体资源,因此无宽限期
HTTP请求方法,表示服务正在请求操作类型,包括: GET:请求服务器返回指定资源。 PUT:请求服务器更新指定资源。 POST:请求服务器新增资源或执行特殊操作。 DELETE:请求服务器删除指定资源,如删除对象等。 HEAD:请求服务器资源头部。 PATCH:请求服务器更新资源的部分
如果当前用户所在用户组未获取全部云服务管理员(Tenant Administrator)授权,则无法创建工作空间。 创建空间前,请参考创建用户组及创建盘古子用户步骤,赋予当前用户组“全部云服务管理员(Tenant Administrator)”权限,或创建具有“全部云服务管理员(Tenant
默认取值: 不涉及 model V1推理接口:否 V2推理接口:是 String 参数解释: 使用的推理服务模型名称,为推理服务部署时指定的Deployed_Model,可在推理服务详情页面查询到。V2推理接口必须指定此参数,V1推理接口不需要此参数。 约束限制: 不涉及 取值范围:
ModelArts Studio平台支持从OBS服务导入数据。您可以将本地数据上传至OBS(对象存储服务),然后通过平台提供的“数据导入”功能,将存储在OBS中的数据导入至平台进行使用。 具体操作步骤如下: 上传数据至OBS:将本地数据上传至OBS服务,请详见通过控制台快速使用OBS。 使