检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
"content": "介绍下长江,以及长江中典型的鱼类" } ], "temperature": 0.9, "max_tokens": 600 } 综上,您可以使用curl、Postman或直接编写代码等方式发送请求调用
数据加工 > 合成任务”,单击界面右上角“创建合成任务”。 在“创建合成任务”页面,选择需要合成的数据集,选择合成内容与预期合成条数,如图2,系统指定预期合成条数则为数据集初始数据条数。 图2 创建合成任务预期合成数据条数配置 如果合成前的数据集与合成后的数据集结构相同,可选择开启“
计费模式 包周期计费模式属于预付费模式,即先付费再使用。按需计费模式属于后付费模式,即费用根据服务实际消耗量计费,系统将每小时自动扣费。 盘古大模型的计费模式见表1。 表1 计费模式表 计费类别 计费项 计费模式 计费量纲 付费方式 计费周期 模型服务 模型订阅服务 包周期计费 套
盘古大模型服务使用流程 盘古大模型服务简介 盘古大模型服务包含盘古基础大模型、盘古行业大模型与ModelArts Studio大模型开发平台。凭借“模型+开发平台”的产品组合,助力各行业客户实现一站式的大模型开发与应用能力。 ModelArts Studio大模型开发平台是盘古大
rallel数整除。最大可设置为batch_size值。 温度 控制模型推理N条数据的随机性,当temperature趋近于0时,选择最大概率的词;temperature越大,分布越平缓,选择更随机。 核采样 控制模型推理的多样性,取值越大,生成文本的多样性越强。 排序K采样 控
权限管理 如果您需要对华为云上购买的盘古大模型资源,为企业中的员工设置不同的访问权限,以达到不同员工之间的权限隔离,您可以使用统一身份认证服务(IAM)和盘古角色管理功能进行精细的权限管理。 如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户(子用户)进行权限管理,您可
制,表1提供了典型推理参数的建议值和说明,供您参考: 表1 典型推理参数的建议和说明 推理参数 范围 建议值 说明 温度(temperature) 0~1 0.3 温度主要用于控制模型输出的随机性和创造性。温度越高,输出的随机性和创造性越高;温度越低,输出结果越可以被预测,确定性相对也就越高。
decrypt token fail:token解析失败。 token expires:token过期。 verify aksk signature fail:AK/SK认证失败。 x-auth-token not found:未找到x-auth-token参数。 token解析失败
使用数据工程构建NLP大模型数据集 NLP大模型支持接入的数据集类型 盘古NLP大模型仅支持接入文本类数据集,数据集文件内容包括:预训练文本、单轮问答、多轮问答、带人设单轮问答、带人设多轮问答、偏好优化DPO等,同时新增了Reasoner模型,Reasoner模型是一种基于逻辑推
模型名称 prompt 样例 Pangu-NLP-N1-32K-3.1.34 [unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个擅长于文章写作、文本分析、代码编写、数学运算、逻辑推理的AI助手,专注于针对用户
数据工程使用流程 高质量数据是推动大模型不断迭代和优化的根基,它的质量直接决定了模型的性能、泛化能力以及应用场景的适配性。只有通过系统化地准备和处理数据,才能提取出有价值的信息,从而更好地支持模型训练。因此,数据的获取、加工、合成、标注、配比、评估、发布等环节,成为数据开发中不可或缺的重要步骤。
预处理数据 根据3.2.1-获取源数据中描述的方法,可以获得通用和行业的微调数据集,与业界的微调数据格式相同,需要将文本处理为JSONL格式,其中的每一行文本为一个JSON字符串,至少包含两个json key分别表示问题和回答,对应key为 context 和 target,system字段支持自定义人设,为可选。
式,按订单的购买周期计费,适用于可预估资源使用周期的场景。 按需计费模式:按需付费是后付费方式,可以随时开通/关闭对应资源,支持秒级计费,系统会根据云服务器的实际使用情况每小时出账单,并从账户余额里扣款。 父主题: 计费FAQ
数据工程介绍 数据工程介绍 数据工程是ModelArts Studio大模型开发平台(下文简称“平台”)为用户提供的一站式数据处理与管理功能,旨在通过系统化的数据获取、加工、发布等过程,确保数据能够高效、准确地为大模型的训练提供支持,帮助用户高效管理和处理数据,提升数据质量和处理效率,为大模型开发提供坚实的数据基础。
配置MCP服务 Agent平台工具调用支持MCP协议,并提供了一个丰富的MCP服务生态系统,以增强智能体的功能。MCP是一种开放协议,它规范了应用程序向大语言模型提供上下文的方式,平台集成了"高德地图"、"车票查询工具"、"必应搜索"等多种实用MCP服务,开通后可以一键集成调用。
字符长度,若文档平均字符长度大于设置字符,则保留,反之则删除整篇文档。根据如下特征过滤: 待保留的平均句长。 词语特征过滤 词个数表示按照系统词库,对文档进行分词,分词后统计词的总个数,平均词长度为所有词的长度总和除以词总个数,两者都满足则保留当前文档。根据如下特征过滤: 待保留的词个数。
调试应用 开发者可以在单智能体应用搭建完成后,直接与应用进行对话,实时观察其执行过程和响应效果,并根据需要对配置进行优化和调整。平台全链路调试功能,允许开发者查看每条用户请求从输入到响应的完整流程,从而精准定位问题并快速调整配置。 调试应用 创建应用后,平台支持对应用执行过程的进行预览与调试。
模型安全:通过模型动态混淆技术,使模型在运行过程中保持混淆状态,有效防止结构信息和权重信息在被窃取后暴露。 系统安全:通过网络隔离、身份认证和鉴权、Web安全等技术保护大模型系统安全,增强自身防护能力,以抵御外部安全攻击。 父主题: 大模型概念类
评估数据集 数据评估介绍 数据评估旨在通过对数据集进行系统的质量检查,评估其数据质量和代表性等多个维度,发现潜在问题并加以解决。通常来说,数据评估遵循以下方法进行: 质量评估: 数据集质量评估:可以通过抽样评估的方式,随机抽取数据集中的样本,使用人工或自动打分的方式,来对数据集的质量进行打分。
rst = {'result': "success", 'suggestion': "pass"} return rst, 200 dependency文件夹:dependency文件夹为必选项,用于存放基础镜像中未包含或版本不一致的依赖包,可以是