检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
加工数据集 数据加工介绍 ModelArts Studio大模型开发平台提供数据加工功能,涵盖了数据加工、数据合成和数据标注关键操作,旨在确保原始数据符合业务需求和模型训练的标准,是数据工程中的核心环节。 数据加工 通过专用的加工算子对数据进行预处理,确保数据符合模型训练的标准和
Agent开发常见报错与解决方案 工作流常见错误码与解决方案 工作流常见报错及解决方案请详见表1。 表1 工作流节点常见报错与解决方案 模块名称 错误码 错误描述 解决方案 开始节点 101501 开始节点全局配置未传入值。 开始节点错误,请联系客服解决。 结束节点 101531
视频类数据集格式要求 ModelArts Studio大模型开发平台支持创建视频类数据集,创建时可导入多种形式的数据,具体格式要求详见表1。 表1 视频类数据集格式要求 文件内容 文件格式 文件要求 视频 mp4或avi 支持mp4、avi视频格式上传,所有视频可以放在多个文件夹
加工数据集 数据加工介绍 ModelArts Studio大模型开发平台提供数据加工功能,涵盖了数据加工、数据合成和数据标注关键操作,旨在确保原始数据符合业务需求和模型训练的标准,是数据工程中的核心环节。 数据加工 通过专用的加工算子对数据进行预处理,确保数据符合模型训练的标准和
INT4:该压缩策略与INT8相比,可以进一步减少模型的存储空间和计算复杂度。 配置资源。选择计费模式并设置训练单元。 可选择开启订阅提醒。开启后,系统将在本次压缩任务状态变更时,向用户发送短信/邮件提醒。 选择开启自动发布后,模型训练完成的最终产物会自动发布为空间资产,以便对模型进行压缩、部署、评测等操作或共享给其他空间。
NLP大模型训练常见报错与解决方案 NLP大模型训练常见报错及解决方案请详见表1和表2。 表1 NLP大模型训练常见报错与解决方案 常见报错 问题现象 原因分析 解决方案 创建训练任务时,数据集列表为空。 创建训练任务时,数据集选择框中显示为空,无可用的训练数据集。 数据集未发布。
Token计算器 功能介绍 为了帮助用户更好地管理和优化Token消耗,平台提供了Token计算器工具。Token计算器可以帮助用户在模型推理前评估文本的Token数量,提供费用预估,并优化数据预处理策略。 URI POST /v1/{project_id}/deployment
当前展示的完成本次训练所需要的最低训练单元要求。 单实例训练单元数 选择单实例训练单元数。 实例数 选择实例数。 订阅提醒 订阅提醒 该功能开启后,系统将在任务状态更新时,通过短信或邮件将提醒发送给用户。 发布模型 开启自动发布 开启自动发布后,模型训练完成的最终产物会自动发布为空间资产,
概述 ModelArts Studio大模型开发平台支持纳管盘古大模型及三方大模型,模型在平台部署后,可以通过API调用推理接口。 表1 API清单 类别 模型 API 功能 模型推理接口 NLP大模型 文本对话 基于对话问答功能,用户可以与模型进行自然而流畅的对话和交流。 CV大模型
配比并发布数据集 数据配比介绍 不同数据源与大语言模型某些特定能力的学习具有紧密的联系,根据来源不同,微调数据主要分为两种类型: 通用问答数据和行业问答数据。通用问答数据涵盖了数学、代码和逻辑推理等,主要是为了保留模型的通用能力。 行业指令数据主要为了提升模型解决下游任务的能力。
在特定任务上具有更高的准确性:微调后的模型在具体任务中表现更优。相较于预训练阶段的通用能力,微调能使模型更好地解决细分任务的需求。 在一个客户服务问答系统中,可以用特定领域(如电商、保险)的对话数据对预训练模型进行微调,使其更好地理解和回答与该领域相关的问题。 父主题: 训练图像问答大模型
返回结果 状态码 请求发送以后,您会收到响应,包含状态码、响应消息头和消息体。 状态码是一组从1xx到5xx的数字代码,状态码表示了请求响应的状态,完整的状态码列表请参见状态码。 对于Pangu服务接口,如果调用后返回状态码为“200”,则表示请求成功。 响应消息头 对应请求消息
输入节点 输入节点提供工作流运行过程中的信息输入。 在比较复杂的工作流场景中,某些节点的执行往往需要额外的用户输入。如果前置节点中没有获取到这些信息,你可以添加一个输入节点来主动收集信息。工作流执行到输入节点时会暂时中断,直到此节点收集到必要的用户输入。 输入节点为可选节点,若无需配置,可跳过该步骤。
专业大模型 Embedding模型 Rerank模型 搜索规划模型 父主题: 模型推理接口
创建多智能体应用 创建多智能体应用主要步骤如下: 创建多智能体应用。 登陆Agent开发平台; 在页面左上方选择我的工作台->应用管理,单击右上角创建应用。 图1 创建多智能体应用 进入应用创建页面,选择“多智能体应用(beta)”,填写应用名称,描述,选择应用图标单击右下角立即创建。
视频类加工算子介绍 数据加工算子为用户提供了多种数据操作能力,包括数据提取、过滤、转换、打标签等。这些算子能够帮助用户从海量数据中提取出有用信息,并进行深度加工,以生成高质量的训练数据。 平台支持视频类数据集的加工操作,分为数据提取、数据过滤、数据打标三类,视频类加工算子能力清单见表1。
构建增量预训练数据集 获取源数据 金融领域增量预训练所需要的数据主要包含通用预训练数据和金融行业预训练数据。本案例推荐的开源数据集如下: 通用中文预训练数据(CCI 3.0-HQ): 基于CCI 3.0语料库,BAAI进一步进行加工,通过两阶段混合过滤管道开发,显著提升了数据质量
管理Agent应用 在Agent平台中创建应用之后,可以管理工作台中的应用,例如删除或者复制自己创建的应用ID以及查看调用路径。 删除应用 只有应用的所有者可以删除应用。 删除应用时虽然不会同步删除应用资源库中的所有资源,但应用不可恢复,请谨慎操作。 删除应用的操作步骤如下: 登录Agent开发平台。
调用预测大模型 表1 预测大模型API清单 API分类 API访问路径(URI) 推理 / 特征重要性 /perm-feat-importance 使用API调用预测大模型 统计预测大模型调用信息 父主题: 开发盘古预测大模型
选择训练当前任务的计费模式。 训练单元 选择训练单元数。 单实例训练单元数 选择单实例训练单元数。 实例数 选择实例数。 订阅提醒 订阅提醒 该功能开启后,系统将在任务状态更新时,通过短信或邮件将提醒发送给用户。 发布模型 开启自动发布 开启自动发布后,模型训练完成的最终产物会自动发布为空间资产,