检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在左侧导航栏中选择“评测中心 > 评测集管理”,单击界面右上角“创建评测集”。 在“创建评测集”页面选择所需要的“模型类型”、“文件格式”、“导入来源”,并单击“选择路径”上传数据文件。
加工后的数据集可在“数据工程 > 数据管理 > 数据集 > 加工数据集”中查看。 父主题: 加工图片类数据集
发布数据集可在“数据工程 > 数据管理 > 数据集 > 发布数据集”中查看。 父主题: 加工文本类数据集
表2 盘古CV大模型数据集构建流程 流程 子流程 说明 操作指导 导入数据至盘古平台 创建导入任务 将存储在OBS服务中的数据导入至平台统一管理,用于后续加工或发布操作。
在左侧导航栏中选择“评测中心 > 评测集管理”,单击界面右上角“创建评测集”。 在“创建评测集”页面选择所需要的“文件内容”、“文件格式”、“导入来源”,并单击“选择路径”上传数据文件。
词语特征过滤 词个数表示按照系统词库,对文档进行分词,分词后统计词的总个数,平均词长度为所有词的长度总和除以词总个数,两者都满足则保留当前文档。根据如下特征过滤: 待保留的词个数。 待保留的平均词长度。
在Agent开发平台,单击左侧导航栏“我的工作台 > 应用管理”,单击右上角“创建应用”。 选择“创建类型”“单智能体应用”后,输入应用名称,如“Python编码助手”,输入应用描述,单击“确定”,完成应用创建。
加工数据集可在配比任务栏-“已生成数据集”中查看,亦可在“数据工程 > 数据管理 > 数据集 > 加工数据集”中查看。 父主题: 加工预测类数据集
单击平台左侧菜单 “意图管理” 新建意图包。 在意图包中添加意图分类,分类信息包含名称和示例。 图2 配置意图包 拖动左侧“意图识别”节点至画布中,单击该节点以打开节点配置页面。切换为 “高级模式”。 参照意图模式配置说明,完成配置。
按需计费模式属于后付费模式,即费用根据服务实际消耗量计费,系统将每小时自动扣费。 盘古大模型的计费模式见表1。
表3 盘古行业NLP大模型数据集构建流程 流程 子流程 说明 操作指导 导入数据至盘古平台 创建导入任务 将存储在OBS服务中的数据导入至平台统一管理,用于后续加工或发布操作。
发布数据集可在“数据工程 > 数据管理 > 数据集 > 发布数据集”中查看。 父主题: 构建NLP大模型微调数据集
表2 盘古科学计算大模型数据集构建流程 流程 子流程 说明 操作指导 导入数据至盘古平台 创建导入任务 将存储在OBS服务中的数据导入至平台统一管理,用于后续加工或发布操作。
在左侧导航栏中选择“评测中心 > 评测集管理”,单击界面右上角“创建评测集”。 在“创建评测集”页面选择所需要的“模型类型”、“文件格式”、“导入来源”,并单击“选择路径”上传数据文件。
在数学问题求解中,RFT应用于解题系统,通过对答案是否正确进行反馈,让模型学会一步步推导出正确的解法。
数据处理后: [[unused9]系统:你生成综合质量(有用性,事实性,无害性)极好的回复。[unused10][unused9]系统:你是一个翻译高手。[unused10][unused9]用户:给定一个英文句子,翻译成中文。
Token计算器 - Token计算器 为了帮助用户更好地管理和优化Token消耗,平台提供了Token计算器工具。Token计算器可以帮助用户在模型推理前评估文本的Token数量,提供费用预估,并优化数据预处理策略。
创建盘古行业NLP大模型训练任务 查看盘古行业NLP大模型训练任务状态与指标 发布训练后的盘古行业NLP大模型 管理盘古行业NLP大模型训练任务 父主题: 盘古行业NLP大模型
date_captured 否 图像捕获的日期和时间。 flickr_url 否 图像在Flickr网站上的URL。 id 是 图像的唯一标识符。 annotations 是 标注信息。 num_keypoints 是 标注的关键点数量。
按需计费模式:按需付费是后付费方式,可以随时开通/关闭对应资源,支持秒级计费,系统会根据云服务器的实际使用情况每小时出账单,并从账户余额里扣款。 父主题: 计费FAQ