检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建进阶版语音训练任务 功能介绍 用户创建语音训练进阶版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成100个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0
删除知识库意图 功能介绍 该接口用于删除知识库意图。接口使用限制详见API使用限制。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-chat/knowledge/intent/delete 表1 路径参数 参数 是否必选
查询应用详情 功能介绍 该接口用于查询应用详情。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-chat/robot/{robot_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
创建知识库意图和问法 功能介绍 该接口用于创建知识库意图和问法。一个意图包含一个主题,一个答案,若干个问法等。接口使用限制详见API使用限制。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-chat/knowledge/intent-question
如果资源未耗尽而直播异常中断,平台将自动重连。如果勾选“不设置”,则默认取值为3分钟,即3分钟内多次重连失败,直播将自动停止。用户可勾选自定义重连时长,如果设置为0说明系统将无限重连,直至直播恢复。 单位:分钟。 直播中断通知 开启后,需前往“消息接收配置”界面配置接收人及其接收通知的方式,详见设置直播中断通知方式。
创建TTS异步任务 功能介绍 该接口用于对外生成音频文件。每个预置音色的计费标准详见预置音色计费标准。 使用本接口前,需要在MetaStudio控制台服务概览页面,开通“声音合成”的按需计费。 详细操作为:单击“声音合成”卡片中的“去开通”,在弹出的“开通按需计费服务提示”对话框
查询热点问题详情 功能介绍 该接口用于查询热点问题详情。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-chat/hot-question/{hot_question_id} 表1 路径参数 参数 是否必选 参数类型
分辨率最大支持1080P。 图片素材总大小小于500MB。 字幕 字幕中正常断句的符号,如中文符号、,。:;!?….. 等;英文符号,.:;!?...等,系统会自动去除。 如果自动去除的符号在一段文字中间,自动去除后,会再增加一个空格。 如果自动去除的符号在段落末尾,仅直接去除。 有些符号不会自
修改热点问题 功能介绍 该接口用于修改热点问题。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/digital-human-chat/hot-question/{hot_question_id} 表1 路径参数 参数 是否必选 参数类型 描述
批量创建知识库问法 功能介绍 该接口用于批量创建知识库问法。接口使用限制详见API使用限制。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-chat/knowledge/question-batch 表1 路径参数
创建TTS试听任务 功能介绍 该接口用于创建生成播报内容的语音试听文件任务。 第三方音色试听需要收费,收费标准参考:https://marketplace.huaweicloud.com/product/OFFI919400645308506112#productid=OFFI919400645308506112
创建基础版语音训练任务 功能介绍 用户创建语音训练基础版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成20个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0
返回结果 状态码 请求发送以后,您会收到响应,其中包含状态码、响应消息头和消息体。 状态码是一组从1xx到5xx的数字代码,状态码表示了请求响应的状态,完整的状态码列表请参见状态码。 对于管理员创建IAM用户接口,如果调用后返回状态码为“201”,则表示请求成功。 响应消息头 对
1所示。 图2 插入动作 表1 参数说明 参数 说明 智能动作插入 是否开启智能动作插入。 如果开启,生成的视频会同时包含手工插入的动作和系统根据文本语义智能插入的动作。智能插入的动作支持配置时间间隔,详见“智能动作间隔”参数配置。 如果关闭,生成的视频中仅包含用户手工插入的动作。
保存对话记录 当前不支持在MetaStudio平台内直接查看对话记录,需要将对话记录传输至OBS桶内存储。 前提条件 已购买OBS桶,详见OBS计费说明。推荐购买“华北-北京四”区域的OBS桶。 已创建OBS桶,详见创建桶。 已创建OBS桶策略,详见自定义创建桶策略(JSON视图),请选择使用OBS控制台方式操作。
修改热词记录 功能介绍 该接口用于修改热词记录。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/digital-human-chat/hot-words/{hot_words_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
浏览器通过有上述点击的行为,才能获取采集声音的权限。否则无法采集声音,无法正常使用语音唤醒能力。 浏览器使用限制,请参见表1。 表1 浏览器适配详情 操作系统类型 浏览器类型 浏览器版本 Windows Chrome浏览器 91+ Edge浏览器 91+ Android 移动版Chrome浏览器
文本驱动SSML定义 MetaStudio语音驱动采用语音合成标记语言(SSML,Speech Synthesis Markup Language)来控制数字人的行为,包括动作、情绪以及TTS语音合成的多音字、停顿等。 SSML基础定义可参考语音合成标记语言版本 1.0。Meta
修订记录 表1 修订记录 修改时间 修改说明 2025-06-18 本次变更如下: 新增发布4.0.0版本SDK,相比3.3.1版本,变更点如下所示: 重要变更:接口initResourcePath中新增参数useWorker:是否开启语音唤醒worker线程能力。 接口setT
验证对话链接有效性 创建并发布完成的数字人智能交互对话项目,会生成如下所示内容: 发布链接:https://IP/icswebclient?robot_id=2c9080********************e105e5 激活码:CP*****TL 在发布链接后面可以补充如表1