检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查询分身数字人视频字幕文件任务详情 功能介绍 该接口用于查询分身数字人视频字幕文件任务详情。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/subtitle-files/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
ffmpeg解压后,将其下bin目录加入系统环境变量。 输入命令行ffmpeg后可以显示版本号,说明安装成功。 解决方法 方法一:通过剪映将H265(HEVC)视频的格式转码为H264,再上传至MetaStudio控制台,进行形象制作。 剪映的详细操作过程,请参见剪映操作步骤。
情景模式名称必须为“English”,English情景模式下,不支持开启系统预置技能,仅支持开启自定义技能。一个应用可以增加多个情景模式,每个情景模式相互独立,互不干扰。 父主题: 创建智能交互对话项目(科大讯飞)
创建知识库意图和问法 功能介绍 该接口用于创建知识库意图和问法。一个意图包含一个主题,一个答案,若干个问法等。接口使用限制详见API使用限制。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-chat/knowledge
创建TTS试听任务 功能介绍 该接口用于创建生成播报内容的语音试听文件任务。 第三方音色试听需要收费,收费标准参考:https://marketplace.huaweicloud.com/product/OFFI919400645308506112#productid=OFFI919400645308506112
查询数字人名片制作任务列表 功能介绍 该接口用于查询数字人名片制作任务列表。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-business-cards 表1 路径参数 参数 是否必选 参数类型 描述 project_id
您需要根据实际使用的功能申请对应的系统权限并向用户告知征得其同意。
创建高级版语音训练任务 功能介绍 用户创建语音训练高级版任务,该接口会返回一个obs上传地址,用于上传语音文件。 语音文件为一段WAV格式的长音频文件,仅支持将语音文件打包成zip压缩格式上传。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API
租户执行分身数字人模型训练任务命令 功能介绍 该接口用于租户执行分身数字人模型训练任务命令,如提交训练审核等。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-training-manage/user/jobs/{job_id
查询第三方直播平台信息 功能介绍 该接口用于查询第三方直播平台信息。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/live-platforms/platforms/{platform_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
Token在计算机系统中代表令牌(临时)的意思,拥有Token就代表拥有某种权限。Token认证就是在调用API的时候将Token加到请求消息头中,从而通过身份认证,获得操作API的权限。Token可通过调用获取用户Token接口获取。
创建TTS异步任务 功能介绍 该接口用于对外生成音频文件。每个预置音色的计费标准详见预置音色计费标准。 使用本接口前,需要在MetaStudio控制台服务概览页面,开通“声音合成”的按需计费。 详细操作为:单击“声音合成”卡片中的“去开通”,在弹出的“开通按需计费服务提示”对话框中
创建基础版语音训练任务 功能介绍 用户创建语音训练基础版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成20个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则
查询数字人名片制作任务详情 功能介绍 该接口用于查询数字人名片制作任务详情。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-business-cards/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述
创建进阶版语音训练任务 功能介绍 用户创建语音训练进阶版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成100个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则
更新第三方直播平台信息 功能介绍 该接口用于更新第三方直播平台信息。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/live-platforms/platforms/{platform_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
无标注的系统声音,均为免费声音,可直接选用。 标注有“第三方”的声音,需要购买激活后才能使用,操作请参考购买出门问问声音套餐。 请填写名片信息 姓名 必填项,数字人姓名。 不能超过32字符。 职称 必填项,数字人职称。
推理阶段: 用户上传一段文本作为输入文本内容,由系统自动审核。 输入文本使用数字人声音模型推理生成数字人语音。 算法应用场景 分身数字人声音制作算法可以应用于数字人语音合成。在新闻播报、课件制作等场景模拟真人配音,提升数字内容生产效率。
目前仅白名单用户可使用此参数,非白名单用户跟随系统策略审核。 表25 CallBackConfig 参数 是否必选 参数类型 描述 callback_url 是 String 回调URL。
查看分身数字人定制任务审核进展,当前状态为“系统审核中”。数字人定制任务提交成功后,会在1个工作日内完成审核。 图4 定制任务详情 审核通过后,任务状态变更为“算法训练中”,如图所示。 数字人定制任务审核通过后,启动算法训练,会在3个工作日内训练完成并生成数字人。