检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
修订记录 表1 修订记录 修改时间 修改说明 2025-06-18 本次变更如下: 新增发布4.0.0版本SDK,相比3.3.1版本,变更点如下所示: 重要变更:接口initResourcePath中新增参数useWorker:是否开启语音唤醒worker线程能力。 接口setT
文本驱动:通过输入文本,选择声音的方式,生成播报内容。不能超过2000字。 单击声音图标,会弹出声音对话框,可以选择需要使用的声音。 无标注的系统声音,均为免费声音,可直接选用。 标注有“第三方”的声音,需要购买激活后才能使用,操作请参考购买出门问问声音套餐。 设置完成后,单击“生成
验证对话链接有效性 创建并发布完成的数字人智能交互对话项目,会生成如下所示内容: 发布链接:https://IP/icswebclient?robot_id=2c9080********************e105e5 激活码:CP*****TL 在发布链接后面可以补充如表1
智能交互驱动WebSocket接口 终端节点获取方式 终端接入地址需要每次启动数字人智能交互任务时动态获取,不允许输入固定域名,并使用固定地址访问。 智能交互驱动WebSocket接口终端节点的获取方式,如表1所示。 表1 终端节点获取方式 场景 获取方式 未通过WEB SDK调用场景
智能交互支持富媒体吗? 支持的富媒体格式 用户与数字人进行智能交互问答时,支持展示如下格式的富媒体: 图片:JPG、PNG、BMP、GIF、SVG。 视频:MP4。 导入富媒体操作 支持通过问答库导入富媒体,示例如表1所示。以奇妙问知识库为例,可以通过新增知识库来补充富媒体知识。
状态码 调用数字内容生产线API时,可能返回的状态码如表1 状态码所示。 表1 状态码 返回值 说明 200 OK 请求正常。 201 Created 创建类的请求完全成功。 202 Accepted 已经接受请求,但未处理完成。 204 No Content 请求完全成功,同时HTTP响应不包含响应体。
算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 项目 区域默认对应一个项目,这个项目由系统预置,用来隔离物理区域间的资源(计算资源、存储资源和网络资源),以默认项目为单位进行授权,用户可以访问您账号中该
的操作。 216. 您可能不知道的是,这款家用机器人还具备稳定的电力供应和支持系统。 217. 高速运行时,机器人需要稳定的电力来保证各项功能的正常运行。 218. 可靠的电源系统和支持系统如冷却系统、散热装置等则能确保其长时间运行时的稳定性和可靠性。 219. 这意味着您可以长
直播控制RTSA Command命令说明 直播控制RTSA Command命令详细说明,如下所示: 数字人直播状态变化图 RTSA Command定义 数字人直播状态变化图 数字人直播状态变化流程图,如图1所示。 图1 直播状态变化流程图 流程图说明,如下所示: PREPROCE
API概览 华为云MetaStudio服务对应的接口列表如下所示,在调用API前,您需要先获取用户Token,Token可以用于调用其他API时鉴权,具体如何调用API请参考应用示例。 数字资产管理 表1 数字资产管理接口 接口 说明 POST /v1/{project_id}/digital-assets
任务列表 单击任务所在行对应“操作”列的“查看详情”,进入“定制任务详情”页面,如图4所示。 查看分身数字人定制任务审核进展,当前状态为“系统审核中”。数字人定制任务提交成功后,会在1个工作日内完成审核。 图4 定制任务详情 审核通过后,任务状态变更为“算法训练中”,如图所示。
资源类型 MetaStudio计费中涉及的资源类型,包括商用资源类型、POC测试用需管理员分配的资源类型。 表1 商用资源类型(租户订购) 类别 资源名称 单位 计费模式 资源类型编码 备注 分身数字人 形象制作 个 一次性 hws.resource.type.metastudio
广电传媒 在媒资行业,主播通常身兼数职,工作内容繁杂且高压。不仅需要前往现场进行调查和采访,收集第一手资料,还要在繁忙的工作中处理大量信息与素材,系统整理以撰写出高质量的文章用来播报。通过Flexus版数字人无需再进行繁琐的布景、拍摄与剪辑,大大简化传统制播流程,减少制播环节消耗的时间与
文本驱动:通过输入文本,选择声音的方式,生成播报内容。不能超过2000字。 单击声音图标,会弹出声音对话框,可以选择需要使用的声音。 无标注的系统声音,均为免费声音,可直接选用。 标注有“第三方”的声音,需要购买激活后才能使用,操作请参考购买出门问问声音套餐。 请填写名片信息 姓名 必填项,数字人姓名。
音频经过人工安全审核和授权认证后,由训练人员标注用于训练的音频数据,使用深度学习算法训练生成数字人声音模型。 推理阶段: 用户上传一段文本作为输入文本内容,由系统自动审核。 输入文本使用数字人声音模型推理生成数字人语音。 算法应用场景 分身数字人声音制作算法可以应用于数字人语音合成。在新闻播报、课件
接口参考 主入口(HwICSUiSdk) 事件通知(EventMap) 错误码(ICSError) 授权浏览器麦克风的访问权限 Web语音唤醒 父主题: Web SDK
使用API创建或更新剧本后,在控制台中剧本异常怎么办? 控制台编辑和API调用同时使用的限制,如下所示: 剧本封面仅作为通过控制台编辑当前剧本的参考,非实际合成效果。 因为API接口的各参数间可能存在逻辑上的联系,使用API创建的剧本可能因传参错误或不严谨导致生成封面或剧本异常,需要根据相关API文档检查传入的参数。
动。 鼓励公众参与西湖的保护工作,提高公众对环境保护和文化传承的意识,形成全社会共同参与的良好氛围。 利用现代科技手段,如GIS(地理信息系统)、无人机监测等,对西湖的自然环境和文化遗产进行实时监控和分析。 通过教育和推广活动,让更多的人了解西湖的价值,培养青少年对传统文化的兴趣和保护意识。
智能交互驱动流程 流程图示例 用户与数字人进行智能交互的流程图示例,如下所示,对应流程的详细说明,如流程图总体说明所示。 智能交互非流式驱动流程图,如图1所示。 智能交互流式驱动流程图,如图2所示。 智能交互驱动打断对话流程图,如图3所示。 智能交互驱动停止对话流程图,如图4所示。
智能交互第三方LLM回调接口 功能介绍 MetaStudio智能交互服务支持开发者自定义数字人大脑(即第三方LLM)。当用户与数字人对话时,将触发调用该接口,由该接口返回问题对应的答案文本内容。 签名计算方法 第三方LLM自定义接口,使用HMACSHA256签名模式,需要在URL