检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在人工智能应用中,RAG技术逐渐成为提升智能系统性能的关键手段。RAG结合了检索(Retrieval)和生成(Generation)的能力,通过检索相关知识并结合生成模型输出高质量结果。DeepSeek V3作为一款强大的开源大语言模型,特别适合用于构建RAG系统。 方案优势 开箱即用:上传文
响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 状态码:500 表6 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 请求示例
当前知识库是否打开缓存。 false: 不缓存结果。 true:缓存query/reference/answer结果,并在下次检索时,遇到相似query时,直接返回缓存结果,提升时延。 约束限制: 不涉及。 默认取值: false answer_reference_enabled 否 Boolean 参数解释:
问题。 answer String 答案。 create_date_time String 对话发生时间。 feedback_status Integer 是否有问题反馈。 question_reference_models Array of QuestionReferenceModel
响应Body参数 参数 参数类型 描述 error_code String 参数解释: 错误码。 取值范围: 不涉及 error_msg String 参数解释: 错误描述。 取值范围: 不涉及 状态码:500 表6 响应Body参数 参数 参数类型 描述 error_code String
响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 状态码:500 表10 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 请求示例
- 上传成功 ERROR - 上传失败 PENDING - 排队解析中 RUNNING - 正在解析 IMPORT_EXCEPTION - 导入异常 FILE_ENCODING_ERROR - 文章解码异常 默认取值: 不涉及 page_num 否 Integer 参数解释: 当
131072 chat_temperature Float 参数解释: 非搜索增强场景下,用于控制模型生成文本的多样性和创造力。 取值接近0表示最低的随机性,1表示最高的随机性。一般来说,temperature越低,适合完成确定性的任务。temperature越高,例如0.9,适合完成创造性的任务。
不足、火花塞问题或燃油系统堵塞等原因。\n2. 怠速不稳:发动机在怠速状态下运行不稳定,可能导致熄火或者抖动严重。可能是由于空气进气系统、燃油系统或点火系统的问题。\n3. 动力减弱:发动机加速性能下降,爬坡能力降低,可能是由于燃油系统、点火系统或排气系统等问题导致的。\n4.
响应Body参数 参数 参数类型 描述 error_code String 参数解释: 错误码。 取值范围: 不涉及 error_msg String 参数解释: 错误描述。 取值范围: 不涉及 状态码:500 表4 响应Body参数 参数 参数类型 描述 error_code String
131072 chat_temperature Float 参数解释: 非搜索增强场景下,用于控制模型生成文本的多样性和创造力。 取值接近0表示最低的随机性,1表示最高的随机性。一般来说,temperature越低,适合完成确定性的任务。temperature越高,例如0.9,适合完成创造性的任务。
、火花塞问题或燃油系统堵塞等原因。\n\n2. 怠速不稳:发动机在怠速状态下运行不稳定,可能导致熄火或者抖动严重。可能是由于空气进气系统、燃油系统或点火系统的问题。\n\n3. 动力减弱:发动机加速性能下降,爬坡能力降低,可能是由于燃油系统、点火系统或排气系统等问题导致的。\n\n4
Integer top_k配置。top_k指召回前k条与query相关的片段 reference_count 否 Integer 参考文档数量。参考文档指最终和query一起输入给NLP模型,用于生成最终答案的文档 rerank_enabled 否 Boolean rerank开关,包含【打开、关闭】两个状态
data_list Array of KnowledgeRepoDto objects 参数解释: 知识库数据列表。 取值范围: 不涉及 total Integer 参数解释: 总数。 取值范围: 不涉及 experimental_features Array of strings 参数解释:
取值范围: 最大长度为8192字符。 rerank_enabled Boolean 参数解释: rerank开关。 取值范围: 不涉及 moderate_enabled Boolean 参数解释: 内容审核开关。 取值范围: 不涉及 query_rewrite_enabled Boolean
搜索范围,定义搜索索引中的信息子集,默认文档库。 约束限制: 不涉及 取值范围: doc:文档知识,使用query2doc模型 faq:FAQ,常见问答集,使用query2query模型 web:网络来源,来自于web搜索引擎 keyword: 关键字,开启精排时分页的最大数量为召回配置中的关键字topK。
否 Integer 参数解释: top_k配置。top_k指召回前k条与query相关的片段。 约束限制: 不涉及 取值范围: 10-500 默认取值: 不涉及 reference_count 否 Integer 参数解释: 参考文档数量。参考文档指最终和query一起输入给NLP模型,用于生成最终答案的文档。
String 参数解释: 从query中抽取时间范围,有多个子query时,使用";"连接每个子query的抽取结果。 如: query:2022年全网最高用电负荷最大时,外电入鲁电力是多少? date_range : 2022-01-01~2022-12-31 query: 华为一季度收入
创建提示词 功能介绍 创建提示词。 当前创建的提示词如果需要用到FreeMarker语法,需要先进行提示词检测,避免变量不存在。FreeMarker手册:https://freemarker.apache.org/docs/ref.html URI POST /v1/{proje
修改提示词 功能介绍 修改提示词。 当前修改后的提示词如果需要用到FreeMarker语法,需要先进行提示词检测,避免变量不存在。FreeMarker手册:https://freemarker.apache.org/docs/ref.html URI PUT /v1/{proje