检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
推荐系统OBS文件夹规范 使用推荐系统时,需要在OBS创建桶并导入离线数据,同时作业所产生的数据也会保存在OBS中。为了方便您快速定位文件路径,建议您按照如下结构准备数据创建文件夹,并上传至OBS桶。 OBS文件夹示例 自定义OBS桶名 │ obs-offline-data
"feature_type":"BASIC_INFO", "feature_process_parameters": { } }, { "feature_name": "categories", "feature_type": "strArray", "feature_type":"BASIC_INFO"
个Token鉴权时,可以先缓存起来,避免频繁调用。 Token在计算机系统中代表令牌(临时)的意思,拥有Token就代表拥有某种权限。Token认证就是在调用API的时候将Token加到请求消息头,从而通过身份认证,获得操作API的权限。 Token可通过调用获取用户Token接
进行服务授权 当您选择开通推荐系统,首次登录RES管理控制台系统会自动弹出“RES服务权限委托”的对话框,提示服务进行委托授权,即授权RES服务请求获取访问您在其他云产品中的资源,未授权将不能使用RES的完整功能。 图1 权限委托 单击“同意授权”系统会自动创建委托。由于RES与其
创建集群章节。 DIS创建通道操作详请参见数据接入服务用户指南> 入门> 步骤1:开通DIS通道章节。 CloudTable集群需要开启IAM统一身份认证。 创建资源完成后,创建的资源会展示在“资源中心”列表中,如图1所示。 图1 CloudTable资源信息 父主题: 管理资源
cluster_name 否 String 集群名称。 表30 match_feature_pairs参数说明 参数名称 是否必选 参数类型 说明 user_feature_name 是 String 用户特征。 item_feature_name 是 String 物品特征。 alias 是 String
计算资源:用于推荐作业的计算规格。涉及计费功能包含:数据源、自定义场景、智能场景中的离线计算和模型训练。 存储资源:用于推荐系统数据存储规格。涉及计费功能包括:数据源。 在线服务:用于推荐系统在线推理,获得最终推荐结果。 套餐介绍 计算资源分为“计算型CPU(1U4G)实例”、“计算型GPU(P1
ID。 新的全局特征配置文件路径(new_global_features_info) 是 String 该文件为JSON格式,包含特征名、特征大类、特征值类型。 新的全局特征配置文件(new_global_features_info)包含的特征是在原作业ID(job_id)对应的
“全局特征信息文件” 为json格式文件。指定在去重过滤即属性过滤中物品属性和用户属性的特征信息文件,如物品属性需要“feature_name”、“feature_type”、“feature_value_type”字段来表示特征名,特征类型以及特征值类型。需预先存储在OBS中。 “画像” 画像为
4。 config 是 Object 流程配置信息,请参见表5。 rank_uuid 否 String 排序策略生成的uuid。 feature_uuid 否 String 预处理的离线处理生成的uuid。 filter_uuid 否 String 过滤规则生成的uuid。 表4
各服务的计费请参见:产品价格详情。 开通计算引擎DLI、ModelArts DLI用于推荐系统的离线计算和近线计算。排序策略所使用的计算资源由Modelarts服务提供并收费。在使用推荐系统之前,您需要开通数据湖探索(Data Lake Insight,简称DLI)来创建集群。 DLI服务
网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 项目 华为云的区域默认对应一个项目,这个项目由系统预置,用来隔离物理区域间的资源(计算资源、存储资源和网络资源),以默认项目为单位进行授权,用户可以访问您账号
Acceptable 服务器无法根据客户端请求的内容特性完成请求。 407 Proxy Authentication Required 请求要求代理的身份认证,与401类似,但请求者应当使用代理进行授权。 408 Request Time-out 服务器等候请求时发生超时。 客户端可以随时再次提交该请求而无需进行任何更改。
datasource_id String 数据源id。 datasource_name String 名称。 status String 状态。 structure String 结构。 workspace_id String 工作空间编号。 data_config DataConfig object
3。 结果保存路径 单击选择所有输出数据在OBS的保存根路径,会在这个根路径下自动创建feature_map、features_info_online_use、fields_feature_size、test_data、train_data五个文件夹,分别保存特征映射、在线所需特
String 人工导入召回策略生成的uuid。 need_preferences 否 Boolean 是否开启优选项功能,需匹配global_features_info_path,profile_uuid和attr_weight。例如,在购物车场景,使用的召回候选集来自于离线计算基于物品的协
推荐通用数据模板 用户属性表USER_META 物品属性表ITEM_META 用户操作行为表USER_BEHAVIOR 数据格式请参见推荐系统离线数据源。 通用格式 GENERAL_FORMAT data_source_url 是 String 数据源路径,最大长度1000字符。
处理接口会生成这个文件,需要用户提供此文件完整路径。文件路径为特征工程中排序样本预处理作业输出数据的结果保存路径的“fields_feature_size”目录下文件名称是part-00000开头的文件,需要用户提供文件的OBS路径。 最大迭代轮数 模型训练的最大迭代轮数,默认50。
训练数据的OBS路径。 test_data_path 是 String 测试数据的OBS路径。 algorithm_type 是 String 算法名称,推荐系统内部定义,必须为LR、FM、FFM、DEEPFM、PIN中的某一个。 algorithm_parameters 是 JSON 每个算法有其
用户属性表USER_META 物品属性表ITEM_META 用户操作行为表USER_BEHAVIOR 通用格式GENERAL_FORMAT 数据格式请参见推荐系统离线数据源。 data_source_url 是 String 数据源路径,最大长度1000字符。 data_format 是 String