搜索_华为云

推理精度测试 - AI开发平台ModelArts

vllm_path：构造vllm评测配置脚本名字，默认为vllm。 host：与起服务的host保持一致，比如起服务为0.0.0.0,host设置也为0.0.0.0。 service_port：服务端口，与启动服务时的端口保持，比如8080。 max_out_len：在运行类似mmlu、

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
使用AWQ量化工具转换权重 - AI开发平台ModelArts

/home/ma-user/Qwen1.5-72B-Chat-AWQ 参数说明： model：模型路径。 Step3 启动AWQ量化服务参考Step3 启动推理服务，在启动服务时添加如下命令。 --q awq 或者--quantization awq 父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用AWQ量化 - 推理模型量化 - AI开发平台ModelArts

/home/ma-user/Qwen1.5-72B-Chat-AWQ 参数说明： model：模型路径。 Step3 启动AWQ量化服务参考Step6 启动推理服务，在启动服务时添加如下命令。 -q awq 或者--quantization awq 父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用AWQ量化 - 推理模型量化 - AI开发平台ModelArts

/home/ma-user/Qwen1.5-72B-Chat-AWQ 参数说明： model：模型路径。 Step3 启动AWQ量化服务参考Step6 启动推理服务，在启动服务时添加如下命令。 -q awq 或者--quantization awq 父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
从DWS导入数据到ModelArts数据集 - AI开发平台ModelArts

码。所导入表的schema(列名和类型)需要跟数据集相同。DWS的详细功能说明，请参考DWS用户指南。图1 从DWS导入数据集群名称：系统自动将当前账号下的DWS集群展现在列表中，您可以在下拉框中选择您所需的DWS集群。数据库名称：根据选择的DWS集群，填写数据所在的数据库名称。

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 数据准备与处理 > 导入数据到ModelArts数据集
使用llm-compressor工具量化 - 推理模型量化 - AI开发平台ModelArts

致需要10+小时。使用量化模型使用量化模型需要在NPU的机器上运行。启动vLLM前，请开启图模式（参考步骤六启动推理服务中的配置环境变量），启动服务的命令和启动非量化模型一致。父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用llm-compressor工具量化 - 推理模型量化 - AI开发平台ModelArts

致需要10+小时。使用量化模型使用量化模型需要在NPU的机器上运行。启动vLLM前，请开启图模式（参考步骤六启动推理服务中的配置环境变量），启动服务的命令和启动非量化模型一致。父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
查询支持的镜像列表 - AI开发平台ModelArts

service_type 否 String 镜像支持服务类型。枚举值如下： COMMON：通用镜像。 INFERENCE: 建议仅在推理部署场景使用。 TRAIN: 建议仅在训练任务场景使用。 DEV: 建议仅在开发调测场景使用。 UNKNOWN: 未明确设置的镜像支持的服务类型。 sort_dir 否

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
Notebook Cache盘告警上报 - AI开发平台ModelArts

“告警恢复通知”：开启开关图4 设置告警通知先在SMN创建一个主题，用于配置告警通知规则。更多内容请参考消息通知服务用户指南。创建主题进入“消息通知服务”控制台，单击“主题管理 > 主题”，进入“主题”页面。单击“创建主题”填写主题名称，选择企业项目后，单击确定即可创建一个主题。

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用Notebook进行AI开发调试 > 管理Notebook实例
创建工作空间 - AI开发平台ModelArts

创建工作空间功能介绍创建工作空间（"default"为系统预留的默认工作空间名称，不能使用）。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v1/

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
使用AWQ量化 - 推理模型量化 - AI开发平台ModelArts

/home/ma-user/Qwen1.5-72B-Chat-AWQ 参数说明： model：模型路径。 Step3 启动AWQ量化服务参考Step6 启动推理服务，在启动服务时添加如下命令。 -q awq 或者--quantization awq 父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用AWQ量化 - 推理模型量化 - AI开发平台ModelArts

/home/ma-user/Qwen1.5-72B-Chat-AWQ 参数说明： model：模型路径。 Step3 启动AWQ量化服务参考Step6 启动推理服务，在启动服务时添加如下命令。 -q awq 或者--quantization awq 父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
数据导入方式介绍 - AI开发平台ModelArts

本地上传：将本地数据直接通过Internet上传至OBS指定目录后，再导入数据集。表格型数据来源表格数据集支持从3种数据源导入数据，分别为对象存储服务（OBS）、MapReduce服务（MRS）和本地上传。数据集中的数据导入入口数据集中的数据导入有5个入口。创建数据集时直接从设置的数据导入路径中自动同步数据。

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 数据准备与处理 > 导入数据到ModelArts数据集
创建Standard专属资源池 - AI开发平台ModelArts

开启“节点高级配置”开关后，支持设置实例的操作系统。存储配置资源池类型为“物理资源池”时，支持开启“存储配置”开关。系统盘打开“存储配置”开关后，可以看到每个实例默认自带的系统盘的磁盘类型、大小或数量。部分规格没有携带系统盘，在创建专属资源池时支持设置系统盘的磁盘类型和大小。容器盘

 帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > ModelArts Standard资源管理
W4A16量化 - AI开发平台ModelArts
W4A16量化 - AI开发平台ModelArts

/home/ma-user/Qwen1.5-72B-Chat-AWQ 参数说明： model：模型路径。步骤三：启动量化服务参考启动在线推理服务，在启动服务时添加如下命令。 -q awq 或者--quantization awq 父主题：量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理关键特性使用 > 量化
训练启动脚本说明和参数配置 - AI开发平台ModelArts

MOSSMultiTurnHandler] 示例值需要根据数据集的不同，选择其一。 GeneralPretrainHandler：使用预训练的alpaca数据集。 GeneralInstructionHandler：使用微调的alpaca数据集。 MOSSMultiTurnHandler：使用微调的moss数据集。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明
查询AI应用列表 - AI开发平台ModelArts

request_mode String 模型部署为服务时作业的请求模型 rsa Rsa object 用于容器与推理平台安全通信或者字段加密。自定义镜像导入使用，非自定义进行在runtime声明 service_config String 服务部署字段声明，服务部署时可指定具体的值。自定义镜像导

 帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
使用预置镜像制作自定义镜像用于训练模型 - AI开发平台ModelArts

PYTHONPATH=${MA_JOB_DIR}:${PYTHONPATH} 选择的启动文件将会被系统自动以python命令直接启动，因此请确保镜像中的Python命令为您预期的Python环境。通过系统自动注入的PATH环境变量，可以参考下述命令确认训练作业最终使用的Python版本。 export

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
分析ModelArts数据集中的数据特征 - AI开发平台ModelArts

图片亮度，值越大代表观感上亮度越高。一般呈正态分布，可根据分布中心判断数据集整体偏亮还是偏暗。可根据使用场景调整，比如使用场景是夜晚，图片整体应该偏暗。图片饱和度 Saturation 图片的色彩饱和度，值越大表示图片整体色彩越容易分辨。一般呈正态分布，一般用于比较训练集和真实场景数据集的差异。清晰度 Clarity

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 数据准备与处理
ma-cli ma-job训练作业支持的命令 - AI开发平台ModelArts

where you submit training job(default "0") --policy [regular|economic|turbo|auto] Training job policy, default

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考

总条数： 2000

上一页
1
...
80
81
82
...
100
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消