搜索_华为云

创建Notebook实例 - AI开发平台ModelArts

击文件系统名称进入详情页。其中，“共享路径”即为此参数的参数值。 OBS：并行文件系统命名格式为：obs://<桶名>/<目录路径>/。登录对象存储服务控制台，在并行文件系统列表中，文件系统名称为桶名。单击文件系统名称进入详情页，在文件栏选择特定目录后，点击右侧“更多/复制路径”，该路径即为目录路径。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
基于tmpfs配置内存缓存（可选） - AI开发平台ModelArts

k-R1/”作为参考目录进行说明。注意事项每个节点都需要配置tmpfs文件系统。系统重启后tmpfs文件系统中的数据会丢失。确保复制到tmpfs文件系统的权重文件是正确的。 tmpfs占用系统内存，需根据模型大小合理规划。调整tmpfs大小命令如下： mount -o remount

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek基于Lite Server&Cluster推理 > DeepSeek模型基于ModelArts Lite Server适配NPU的PD分离推理解决方案 > 准备Server资源环境 > 存储配置
图片生成 - AI开发平台ModelArts
图片生成 - AI开发平台ModelArts

从表2的“model参数值”列获取。在“预置服务 > 商用服务”页签的服务名称左侧，单击图标，在“model参数”列查看取值。更多信息，请参见在ModelArts Studio（MaaS）预置服务中开通商用服务。在预置服务-自定义接入点页签的“model参数”列查看取值。更多信息，请参见在ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts Studio（MaaS）用户指南 > ModelArts Studio（MaaS）在线推理服务 > ModelArts Studio（MaaS） API调用规范
通过Function Calling扩展大语言模型对外部环境的理解 - AI开发平台ModelArts

order_id == 1: return datetime.strptime("2024-09-01 18:30", "%Y-%m-%d %H:%M") elif order_id == 2: return datetime.strptime("2024-10-20

帮助中心 > AI开发平台ModelArts > ModelArts Studio（MaaS）用户指南 > ModelArts Studio（MaaS）模型能力 > 在ModelArts Studio（MaaS）中通过Function Calling扩展大语言模型交互能力
在ECS中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

"application/json" } } ] 将模型部署为在线服务参考部署为在线服务将模型部署为在线服务。在线服务创建成功后，您可以在服务详情页查看服务详情。您可以通过“预测”页签访问在线服务。父主题：制作自定义镜像用于推理

 帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
在ModelArts Studio（MaaS）管理API Key - AI开发平台ModelArts

Studio（MaaS）管理API Key 在调用MaaS部署的模型服务时，需要填写API Key用于接口的鉴权认证，保障服务访问的安全性和合法性。本文介绍如何创建和删除API Key。场景描述当用户使用MaaS部署的模型服务进行数据请求、模型推理等操作时，系统通过验证API Key来确认用户的身份与访问权限，只有具备有效API

帮助中心 > AI开发平台ModelArts > ModelArts Studio（MaaS）用户指南 > ModelArts Studio（MaaS）管理与统计
准备推理环境 - 推理服务部署 - AI开发平台ModelArts

ASCEND_RT_VISIBLE_DEVICES=0,1”，注意编号不是填4、5。图1 查询结果启动推理服务的具体操作步骤请参见启动推理服务。父主题：推理服务部署

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理服务部署
准备推理环境 - 推理服务部署 - AI开发平台ModelArts

ASCEND_RT_VISIBLE_DEVICES=0,1”，注意编号不是填4、5。图1 查询结果启动推理服务的具体操作步骤请参见启动推理服务。父主题：推理服务部署

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > LLM大语言模型推理历史版本文档 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
从0-1制作自定义镜像并创建模型 - AI开发平台ModelArts

"application/json" } } ] 将模型部署为在线服务参考部署为在线服务将模型部署为在线服务。在线服务创建成功后，您可以在服务详情页查看服务详情。您可以通过“预测”页签访问在线服务。图5 访问在线服务父主题： Standard推理部署

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
自定义镜像导入模型部署上线调用API报错 - AI开发平台ModelArts

确认API调用中body体中的调用路径是否拼接自定义路径。如：“{API接口地址}/predictions/poetry”。父主题：服务预测

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
准备镜像 - 准备工作 - AI开发平台ModelArts

出替换命令。 /mnt/sfs_turbo 为宿主机中默认挂载SFS Turbo的工作目录，目录下存放着训练所需代码、数据等文件。同样，/mnt/sfs_turbo 也可以映射至容器中，作为容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统。为方便访问两个地址可以相同。 ${pvc_name}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Lite Cluster适配MindSpeed-LLM PyTorch NPU训练指导（6.5.902） > 准备工作
准备镜像 - 准备工作 - AI开发平台ModelArts

出替换命令。 /mnt/sfs_turbo 为宿主机中默认挂载SFS Turbo的工作目录，目录下存放着训练所需代码、数据等文件。同样，/mnt/sfs_turbo 也可以映射至容器中，作为容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统。为方便访问两个地址可以相同。 ${pvc_name}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Lite Cluster适配MindSpeed-LLM PyTorch NPU训练指导（6.5.905） > 准备工作
LLM推理请求测试 - AI开发平台ModelArts

通过OpenAI服务API接口启动服务时，推理请求必须填写此参数。取值必须和启动推理服务时的model ${container_model_path}参数保持一致。通过vLLM服务API接口启动服务时，推理请求不涉及此参数。 prompt 是 - Str 请求输入的问题。 max_tokens 否 16 Int

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server&Cluster适配Ascend-vLLM PyTorch NPU推理指导（6.5.905） > 在线推理请求测试
语言模型推理性能测试 - AI开发平台ModelArts

csv 参数说明 --backend：服务类型，支持tgi、vllm、mindspore、openai等后端。本文档使用的推理接口是openai。 --host：服务部署的IP，${docker_ip}替换为宿主机实际的IP地址。 --port：推理服务端口。 --tokenizer：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server&Cluster适配Ascend-vLLM PyTorch NPU推理指导（6.5.905） > 推理服务性能评测
给子账号配置训练作业基本使用权限 - AI开发平台ModelArts

创建自定义策略时，建议将项目级云服务和全局级云服务拆分为两条策略，便于授权时设置最小授权范围。此处的“trainJob”为项目级云服务、“trainJobobs”为全局级云服务。了解更多创建用户组并加入用户，步骤请参考Step1 创建用户组并加入用户。给用户组授权策略。在IAM服务的用户组列表

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
API概览 - AI开发平台ModelArts
API概览 - AI开发平台ModelArts

查询服务监控信息。查询服务列表查询服务列表。部署服务部署服务。查询支持的服务部署规格查询支持的服务部署规格列表。查询服务详情查询服务详情，根据服务ID查询服务详情。更新服务配置更新模型服务配置。删除服务删除服务。更新模型服务的单个属性更新模型服务的单个

 帮助中心 > AI开发平台ModelArts > API参考
训练作业的自定义镜像制作流程 - AI开发平台ModelArts

执行如下命令，查看自定义镜像的CPU架构。 docker inspect {自定义镜像地址} | grep Architecture ARM CPU架构的自定义镜像，上述命令回显如下。 "Architecture": "arm64" 规格中带有ARM字样的显示，为ARM CPU架构。规格中未带有ARM字样的显示，为X86

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
在Notebook中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

PU资源部署在线服务时会收取少量资源费用，具体费用以界面信息为准。参数配置完成后，单击“下一步”，确认规格参数后，单击“提交”启动在线服务的部署。进入“部署上线 > 在线服务”页面，等待服务状态变为“运行中”时，表示服务部署成功。单击操作列的“预测”，进入服务详情页的“预测”页面。上传图片，预测结果。

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
run_vllm_multi_node.sh - AI开发平台ModelArts

e.sh也是用于启动与 OpenAI API 兼容的在线推理服务。在Cluster部署准备章节会使用到。不同的是，run_vllm_multi_node.sh可在多节点上执行，并且通过Ray管理多节点的分布式推理服务。 source /home/ma-user/.bashrc

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server&Cluster适配Ascend-vLLM PyTorch NPU推理指导（6.5.905） > 附录
方案规划 - AI开发平台ModelArts
方案规划 - AI开发平台ModelArts

WAF；最后把chat API注册到APIG，并利用APIG的负载通道（服务器）能力对接K8s Service实现多实例的负载均衡。【可选】接入层的监控由于各云服务已对接CES云服务，因此可使用CES云服务实现接入层各组件的监控功能，同时也支持配置监控告警。【可选】接入层的依

 帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek基于Lite Server&Cluster推理 > DeepSeek模型基于ModelArts Lite Server适配NPU的PD分离推理解决方案

总条数： 1975

上一页
1
...
18
19
20
...
99
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消