搜索_华为云

SFT全参微调训练任务 - AI开发平台ModelArts

仅需要修改预训练中的多机训练执行命令即可 - name: main args: - cd /mnt/sfs_turbo/llm_train/AscendSpeed; sh scripts/llama2/0_pl_sft_70b.sh

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910）
Wan2.1系列文/图生视频模型基于Lite Server适配PyTorch NPU训练指导（6.5.905） - AI开发平台ModelArts

参数说明： -v ${work_dir}:${container_work_dir}：代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统。work_dir为宿主机中工作目录，目录下可存放项目所需代码、数据等文件。container_work_dir为要挂载到的容器中的目录。为方便两个地址可以相同。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 视频生成模型训练推理
使用CES监控Lite Server单节点NPU资源 - AI开发平台ModelArts

Snt9b23 telescope： 2.7.5.9及之后版本系统内核自动升级预警 KernelUpgradeWarning 重要系统内核自动升级预警，旧版本：%s，新版本：%s 系统内核升级可能导致配套AI软件异常，请检查系统更新日志，避免机器重启可能导致配套AI配套软件不可用 Snt3P

帮助中心 > AI开发平台ModelArts > ModelArts Lite Server用户指南 > 监控Lite Server资源
通过APP认证的方式访问在线服务 - AI开发平台ModelArts

建议在配置文件或者环境变量中密文存放,使用时解密,确保安全; # 本示例以app_key和app_secret保存在环境变量中来实现身份验证为例,运行本示例前请先在本地环境中设置环境变量HUAWEICLOUD_APP_KEY和HUAWEICLOUD_APP_SECRET。

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
测试用户权限 - AI开发平台ModelArts

册镜像。验证SFS权限。在左上角的服务列表中，选择SFS服务，进入SFS管理控制台。在SFS管理控制台，在SFS Turbo中单击右上角的“创建文件系统”，如果能正常打开页面，表示当前用户具备SFS的操作权限。验证ECS权限。在左上角的服务列表中，选择ECS服务，进入ECS管理控制台。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
代码迁移 - AI开发平台ModelArts
代码迁移 - AI开发平台ModelArts

torch_npu初始化后，原则上需要用户将原来代码中CUDA相关的内容迁移到NPU相关的接口上，包含算子API、显存操作、数据集操作、分布式训练的参数面通信nccl等，手动操作修改点较多且较为分散，因此昇腾提供了自动迁移工具transfer_to_npu帮助用户快速迁移。自动

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 训练迁移指导（PyTorch）
使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

)) return '\n called default func !\n {} \n'.format(str(data)) @app.route('/health', methods=['GET']) def healthy(): return "{\"status\":

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
镜像方案说明 - AI开发平台ModelArts

sh文件会安装必要的依赖包以及下载Megatron-LM、MindSpeed、ModelLink源码。若Notebook环境挂载了SFS Turbo，则源码文件会下载至SFS Turbo中。最后选择Notebook中“保存镜像”，则可以得到新的镜像环境。若用户希望修改源码，则需要在Notebook环境中直接访问并编辑源码文件。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作 > 准备镜像
部署推理服务 - AI开发平台ModelArts

如果图片不是（1，336，336）shape，将会被resize。 --image-feature-size：图片输入解析维度大小；llava-v1.6图片输入维度与image-feature-size关系映射表见git；计算原理如下：最小处理单元为14*14 【llava1.5】

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

如果图片不是（1，336，336）shape，将会被resize。 --image-feature-size：图片输入解析维度大小；llava-v1.6图片输入维度与image-feature-size关系映射表见git；计算原理如下：最小处理单元为14*14 【llava1.5】

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
自定义引擎创建模型规范 - AI开发平台ModelArts

)) return '\n called default func !\n {} \n'.format(str(data)) @app.route('/health', methods=['GET']) def healthy(): return "{\"status\":

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
GPU日志收集上传 - AI开发平台ModelArts

return region_id def gen_collect_gpu_log_shell(self): collect_gpu_log_shell = "nvidia-bug-report.sh" return collect_gpu_log_shell

帮助中心 > AI开发平台ModelArts > ModelArts Lite Server用户指南 > Lite Server资源使用
创建算法 - AI开发平台ModelArts
创建算法 - AI开发平台ModelArts

PYTHONPATH=${MA_JOB_DIR}:${PYTHONPATH} 您选择的启动文件将会被系统自动以python命令直接启动，因此请确保镜像中的Python命令为您预期的Python环境。注意到系统自动注入的PATH环境变量，您可以参考下述命令确认训练作业最终使用的Python版本：

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用ModelArts Standard训练模型
模型最小卡数配置 - AI开发平台ModelArts

LLama-Factory使用的zero并行会将优化器、梯度、权重在多卡上切分，因此集群规模的大小会影响最佳配置与性能。 2. 当mindspeed-llm上开启分布式优化器并行时，优化器参数会在集群所有机器上切分共享，因此最优配置会和卡数相关。 3. 当前benchmark是综合考虑了最小可运行卡数和最

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练 > 主流开源大模型基于ModelArts Standard&Lite Server适配AscendFactory PyTorch NPU训练指导（6.5.905） > 训练服务配置说明
非分离部署推理服务 - AI开发平台ModelArts

如果图片不是（1，336，336）shape，将会被resize。 --image-feature-size：图片输入解析维度大小；llava-v1.6图片输入维度与image-feature-size关系映射表见git；计算原理如下：最小处理单元为14*14 【llava1.5】

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
自定义模型规范 - AI开发平台ModelArts

predictions), } return results def parse_args(): """ 从AIGallery环境变量中获取用户配置的超参json """ return json.loads(os.getenv(ENV_AG_USER_PARAMS))

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
查询服务更新日志 - AI开发平台ModelArts

要挂载在系统目录下，如“/”、“/var/run”等，会导致容器异常。建议挂载在空目录下，若目录不为空，请确保目录下无影响容器启动的文件，否则文件会被替换，导致容器启动异常，工作负载创建失败。 storage_type String 挂载类型sfs_turbo极速文件系统挂载。 source_address

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

准备训练模型适用的容器镜像。准备Notebook 本案例需要创建一个Notebook，以便能够通过它访问SFS Turbo服务。随后，通过Notebook将OBS中的数据上传至SFS Turbo，并对存储在SFS Turbo中的数据执行编辑操作。预训练预训练介绍如何进行预训练，包括训练数据处理、超参配置、创建训练任务及性能查看。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 大模型&AIGC待下线案例 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
（可选）Session鉴权 - AI开发平台ModelArts

文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全； # 本示例以password保存在环境变量中来实现身份验证为例，运行本示例前请先在本地环境中设置环境变量HUAWEICLOUD_SDK_PASSWORD。 __PASSWORD = os.en

帮助中心 > AI开发平台ModelArts > SDK参考 > Session鉴权
Reasoning Outputs - AI开发平台ModelArts

Reasoning Outputs与guided-decoding不兼容，不可同时使用。 Reasoning Outputs与structured_outputs和tool_calling不兼容。不支持请求参数stop和stop_token_ids，当前版本会导致思考过程被提前截断。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型推理 > 主流开源大模型基于Lite Server&Cluster适配Ascend-vLLM PyTorch NPU推理指导（6.5.905） > 支持的推理特性

总条数： 911

上一页
1
...
19
20
21
...
46
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消