检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
PyTorch NPU推理指导(6.3.912) Ascend-vLLM介绍 支持的模型列表 版本说明和要求 推理服务部署 推理关键特性使用 推理服务精度评测 推理服务性能评测 附录 父主题: LLM大语言模型推理
分离部署 PD分离部署使用说明 父主题: 推理关键特性使用
投机推理 投机推理使用说明 Eagle投机小模型训练 父主题: 推理关键特性使用
常见错误原因和解决方法 显存溢出错误 网卡名称错误 保存ckpt时超时报错 父主题: 主流开源大模型基于Lite Server适配MindSpeed-LLM PyTorch NPU训练指导(6.5.901)
准备工作 准备环境 准备代码 准备数据 准备镜像环境 父主题: 主流开源大模型基于Lite Cluster适配MindSpeed-LLM PyTorch NPU训练指导(6.5.901)
准备镜像 镜像方案说明 ECS获取和上传基础镜像 ECS中构建新镜像(可选) 父主题: 准备工作
主流开源大模型基于Standard+OBS+SFS适配MindSpeed-LLM PyTorch NPU训练指导(6.5.901) 场景介绍 准备工作 执行训练任务 查看日志和性能 训练脚本说明 常见错误原因和解决方法 父主题: LLM大语言模型训练
准备工作 准备资源 准备数据 准备权重 准备代码 准备镜像 父主题: 主流开源大模型基于Standard+OBS+SFS适配MindSpeed-LLM PyTorch NPU训练指导(6.5.901)
训练脚本说明 训练启动脚本说明和参数配置【旧】 训练tokenizer文件说明 断点续训和故障快恢说明 父主题: 主流开源大模型基于Standard+OBS+SFS适配MindSpeed-LLM PyTorch NPU训练指导(6.5.901)
执行训练任务 ascendfactory-cli方式启动(推荐) demo.sh方式启动(历史版本) 父主题: 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导(6.5.901)
训练benchmark工具 工具介绍及准备工作 训练性能测试 训练精度测试 父主题: 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导(6.5.901)
PyTorch NPU训练指导(6.5.902) 方案概述 支持的模型列表 版本说明和要求 准备工作 执行训练任务 训练结果输出 训练服务评测 训练服务配置说明 常见错误原因和解决方法 父主题: LLM大语言模型训练
主流开源大模型基于Lite Cluster适配MindSpeed-LLM PyTorch NPU训练指导(6.5.902) 方案概述 支持的模型列表 版本说明和要求 准备工作 执行训练任务 训练结果输出 训练脚本说明参考 常见错误原因和解决方法 父主题: LLM大语言模型训练
训练脚本说明参考 断点续训和故障快恢说明 数据说明 模型最小卡数配置 父主题: 主流开源大模型基于Lite Cluster适配MindSpeed-LLM PyTorch NPU训练指导(6.5.902)
ModelArts Standard 准备资源 准备数据、权重和代码 准备镜像 父主题: 准备工作
执行训练任务 ModelArts Lite Server环境 ModelArts Standard环境 父主题: 主流开源大模型基于ModelArts Standard&Lite Server适配AscendFactory PyTorch NPU训练指导(6.5.902)
准备工作 场景组合方式 ModelArts Lite Server ModelArts Standard 父主题: 主流开源大模型基于ModelArts Standard&Lite Server适配AscendFactory PyTorch NPU训练指导(6.5.905)
常见错误原因和解决方法 显存溢出错误 网卡名称错误 工作负载Pod异常 父主题: 主流开源大模型基于Lite Cluster适配MindSpeed-LLM PyTorch NPU训练指导(6.5.905)
执行训练任务 ModelArts Lite Server环境 ModelArts Standard环境 父主题: 主流开源大模型基于ModelArts Standard&Lite Server适配AscendFactory PyTorch NPU训练指导(6.5.905)
常见错误原因和解决方法 显存溢出错误 网卡名称错误 父主题: 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导(6.3.908)