全本地化实战
覆盖模型部署、推理、微调、评估与优化,形成完整本地化闭环。
Course Overview
课程通过系统化实战教学,帮助学员掌握从模型本地部署、推理优化,到使用 LLaMA-Factory 进行全流程微调的完整技能栈,最终能够独立实现生产级本地大模型定制与应用。
三天内容从 Ollama 与 vLLM 部署开始,进入 Transformer、注意力机制、RLHF、LoRA 和 SFT 微调,再扩展到预训练、奖励模型、DPO、Qwen 推理模型和 Qwen2.5-VL 多模态微调。
使用 Ollama、vLLM、OpenWebUI、Hugging Face 和 ModelScope 管理模型资源并构建 API 服务。
理解 Transformer、RLHF、Fine-tuning、LoRA 和 SFT,完成数据准备、训练、评估和导出。
掌握预训练、奖励模型、DPO、Qwen3 推理模型和 Qwen2.5-VL 多模态微调。
Course Features
课程覆盖部署、推理、微调、评估、量化和多模态定制,把大模型能力从“能运行”推进到“可训练、可优化、可落地”。
覆盖模型部署、推理、微调、评估与优化,形成完整本地化闭环。
通过 vLLM 构建 DeepSeek-R1、Qwen3 和嵌入模型的本地 API 服务。
基于 LLaMA-Factory 与 LoRA,掌握可复用的 SFT、评估、导出和量化流程。
支持文本模型、推理模型、多模态模型和企业级本地定制应用。
Target Audience
课程面向 AI 工程师、算法研究员、全栈开发者,以及需要把大模型部署到本地环境并进行定制微调的团队。
需要掌握本地模型部署、推理服务和微调交付流程。
关注 Transformer、RLHF、LoRA、SFT、DPO 和评估方法。
希望把本地模型接入 API 服务、OpenWebUI 和业务系统。
需要形成企业级本地化大模型定制、量化和部署能力。
Skill Outcomes
能力目标覆盖模型资源获取、本地部署、推理服务、核心原理、LoRA 微调、量化、DPO、多模态和 WebUI 管理。
安装 Ollama、配置常用参数并管理本地大模型。
使用 Hugging Face 与 ModelScope 获取模型资源和数据基础。
准备推理环境,部署 DeepSeek-R1、Qwen3 和嵌入模型 API 服务。
理解训练过程、注意力机制、Transformer、GPT 和 RLHF 思想。
掌握轻量化微调概念、低秩适应原理、微调流程和数据需求。
安装框架、搭建微调环境、下载基座模型并完成训练测试。
准备 Identity 数据集,理解 Alpaca、ShareGPT、OpenAI 格式规范。
完成通用能力评估、NLG 评估、自定义评估和 LoRA 模型导出。
理解量化机制,实现模型微调量化、导出量化和 Ollama 支持转换。
掌握预训练、奖励模型、RLHF、DPO 微调和推理测试。
使用 Qwen3 推理模型进行 SFT 微调、模型合并和推理测试。
基于 Qwen2.5-VL 构建血清图片识别数据集并完成训练、评估和导出。
3-Day Journey
先让模型在本地跑起来,再完成 SFT 微调闭环,最后进入预训练、DPO、推理模型和多模态模型定制。
掌握 Ollama 与 vLLM 的部署配置,实现多模型本地管理、模型推理和 API 服务。
完成从微调环境、数据集准备、SFT 训练到评估、导出和量化部署的完整闭环。
深入预训练、奖励模型、DPO、Qwen 推理模型和 Qwen2.5-VL 多模态定制。
Full Curriculum
三天课程沿着企业本地化大模型应用的技术路径展开,并拆分为部署推理、模型原理、基础微调、量化部署、进阶微调和多模态应用等模块。
搭建本地模型管理和高性能推理服务基础。
理解训练、推理、Transformer、RLHF 和微调方法。
完成框架安装、环境搭建、基座模型下载和数据集准备。
掌握训练调优、模型评估、LoRA 导出和轻量化部署。
进入更高级的模型微调策略和对齐训练。
完成推理模型和视觉语言模型的定制化微调。
Project Delivery
课程强调即学即用,每个阶段都形成可演示成果,最终完成从数据准备到模型落地的全链路项目。
完成本地模型管理、推理环境和 API 服务搭建,让模型可被业务系统调用。
完成基座模型、数据集、训练、聊天测试、评估、导出和量化的完整闭环。
通过预训练、奖励模型和 DPO 微调,理解更完整的模型对齐训练链路。
使用 Qwen2.5-VL 完成多模态场景定制,让模型具备视觉理解任务能力。
Final Outcomes
课程帮助学员形成面向企业本地化大模型应用的部署、训练、评估和交付能力。
能够使用 Ollama、vLLM 和 OpenWebUI 构建本地模型运行环境。
能够使用 LLaMA-Factory 完成 SFT、LoRA、评估、导出和量化。
理解预训练、奖励模型、RLHF、DPO 和推理模型微调。
能够针对图像理解类任务完成视觉语言模型的定制微调。