从模型分析到项目开发,掌握本地推理大语言模型的开发能力
0浏览
0点赞
0收藏
0评论
发布大约 1 个月前
资源简介
资源特性
- 模型基础与下载:解析llama模型结构及预训练数据来源,讲解7B、13B、30B、70B等模型的下载方法,演示推理测试程序
- llama.cpp构建:分析llama.cpp源码及构建环境,指导VisualStudio2022、CMake在Windows系统的安装与项目构建
- 模型转换与量化:介绍ggml格式,演示llama模型从pth到ggml bin的转换,讲解模型量化(如Q4_0)以适应低性能设备
- 中文模型处理:覆盖Chinese-LLaMA-Alpaca中文模型的下载、Transformers格式转换、LoRA权重合并,实现Web图形界面推理及llama.cpp量化推理
- 参数与算法分析:解析推理参数(ctx-size上下文大小、batch-size推理批次)、采样参数(repeat-penalty重复惩罚、top-k/top-p随机性控制)的源码逻辑
- 项目实战:实战开源llamaqt项目,包括CMake项目配置、XGtp模块(推理、日志、控制台转发)开发,以及QT交互界面(模型加载、参数设置、对话界面、运行状态显示)的实现
适用场景
- IT从业者:通过课程进行大语言模型实验,深入理解其应用场景
- 大学生:了解大语言模型落地实际情况,提升开发能力
- 程序员:为未来系统结合大语言模型重写储备技术
- 边缘计算:开发本地推理AI大语言模型或量化模型用于边缘计算的场景
下载链接
⚛️
夸克网盘
https://pan.quark.cn/s/381d0640850c
预览截图

评论