Happy-LLM

深入理解 LLM 核心原理，动手实现你的第一个大模型

🎯 项目介绍

很多小伙伴在看完 self-llm 开源大模型食用指南后，感觉意犹未尽，想要深入了解大语言模型的原理和训练过程。于是我们决定推出《Happy-LLM》项目，旨在帮助大家深入理解大语言模型的原理和训练过程。

本项目是一个系统性的 LLM 学习教程，包含了大语言模型的基本原理、训练过程和应用案例。我们将从基础知识开始，逐步深入到大语言模型的核心原理和训练过程，最后介绍一些实际应用案例。

章节	关键内容	状态
第一章 NLP 基础概念	什么是 NLP、发展历程、任务分类、文本表示演进	✅
第二章 Transformer 架构	注意力机制、Encoder-Decoder、手把手搭建 Transformer	✅
第三章预训练语言模型	Encoder-only、Encoder-Decoder、Decoder-Only 模型对比	✅
第四章大语言模型	LLM 定义、训练策略、涌现能力分析	✅
第五章动手搭建大模型	实现 LLaMA2、训练 Tokenizer、预训练小型 LLM	✅
第六章大模型训练实践	预训练、有监督微调、LoRA/QLoRA 高效微调	✅
第七章大模型应用	模型评测、RAG 检索增强、Agent 智能体	✅

我们欢迎任何形式的贡献！

扫描二维码关注 Datawhale 公众号，获取更多优质开源内容

⭐ 如果这个项目对你有帮助，请给我们一个 Star！