Commit Graph

88 Commits

Author SHA1 Message Date
Logan Zou
a3ad553943 Update 第二章 Transformer架构.md 2025-06-09 11:14:50 +08:00
Logan Zou
21fc6b7ac6 fix ch2 demo bug-n_head 2025-06-09 11:00:24 +08:00
KMnO4-zx
d99ad30711 docs: 修正文档中"检索增强生产"为"检索增强生成" 2025-06-09 08:07:06 +08:00
KMnO4-zx
9569c9fdca fix(tokenizer): 将add_prefix_space配置改为false 2025-06-08 09:27:21 +08:00
KMnO4-zx
04e14a978b docs(chapter5): 修正RMSNorm公式中的变量和描述
- 将公式中的权重变量 $w_i$ 改为输入变量 $x_i$ 以匹配实际实现
- 添加可学习的缩放参数 $\gamma$ 到公式中
- 更新变量描述使其更准确
2025-06-05 10:54:45 +08:00
wasamtc
57cb6ea261 Create requirements.txt 2025-06-04 14:38:26 +08:00
wasamtc
5869c6493d Create transformer.py 2025-06-04 14:36:37 +08:00
KMnO4-zx
f909cd1a87 docs:修改内容结构 && update readme 2025-06-03 18:52:33 +08:00
KMnO4-zx
32c3f16b8c fix: add chapter5 reauirements 2025-06-03 18:42:51 +08:00
Logan Zou
919a772c99 Update 第四章 大语言模型.md 2025-06-03 16:50:46 +08:00
Logan Zou
bbede84054 fix config bug 2025-06-03 14:10:23 +08:00
Logan Zou
e76ee8e24b fix decoder bug 2025-06-03 10:25:51 +08:00
Logan Zou
530c73dc0d Update 第二章 Transformer架构.md 2025-05-28 10:44:27 +08:00
Logan Zou
774e5073c1 Update 第二章 Transformer架构.md 2025-05-28 10:39:57 +08:00
Logan Zou
ee61bfe720 Update 第二章 Transformer架构.md 2025-05-28 10:34:46 +08:00
KMnO4-zx
20586c2790 docs:update readme 2025-05-27 16:15:57 +08:00
KMnO4-zx
1425d45870 docs:update reame images scale 2025-05-25 10:11:41 +08:00
KMnO4-zx
f9fe12d99a docs:add docsify deploy 2025-05-25 00:02:24 +08:00
不要葱姜蒜
731af3ce5b Update README.md 2025-05-16 09:53:55 +08:00
KMnO4-zx
9257ba2bcc docs:第三章、前言 小修 2025-05-15 15:54:01 +08:00
Logan Zou
44ae230eb3 Update README.md 2025-05-15 15:26:54 +08:00
Logan Zou
500ca7bf31 Update README.md 2025-05-15 12:26:13 +08:00
KMnO4-zx
c9d22772a1 doc:修复第七章 tiny-agent 2025-05-14 21:26:54 +08:00
KMnO4-zx
ab3e092186 doc:修正第二章公式 2025-05-13 21:21:10 +08:00
KMnO4-zx
786c77e2ea doc:修正 第二章共识排版 2025-05-13 21:19:31 +08:00
KMnO4-zx
78309523d5 docs:第七章 大模型应用 内容修改 2025-05-13 21:07:51 +08:00
KMnO4-zx
c16ee23323 docs:第六章 大模型训练流程实践 图片格式 参考格式修改 2025-05-13 20:42:51 +08:00
KMnO4-zx
7127aa48b3 docs:第五章 动手搭建大模型 修改图片、引用格式 2025-05-13 20:10:12 +08:00
KMnO4-zx
9763467812 docs:第四章 大语言模型 修改完成 2025-05-12 11:05:25 +08:00
KMnO4-zx
a1e533632e docs:第三章 预训练语言模型 (除GLM外)修复完成,等待添加deepseek-v3 2025-05-10 13:46:08 +08:00
KMnO4-zx
9821f37bc0 docs:第二章 Transformers 架构 修复 2025-05-09 18:54:52 +08:00
KMnO4-zx
311fa8fe04 Fix:第二章 Transformers架构 图片格式、参考文献格式 2025-05-07 23:15:05 +08:00
KMnO4-zx
a0c7b6eb37 Fix: 第一章 NLP 基础概念 格式错误 2025-05-07 22:45:44 +08:00
Logan Zou
360dd41c56 update C6 2025-04-26 21:52:12 +08:00
Logan Zou
bdf3be98f3 update C2 2025-04-26 21:46:33 +08:00
Logan Zou
067b855c84 update C3 2025-04-26 21:38:20 +08:00
Logan Zou
84c0a2d875 finish C6 2025-04-26 21:30:48 +08:00
KMnO4-zx
a86accd751 Add chapter7 Agent code 2025-04-26 20:35:30 +08:00
KMnO4-zx
f216f6d96f del Agent 2025-04-26 20:33:10 +08:00
KMnO4-zx
af57ef4956 update chapter7 Agent 2025-04-26 20:30:41 +08:00
KMnO4-zx
7638cee514 Create 第五章 动手搭建大模型 & 第七章 大模型应用 2025-04-26 20:28:25 +08:00
Logan Zou
61d30cdae1 Create 第四章 大语言模型.md 2025-04-26 16:56:28 +08:00
Logan Zou
d313ba5125 Create 第三章 预训练语言模型.md 2025-04-26 16:42:37 +08:00
Logan Zou
531f1d6711 Create 第二章 Transformer架构.md 2025-04-26 16:37:01 +08:00
Logan Zou
c903aabcc6 Rename 1 NLP基础概念.md to 第一章 NLP基础概念.md 2025-04-26 16:28:39 +08:00
Logan Zou
4a7ebeb7e8 Update 1 NLP基础概念.md 2025-04-26 16:26:34 +08:00
Logan Zou
ad530bc3ab Create 6.4 高效微调.md 2025-04-26 16:20:29 +08:00
Logan Zou
b9be826700 Delete docs/chapter6/7.2 奖励模型.md 2025-04-26 16:01:13 +08:00
Logan Zou
bf91fa3c86 Update and rename 7.1 强化学习的目标.md to 6.4[WIP] 偏好对齐.md 2025-04-26 16:00:50 +08:00
Logan Zou
106fd678cd finish 6.2 2025-04-25 16:33:27 +08:00