Logan Zou
|
a3ad553943
|
Update 第二章 Transformer架构.md
|
2025-06-09 11:14:50 +08:00 |
|
Logan Zou
|
21fc6b7ac6
|
fix ch2 demo bug-n_head
|
2025-06-09 11:00:24 +08:00 |
|
KMnO4-zx
|
d99ad30711
|
docs: 修正文档中"检索增强生产"为"检索增强生成"
|
2025-06-09 08:07:06 +08:00 |
|
KMnO4-zx
|
9569c9fdca
|
fix(tokenizer): 将add_prefix_space配置改为false
|
2025-06-08 09:27:21 +08:00 |
|
KMnO4-zx
|
04e14a978b
|
docs(chapter5): 修正RMSNorm公式中的变量和描述
- 将公式中的权重变量 $w_i$ 改为输入变量 $x_i$ 以匹配实际实现
- 添加可学习的缩放参数 $\gamma$ 到公式中
- 更新变量描述使其更准确
|
2025-06-05 10:54:45 +08:00 |
|
wasamtc
|
57cb6ea261
|
Create requirements.txt
|
2025-06-04 14:38:26 +08:00 |
|
wasamtc
|
5869c6493d
|
Create transformer.py
|
2025-06-04 14:36:37 +08:00 |
|
KMnO4-zx
|
f909cd1a87
|
docs:修改内容结构 && update readme
|
2025-06-03 18:52:33 +08:00 |
|
KMnO4-zx
|
32c3f16b8c
|
fix: add chapter5 reauirements
|
2025-06-03 18:42:51 +08:00 |
|
Logan Zou
|
919a772c99
|
Update 第四章 大语言模型.md
|
2025-06-03 16:50:46 +08:00 |
|
Logan Zou
|
bbede84054
|
fix config bug
|
2025-06-03 14:10:23 +08:00 |
|
Logan Zou
|
e76ee8e24b
|
fix decoder bug
|
2025-06-03 10:25:51 +08:00 |
|
Logan Zou
|
530c73dc0d
|
Update 第二章 Transformer架构.md
|
2025-05-28 10:44:27 +08:00 |
|
Logan Zou
|
774e5073c1
|
Update 第二章 Transformer架构.md
|
2025-05-28 10:39:57 +08:00 |
|
Logan Zou
|
ee61bfe720
|
Update 第二章 Transformer架构.md
|
2025-05-28 10:34:46 +08:00 |
|
KMnO4-zx
|
20586c2790
|
docs:update readme
|
2025-05-27 16:15:57 +08:00 |
|
KMnO4-zx
|
1425d45870
|
docs:update reame images scale
|
2025-05-25 10:11:41 +08:00 |
|
KMnO4-zx
|
f9fe12d99a
|
docs:add docsify deploy
|
2025-05-25 00:02:24 +08:00 |
|
不要葱姜蒜
|
731af3ce5b
|
Update README.md
|
2025-05-16 09:53:55 +08:00 |
|
KMnO4-zx
|
9257ba2bcc
|
docs:第三章、前言 小修
|
2025-05-15 15:54:01 +08:00 |
|
Logan Zou
|
44ae230eb3
|
Update README.md
|
2025-05-15 15:26:54 +08:00 |
|
Logan Zou
|
500ca7bf31
|
Update README.md
|
2025-05-15 12:26:13 +08:00 |
|
KMnO4-zx
|
c9d22772a1
|
doc:修复第七章 tiny-agent
|
2025-05-14 21:26:54 +08:00 |
|
KMnO4-zx
|
ab3e092186
|
doc:修正第二章公式
|
2025-05-13 21:21:10 +08:00 |
|
KMnO4-zx
|
786c77e2ea
|
doc:修正 第二章共识排版
|
2025-05-13 21:19:31 +08:00 |
|
KMnO4-zx
|
78309523d5
|
docs:第七章 大模型应用 内容修改
|
2025-05-13 21:07:51 +08:00 |
|
KMnO4-zx
|
c16ee23323
|
docs:第六章 大模型训练流程实践 图片格式 参考格式修改
|
2025-05-13 20:42:51 +08:00 |
|
KMnO4-zx
|
7127aa48b3
|
docs:第五章 动手搭建大模型 修改图片、引用格式
|
2025-05-13 20:10:12 +08:00 |
|
KMnO4-zx
|
9763467812
|
docs:第四章 大语言模型 修改完成
|
2025-05-12 11:05:25 +08:00 |
|
KMnO4-zx
|
a1e533632e
|
docs:第三章 预训练语言模型 (除GLM外)修复完成,等待添加deepseek-v3
|
2025-05-10 13:46:08 +08:00 |
|
KMnO4-zx
|
9821f37bc0
|
docs:第二章 Transformers 架构 修复
|
2025-05-09 18:54:52 +08:00 |
|
KMnO4-zx
|
311fa8fe04
|
Fix:第二章 Transformers架构 图片格式、参考文献格式
|
2025-05-07 23:15:05 +08:00 |
|
KMnO4-zx
|
a0c7b6eb37
|
Fix: 第一章 NLP 基础概念 格式错误
|
2025-05-07 22:45:44 +08:00 |
|
Logan Zou
|
360dd41c56
|
update C6
|
2025-04-26 21:52:12 +08:00 |
|
Logan Zou
|
bdf3be98f3
|
update C2
|
2025-04-26 21:46:33 +08:00 |
|
Logan Zou
|
067b855c84
|
update C3
|
2025-04-26 21:38:20 +08:00 |
|
Logan Zou
|
84c0a2d875
|
finish C6
|
2025-04-26 21:30:48 +08:00 |
|
KMnO4-zx
|
a86accd751
|
Add chapter7 Agent code
|
2025-04-26 20:35:30 +08:00 |
|
KMnO4-zx
|
f216f6d96f
|
del Agent
|
2025-04-26 20:33:10 +08:00 |
|
KMnO4-zx
|
af57ef4956
|
update chapter7 Agent
|
2025-04-26 20:30:41 +08:00 |
|
KMnO4-zx
|
7638cee514
|
Create 第五章 动手搭建大模型 & 第七章 大模型应用
|
2025-04-26 20:28:25 +08:00 |
|
Logan Zou
|
61d30cdae1
|
Create 第四章 大语言模型.md
|
2025-04-26 16:56:28 +08:00 |
|
Logan Zou
|
d313ba5125
|
Create 第三章 预训练语言模型.md
|
2025-04-26 16:42:37 +08:00 |
|
Logan Zou
|
531f1d6711
|
Create 第二章 Transformer架构.md
|
2025-04-26 16:37:01 +08:00 |
|
Logan Zou
|
c903aabcc6
|
Rename 1 NLP基础概念.md to 第一章 NLP基础概念.md
|
2025-04-26 16:28:39 +08:00 |
|
Logan Zou
|
4a7ebeb7e8
|
Update 1 NLP基础概念.md
|
2025-04-26 16:26:34 +08:00 |
|
Logan Zou
|
ad530bc3ab
|
Create 6.4 高效微调.md
|
2025-04-26 16:20:29 +08:00 |
|
Logan Zou
|
b9be826700
|
Delete docs/chapter6/7.2 奖励模型.md
|
2025-04-26 16:01:13 +08:00 |
|
Logan Zou
|
bf91fa3c86
|
Update and rename 7.1 强化学习的目标.md to 6.4[WIP] 偏好对齐.md
|
2025-04-26 16:00:50 +08:00 |
|
Logan Zou
|
106fd678cd
|
finish 6.2
|
2025-04-25 16:33:27 +08:00 |
|