Commit Graph

102 Commits

Author SHA1 Message Date
KMnO4-zx
ce535629ca docs(chapter5): 更新模型文档并添加数据处理脚本
- 更新LLaMA2模型文档,修正图片引用和编号
- 添加Attention结构示意图
- 新增数据处理脚本download_dataset.sh和deal_dataset.py
- 优化文档中的代码示例说明
2025-06-18 16:26:33 +08:00
KMnO4-zx
ada2e0c44f fix(download.py): 修复解压命令未指定目标目录的问题 2025-06-18 12:34:52 +08:00
KMnO4-zx
5d25cb0992 docs: 更新README中图片路径引用 2025-06-17 17:18:34 +08:00
KMnO4-zx
20a4bde837 docs(chapter1): 在NLP基础概述中添加词汇表说明 2025-06-17 17:10:45 +08:00
KMnO4-zx
1f46fc1dd5 docs: 更新文档中的图片链接为绝对路径
将所有文档中的相对图片路径替换为完整的GitHub raw链接,确保图片在文档中能够正确显示
2025-06-17 17:07:09 +08:00
KMnO4-zx
6dd4815b1e docs(chapter4): 修正大语言模型章节中的公式格式和空格
统一公式前后空格格式,提高文档可读性
2025-06-17 12:21:31 +08:00
KMnO4-zx
d49819cd9d docs(chapter4): 修正奖励模型公式中的数学符号和格式错误
修复公式中的数学符号显示问题,包括 KL 散度计算和奖励函数中的点乘符号
2025-06-17 12:16:06 +08:00
KMnO4-zx
08ee8ef753 docs(chapter2): 修正自注意力机制文档中的错别字 2025-06-15 09:45:06 +08:00
KMnO4-zx
a866753911 docs: 修正文档链接路径
更新README.md和docs/README.md中的前言链接路径,从`./docs/README.md`改为`./前言.md`以保持一致性
2025-06-13 21:49:24 +08:00
KMnO4-zx
5e8f26544a docs: 更新star-history 2025-06-12 16:58:18 +08:00
KMnO4-zx
5713a54960 fix(docs): 修正文档中torch拼写错误 2025-06-12 09:10:18 +08:00
KMnO4-zx
6a47afc997 fix: 修正 5.1.2 中输出张量形状的错误 2025-06-12 09:08:38 +08:00
KMnO4-zx
2beb3ae3f4 docs(chapter1): 更新NLP基础章节内容,添加分词和向量空间模型示例
添加中文分词示例展示正确与错误的分词结果对比
补充向量空间模型的稀疏性示例代码说明
2025-06-09 22:20:18 +08:00
KMnO4-zx
9efbb69dfd docs(chapter5): 添加LLaMA2结构图并更新依赖
更新requirements.txt中的pytorch为torch以保持一致性
2025-06-09 22:14:01 +08:00
Logan Zou
a3ad553943 Update 第二章 Transformer架构.md 2025-06-09 11:14:50 +08:00
Logan Zou
21fc6b7ac6 fix ch2 demo bug-n_head 2025-06-09 11:00:24 +08:00
KMnO4-zx
d99ad30711 docs: 修正文档中"检索增强生产"为"检索增强生成" 2025-06-09 08:07:06 +08:00
KMnO4-zx
9569c9fdca fix(tokenizer): 将add_prefix_space配置改为false 2025-06-08 09:27:21 +08:00
KMnO4-zx
04e14a978b docs(chapter5): 修正RMSNorm公式中的变量和描述
- 将公式中的权重变量 $w_i$ 改为输入变量 $x_i$ 以匹配实际实现
- 添加可学习的缩放参数 $\gamma$ 到公式中
- 更新变量描述使其更准确
2025-06-05 10:54:45 +08:00
wasamtc
57cb6ea261 Create requirements.txt 2025-06-04 14:38:26 +08:00
wasamtc
5869c6493d Create transformer.py 2025-06-04 14:36:37 +08:00
KMnO4-zx
f909cd1a87 docs:修改内容结构 && update readme 2025-06-03 18:52:33 +08:00
KMnO4-zx
32c3f16b8c fix: add chapter5 reauirements 2025-06-03 18:42:51 +08:00
Logan Zou
919a772c99 Update 第四章 大语言模型.md 2025-06-03 16:50:46 +08:00
Logan Zou
bbede84054 fix config bug 2025-06-03 14:10:23 +08:00
Logan Zou
e76ee8e24b fix decoder bug 2025-06-03 10:25:51 +08:00
Logan Zou
530c73dc0d Update 第二章 Transformer架构.md 2025-05-28 10:44:27 +08:00
Logan Zou
774e5073c1 Update 第二章 Transformer架构.md 2025-05-28 10:39:57 +08:00
Logan Zou
ee61bfe720 Update 第二章 Transformer架构.md 2025-05-28 10:34:46 +08:00
KMnO4-zx
20586c2790 docs:update readme 2025-05-27 16:15:57 +08:00
KMnO4-zx
1425d45870 docs:update reame images scale 2025-05-25 10:11:41 +08:00
KMnO4-zx
f9fe12d99a docs:add docsify deploy 2025-05-25 00:02:24 +08:00
不要葱姜蒜
731af3ce5b Update README.md 2025-05-16 09:53:55 +08:00
KMnO4-zx
9257ba2bcc docs:第三章、前言 小修 2025-05-15 15:54:01 +08:00
Logan Zou
44ae230eb3 Update README.md 2025-05-15 15:26:54 +08:00
Logan Zou
500ca7bf31 Update README.md 2025-05-15 12:26:13 +08:00
KMnO4-zx
c9d22772a1 doc:修复第七章 tiny-agent 2025-05-14 21:26:54 +08:00
KMnO4-zx
ab3e092186 doc:修正第二章公式 2025-05-13 21:21:10 +08:00
KMnO4-zx
786c77e2ea doc:修正 第二章共识排版 2025-05-13 21:19:31 +08:00
KMnO4-zx
78309523d5 docs:第七章 大模型应用 内容修改 2025-05-13 21:07:51 +08:00
KMnO4-zx
c16ee23323 docs:第六章 大模型训练流程实践 图片格式 参考格式修改 2025-05-13 20:42:51 +08:00
KMnO4-zx
7127aa48b3 docs:第五章 动手搭建大模型 修改图片、引用格式 2025-05-13 20:10:12 +08:00
KMnO4-zx
9763467812 docs:第四章 大语言模型 修改完成 2025-05-12 11:05:25 +08:00
KMnO4-zx
a1e533632e docs:第三章 预训练语言模型 (除GLM外)修复完成,等待添加deepseek-v3 2025-05-10 13:46:08 +08:00
KMnO4-zx
9821f37bc0 docs:第二章 Transformers 架构 修复 2025-05-09 18:54:52 +08:00
KMnO4-zx
311fa8fe04 Fix:第二章 Transformers架构 图片格式、参考文献格式 2025-05-07 23:15:05 +08:00
KMnO4-zx
a0c7b6eb37 Fix: 第一章 NLP 基础概念 格式错误 2025-05-07 22:45:44 +08:00
Logan Zou
360dd41c56 update C6 2025-04-26 21:52:12 +08:00
Logan Zou
bdf3be98f3 update C2 2025-04-26 21:46:33 +08:00
Logan Zou
067b855c84 update C3 2025-04-26 21:38:20 +08:00