Commit Graph

124 Commits

Author SHA1 Message Date
Logan Zou
edb73c7aeb Update 第二章 Transformer架构.md 2025-06-24 10:54:02 +08:00
Logan Zou
71f8d48290 Update 第二章 Transformer架构.md 2025-06-23 11:09:04 +08:00
Logan Zou
98a122e323 Update 第二章 Transformer架构.md
add pre-norm
2025-06-23 11:02:23 +08:00
Logan Zou
5f2ccc44bf Update 第二章 Transformer架构.md
fix arg bug
2025-06-23 10:53:45 +08:00
Logan Zou
3950b06a5f Update transformer.py
fix arg bug
2025-06-23 10:53:25 +08:00
Logan Zou
185a212acd Update 第二章 Transformer架构.md 2025-06-23 10:50:16 +08:00
Logan Zou
bd3fb6cf48 Update transformer.py
fix dim bug
2025-06-23 10:48:56 +08:00
KMnO4-zx
3b24a9fd1e docs: 更新README和文档内容,添加模型下载链接
- 在README中新增模型下载章节,包含ModelScope链接
- 更新模型示例代码中的默认检查点路径
- 优化训练脚本的注释和参数说明
- 添加中文文档的模型下载和体验地址
- 修复文档中的训练时长和设备信息
2025-06-22 10:05:36 +08:00
KMnO4-zx
b421894dcc docs(chapter3): 修正T5模型中RMSNorm公式的描述和参数说明 2025-06-21 13:36:42 +08:00
KMnO4-zx
fc19776feb docs(chapter4): 修正章节编号错误 2025-06-21 13:35:09 +08:00
KMnO4-zx
30f3f01619 refactor(dataset): 使用tokenizer动态生成a_sequence并替换硬编码值
fix(ddp_sft_full): 修正参数默认值和优化器类型
docs(ddp_pretrain): 添加详细注释和优化参数描述
2025-06-21 11:39:40 +08:00
KMnO4-zx
21bc50882a docs: 更新README文件中的徽章样式和链接
- 将徽章样式从for-the-badge改为flat
- 添加GitHub Project和SwanLab项目链接
- 更新第六章状态为进行中
2025-06-21 11:37:30 +08:00
KMnO4-zx
fe07d0ede1 feat(RAG): 更新RAG模块代码和文档
refactor: 简化Embeddings和LLM类实现,移除不必要依赖
docs: 更新文档内容,添加硅基流动API使用说明
chore: 更新requirements.txt依赖版本
2025-06-20 22:53:23 +08:00
KMnO4-zx
0eea57b11f docs: 修复章节2中Embedding层的拼写错误 2025-06-20 15:04:23 +08:00
KMnO4-zx
dcdf98df22 docs(chapter7): 修正图7.10的标题描述 2025-06-20 12:17:39 +08:00
KMnO4-zx
2b9b53a383 docs: 调整文档中图片位置并删除重复内容 2025-06-20 12:15:19 +08:00
KMnO4-zx
28636a0f9b feat(Agent): 新增维基百科搜索和温度查询工具并实现web界面
- 添加search_wikipedia和get_current_temperature工具函数
- 实现基于Streamlit的web交互界面
- 更新requirements.txt添加相关依赖
- 修复PROMPT_TEMPLATE变量名拼写错误
- 移除不再使用的工具函数
- 添加web界面截图到文档
2025-06-20 12:14:19 +08:00
MengYue-MK2000
b1ac936d36 created windows_download_dataset.sh, deleted original changes in download_dataset.sh 2025-06-19 17:52:24 +08:00
Reagan Zhang
18ff1a73a8 Update download_dataset.sh
Update Mac installation for modelscope
2025-06-19 16:09:59 +08:00
Reagan Zhang
56fb0c34d4 Update download_dataset.sh 2025-06-19 16:06:05 +08:00
KMnO4-zx
2601c45444 docs(chapter5): 修复LLaMA2 Attention结构图中图片链接格式 2025-06-18 16:33:43 +08:00
KMnO4-zx
2fca30c239 docs(chapter5): 更新LLaMA2注意力机制图示 2025-06-18 16:32:07 +08:00
KMnO4-zx
ce535629ca docs(chapter5): 更新模型文档并添加数据处理脚本
- 更新LLaMA2模型文档,修正图片引用和编号
- 添加Attention结构示意图
- 新增数据处理脚本download_dataset.sh和deal_dataset.py
- 优化文档中的代码示例说明
2025-06-18 16:26:33 +08:00
KMnO4-zx
ada2e0c44f fix(download.py): 修复解压命令未指定目标目录的问题 2025-06-18 12:34:52 +08:00
KMnO4-zx
5d25cb0992 docs: 更新README中图片路径引用 2025-06-17 17:18:34 +08:00
KMnO4-zx
20a4bde837 docs(chapter1): 在NLP基础概述中添加词汇表说明 2025-06-17 17:10:45 +08:00
KMnO4-zx
1f46fc1dd5 docs: 更新文档中的图片链接为绝对路径
将所有文档中的相对图片路径替换为完整的GitHub raw链接,确保图片在文档中能够正确显示
2025-06-17 17:07:09 +08:00
KMnO4-zx
6dd4815b1e docs(chapter4): 修正大语言模型章节中的公式格式和空格
统一公式前后空格格式,提高文档可读性
2025-06-17 12:21:31 +08:00
KMnO4-zx
d49819cd9d docs(chapter4): 修正奖励模型公式中的数学符号和格式错误
修复公式中的数学符号显示问题,包括 KL 散度计算和奖励函数中的点乘符号
2025-06-17 12:16:06 +08:00
KMnO4-zx
08ee8ef753 docs(chapter2): 修正自注意力机制文档中的错别字 2025-06-15 09:45:06 +08:00
KMnO4-zx
a866753911 docs: 修正文档链接路径
更新README.md和docs/README.md中的前言链接路径,从`./docs/README.md`改为`./前言.md`以保持一致性
2025-06-13 21:49:24 +08:00
KMnO4-zx
5e8f26544a docs: 更新star-history 2025-06-12 16:58:18 +08:00
KMnO4-zx
5713a54960 fix(docs): 修正文档中torch拼写错误 2025-06-12 09:10:18 +08:00
KMnO4-zx
6a47afc997 fix: 修正 5.1.2 中输出张量形状的错误 2025-06-12 09:08:38 +08:00
KMnO4-zx
2beb3ae3f4 docs(chapter1): 更新NLP基础章节内容,添加分词和向量空间模型示例
添加中文分词示例展示正确与错误的分词结果对比
补充向量空间模型的稀疏性示例代码说明
2025-06-09 22:20:18 +08:00
KMnO4-zx
9efbb69dfd docs(chapter5): 添加LLaMA2结构图并更新依赖
更新requirements.txt中的pytorch为torch以保持一致性
2025-06-09 22:14:01 +08:00
Logan Zou
a3ad553943 Update 第二章 Transformer架构.md 2025-06-09 11:14:50 +08:00
Logan Zou
21fc6b7ac6 fix ch2 demo bug-n_head 2025-06-09 11:00:24 +08:00
KMnO4-zx
d99ad30711 docs: 修正文档中"检索增强生产"为"检索增强生成" 2025-06-09 08:07:06 +08:00
KMnO4-zx
9569c9fdca fix(tokenizer): 将add_prefix_space配置改为false 2025-06-08 09:27:21 +08:00
KMnO4-zx
04e14a978b docs(chapter5): 修正RMSNorm公式中的变量和描述
- 将公式中的权重变量 $w_i$ 改为输入变量 $x_i$ 以匹配实际实现
- 添加可学习的缩放参数 $\gamma$ 到公式中
- 更新变量描述使其更准确
2025-06-05 10:54:45 +08:00
wasamtc
57cb6ea261 Create requirements.txt 2025-06-04 14:38:26 +08:00
wasamtc
5869c6493d Create transformer.py 2025-06-04 14:36:37 +08:00
KMnO4-zx
f909cd1a87 docs:修改内容结构 && update readme 2025-06-03 18:52:33 +08:00
KMnO4-zx
32c3f16b8c fix: add chapter5 reauirements 2025-06-03 18:42:51 +08:00
Logan Zou
919a772c99 Update 第四章 大语言模型.md 2025-06-03 16:50:46 +08:00
Logan Zou
bbede84054 fix config bug 2025-06-03 14:10:23 +08:00
Logan Zou
e76ee8e24b fix decoder bug 2025-06-03 10:25:51 +08:00
Logan Zou
530c73dc0d Update 第二章 Transformer架构.md 2025-05-28 10:44:27 +08:00
Logan Zou
774e5073c1 Update 第二章 Transformer架构.md 2025-05-28 10:39:57 +08:00