569 B
569 B
第六章 基于 transformers 的 LLM 训练
注:本章的核心内容是,基于 transformers 框架实现 LLM 预训练和微调
- 框架简述:
- transformers
- deepspeed
- peft
- wandb
- tokenizers
- 基于 transformers 的 LLM 预训练
- 分词器训练
- 数据集构建
- 模型搭建/继承预训练模型
- 构造 Trainer 进行训练
- 基于 transformers 的 LLM SFT/下游任务微调
- 分词器训练
- 数据集构建
- LoRA 配置
- 继承预训练模型
- 构造 Trainer 进行训练