用单卡复现一个小型GPT预训练：数据准备、训练脚本与关键超参

2026-03-19 Ai大模型训练教程,单卡GPT预训练,小型GPT复现,预训练数据准备,tokenizer训练,BPE分词,SentencePiece,packing打包,训练脚本,学习率warmup,梯度累积,AdamW超参

原始问题：

本文属于《Ai大模型训练教程》系列，详解如何用单张GPU复现一个小型GPT预训练：从JSONL语料清洗去重、训练Tokenizer与token打包，到单卡训练脚本必备功能与关键超参（batch/梯度累积、学习率与warmup、weight decay、grad clip、seq_len等），并给出可落地的配置建议与常见故障排查路径。