LLM Train

2024-07-12 约 154 字预计阅读 1 分钟

文章目录

参考

教程

如何从零开始训练大模型？（非常详细）零基础入门到精通，收藏这一篇就够了_大模型怎么训练-CSDN博客

训练工具

LLaMA-Factory: GitHub - hiyouga/LLaMA-Factory: A WebUI for Efficient Fine-Tuning of 100+ LLM…
- 多种模型的云训练、微调工具

FAQ

模型大小

模型实际大小计算方法
```
总大小 = 7B * 4 bytes = 28 GB
```
- 但是实际上 Qwen2-7B 大小 15GB
  - 这是因为使用了模型压缩技术，比如：使用半精度存储参数 f32 –> f16

文章作者

上次更新 2024-07-16 (7f33ae8)