LLM Train
文章目录
训练工具
LLaMA-Factory: GitHub - hiyouga/LLaMA-Factory: A WebUI for Efficient Fine-Tuning of 100+ LLM…
- 多种模型的云训练、微调工具
FAQ
模型大小
模型实际大小计算方法
总大小 = 7B * 4 bytes = 28 GB
但是实际上 Qwen2-7B 大小 15GB
- 这是因为使用了模型压缩技术,比如:使用半精度存储参数 f32 –> f16
文章作者
上次更新 2024-07-16 (7f33ae8)