Pytorch
文章目录
torchrun 训练
错误问题
突然中断 sighup 1
原因
- 使用 nohup + torchrun 后台运行导致
解决方法
- 参考: DDP Error: torch.distributed.elastic.agent.server.api:Received 1 death signal…
- 使用 tmux 或者 screen 命令把 torchrun 后台运行
torch.Tensor
Tensor.scatter_ 用法
文章作者
上次更新 2024-07-16 (7f33ae8)