一个简单的PyTorch技巧，让GPU内存占用减半！网友GabrieleBe

量子位来谈科技 2025-06-30 17:28:54

一个简单的PyTorch技巧，让GPU内存占用减半！网友Gabriele Berton分享了一个他多年来一直在使用的小技巧，能够大幅提升内存效率，核心在于：逐个损失反向传播。这个技巧的关键在于：与其把所有损失加起来再一次性进行反向传播，不如对每个损失单独进行反向传播。【图1】这样做的好处是，每次反向传播后，对应的计算图就会立即释放，从而节省大量内存。也就是说，相比较于： loss1 = compute_loss1(model, images) loss2 = compute_loss2(model, images) loss = loss1 + loss2 loss.backward() 像这样优化，更能节省内存 loss1 = compute_loss1(model, images) loss1.backward() loss2 = compute_loss2(model, images) loss2.backward() 不过，这个技巧只适用于存在多个独立损失函数的情况。损失函数越多，节省的 GPU 内存就越明显。而且，如果损失函数之间相互耦合（例如，一个损失的计算依赖于另一个损失的中间结果），那么这个方法就不适用了。这里给出一个耦合损失的反例，此时该方法将失效【图2】这个方法为什么能省内存呢？深度学习训练过程中，计算图是消耗 GPU 内存的大户。当你对一个损失执行 backward() 后，PyTorch会立即释放与该损失相关的计算图。通过分步反向传播，每次处理完一个损失就释放一部分计算图，从而有效降低峰值内存占用。在某些情况下，当不同的损失函数需要处理不同的输入数据时，分步前向传播（以及随后的分步反向传播）甚至是唯一可行的方案。大家可以亲自尝试一下～

0 阅读：0

量子位来谈科技

感谢大家的关注

作者最新文章

1

让你的代码更可靠？秘诀是在脑中“写证明”！有网友分享了一个写代码时的小技巧，引

2

马斯克组建的效率部门员工Marko Elez闯祸了！他不小心在GitHub泄漏

3

OpenAI联合谷歌DeepMind等机构，提出“思维链监控”可能是未来AI安全

4

最近有国外网友指出，Kimi K2正在经历一次“小型DeepSeek时刻”【图1

5

倒反天罡！ChatGPT等AI工具，正悄悄影响人类说话方式。德国Max Pla

6

OpenAI COO Brad Lightcap和首席经济学家Ronnie Ch

7

研究表明，地球自转加速了！根据美国天文台最新测量，今年7月的一些日子是地球近年

8

Meta也不想开源了？Llama 4 Behemoth项目或被放弃。根据《纽约

9

Uber和百度联手了？就在昨晚，百度旗下萝卜快跑官宣与Uber建立战略合作伙伴

10

“Mauro, SHUT THE FUCK UP!” 你和大模型对话，是上面这个

热门分类

科技TOP

1

这台是什么手机？

2

没想到荣耀magic8系列居然还有新机，ProAir！！！原本以为春节

3

2699起，才2699，其中我以为最起码要2999。256版本是满一刀享受限时优

4

2025年终中端机封神！等等党赢麻了✅5款真香机性价比拉满，闭眼冲不亏！✅荣

5

自2026年1月9日起，马斯克的xAI将Grok在X平台的图像生成功能全面转为付

6

微信更新后最利于单删的功能挺好，算得上微信年度最有用更新了，比直接拉黑名单更狠

7

华为鸿蒙6.0.0.120SP6更新推送，优化了系统使用体验，并且该版本更

8

好奇去查了一下2025年华为销量最高的五款机型。第一名：nova13第二名：n

9

一图看清百度集团品牌矩阵。让大家知道百度没老，只是疲了。

10

前几天刷到荣耀Magic8系列还有mini版，或者Air版。这会看来，是真的。方

科技最新文章

1

🔥荣耀手机怎么选？一篇帮你搞定！不踩雷攻略来啦！✅旗舰体验首选：荣耀Mag

2

iPhone11，3110mAhiPhone13，3240mAhiPhone

3

抛开品牌因素，只看第一眼，大家最喜欢哪一家的顶级旗舰？就我个人的角度，感觉今

4

听我一句劝！荣耀推出的中高端新机从这四款去选就对了，那么如何选择更切合使用需求？

5

自2026年1月9日起，马斯克的xAI将Grok在X平台的图像生成功能全面转为付

6

马斯克说人类可实现半永生。把大脑拷贝下来，复制到机器人身上，让它替你永生。这对普

7

硅谷狂人马斯克再爆惊世预言！脑机接口改写人类寿命密码，半永生时代或于2026年降

8

等等党又赢麻了，荣耀500迎来白菜价，大家可以捡漏了这一代的荣耀数字系列，用

9

不装了！直接摊牌，荣耀就是不讲武德，2000+价位直接被荣耀搅的翻天地覆了[捂脸

10

美国科技巨头马斯克今天发文说：“星链无法在南非获得互联网服务提供商许可证，唯一的