添加链接

注册登录

link之家

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

相关文章推荐

豪情万千的麻辣香锅 · JavaScript多功能甘特图组件 - ...· 1 年前 ·

曾经爱过的猴子 · 解决 SQL Server ...· 1 年前 ·

博学的墨镜 · 通过 Web ...· 1 年前 ·

愤怒的豆芽 · Web调用网络摄像头及各类错误处理 - ...· 1 年前 ·

坚强的遥控器 · WinDbg ...· 1 年前 ·

登录注册写文章

[解决]GPU显存未释放问题

[解决]GPU显存未释放问题

我们在使用 tensorflow + pycharm 或者 PyTorch 写程序的时候,　有时候会在控制台终止掉正在运行的程序，但是有时候程序已经结束了， nvidia-smi 也看到没有程序了，但是 GPU 的内存并没有释放，这是怎么回事呢？
使用 PyTorch 设置多线程（threads）进行数据读取（DataLoader），其实是假的多线程，他是开了N个子进程（PID都连着）进行模拟多线程工作，所以你的程序跑完或者中途kill掉主进程的话，子进程的GPU显存并不会被释放，需要手动一个一个kill才行，具体方法描述如下：

1.先关闭ssh（或者shell）窗口，退出重新登录
2.查看运行在gpu上的所有程序：

fuser -v /dev/nvidia*
3.kill掉所有（连号的）僵尸进程
具体操作步骤如下：

我们可以用如下命令查看 nvidia-smi看不到的GPU进程。
nvidia-smi         
发现内存泄露问题，即没有进程时，内存被占用

推荐文章

豪情万千的麻辣香锅 · JavaScript多功能甘特图组件 - jsGantt - 掘金

1 年前

曾经爱过的猴子 · 解决 SQL Server 数据库单元测试问题 - SQL Server Data Tools (SSDT) | Microsoft Learn

1 年前

博学的墨镜 · 通过 Web 控制蓝牙设备：WebBluetooth入门_navigator.bluetooth.requestdevice_疯狂的技术宅的博客-CSDN博客

1 年前

愤怒的豆芽 · Web调用网络摄像头及各类错误处理 - 飞灰同学 - 博客园

1 年前

坚强的遥控器 · WinDbg 查找问题异常堆栈，堆栈跟踪UnhandledExceptionFilter _less@more的博客-CSDN博客

1 年前

今天看啥 · Py中国 · codingpro · 藏经阁 · 小百科 · link之家 · 卧龙AI搜索

删除内容请联系邮箱 2879853325@qq.com

link之家 - 链接快照平台

© 2024 ~ 沪ICP备11025650号