当前位置: 首页 > 第一原理 >torque里修改stack size

torque里修改stack size

作者 nkleof
来源: 小木虫 600 12 举报帖子
+关注

在一台服务器上装了torque,本机作为server也作为计算节点,但是在提交vasp计算任务时,总会遇到
mpirun noticed that process rank 14 with PID 80004 on node silverstar exited on signal 11 (Segmentation fault).
这个问题以前的解决方法是在.bashrc里面添加一行
ulimit -s unlimited
这样的话,在本机直接用mpirun运行vasp就没有报错,但是现在用torque提交计算后在任务日志里就出现这样一行
/home/lxm/.bashrc: line 17: ulimit: stack size: cannot modify limit: Operation not permitted
所以应该是由torque提交的任务还是受内存限制,不能继续运行。
请教这个问题有什么解决办法? 返回小木虫查看更多

今日热帖
  • 精华评论
  • nkleof

    引用回帖:
    8楼: Originally posted by lyl453433939 at 2018-01-22 11:34:13
    /home/lxm/.bashrc: line 17: ulimit: stack size: cannot modify limit: Operation not permitted,普通用户没有这个权限的话,可以直用root将limit -s unlimited加在/etc/profile最后面,执行的时候在pbs中加上so ...

    谢谢回复,试了一下还是不行,

    /etc/profile: line 78: ulimit: stack size: cannot modify limit: Operation not permitted

    感觉这个问题是卡在了pbs_mom的堆栈限制,因为pbs_mom的堆栈大小是12288,所以当pbs脚本里面试图修改堆栈大小为unlimited时,超出了pbs_mom的限制,所以就报错Operation not permitted

  • lyl453433939

    引用回帖:
    9楼: Originally posted by nkleof at 2018-01-23 16:47:20
    谢谢回复,试了一下还是不行,

    /etc/profile: line 78: ulimit: stack size: cannot modify limit: Operation not permitted

    感觉这个问题是卡在了pbs_mom的堆栈限制,因为pbs_mom的堆栈大小是12288,所以当 ...

    你这句命令在终端能执行不?感觉就是命令和权限的问题,关于这个限制,你得查下普通用户是怎么转接的,毕竟你root都是可以顺利执行的

  • nkleof

    引用回帖:
    10楼: Originally posted by lyl453433939 at 2018-01-23 17:55:18
    你这句命令在终端能执行不?感觉就是命令和权限的问题,关于这个限制,你得查下普通用户是怎么转接的,毕竟你root都是可以顺利执行的...

    谢谢回复,普通用户终端下是可以执行的,只是进程的堆栈限制没有解除所以报错。

  • nkleof

    问题已解决,把/etc/systemd/user.conf里面也设置DefaultLimitSTACK=infinity就可以解除pbs_mom进程的堆栈限制了。麻烦版主帮忙结贴。

  • bjstry

    引用回帖:
    12楼: Originally posted by nkleof at 2018-01-27 16:02:28
    问题已解决,把/etc/systemd/user.conf里面也设置DefaultLimitSTACK=infinity就可以解除pbs_mom进程的堆栈限制了。麻烦版主帮忙结贴。

    楼主你好,我跟你一摸一样的问题,系统是centos7,然而改了之后还是这样子,你能把你的user.conf文件贴出来吗

猜你喜欢
下载小木虫APP
与700万科研达人随时交流
  • 二维码
  • IOS
  • 安卓