torque里修改stack size
在一台服务器上装了torque,本机作为server也作为计算节点,但是在提交vasp计算任务时,总会遇到
mpirun noticed that process rank 14 with PID 80004 on node silverstar exited on signal 11 (Segmentation fault).
这个问题以前的解决方法是在.bashrc里面添加一行
ulimit -s unlimited
这样的话,在本机直接用mpirun运行vasp就没有报错,但是现在用torque提交计算后在任务日志里就出现这样一行
/home/lxm/.bashrc: line 17: ulimit: stack size: cannot modify limit: Operation not permitted
所以应该是由torque提交的任务还是受内存限制,不能继续运行。
请教这个问题有什么解决办法? 返回小木虫查看更多
今日热帖
谢谢回复,试了一下还是不行,
/etc/profile: line 78: ulimit: stack size: cannot modify limit: Operation not permitted
感觉这个问题是卡在了pbs_mom的堆栈限制,因为pbs_mom的堆栈大小是12288,所以当pbs脚本里面试图修改堆栈大小为unlimited时,超出了pbs_mom的限制,所以就报错Operation not permitted
,
你这句命令在终端能执行不?感觉就是命令和权限的问题,关于这个限制,你得查下普通用户是怎么转接的,毕竟你root都是可以顺利执行的
谢谢回复,普通用户终端下是可以执行的,只是进程的堆栈限制没有解除所以报错。
问题已解决,把/etc/systemd/user.conf里面也设置DefaultLimitSTACK=infinity就可以解除pbs_mom进程的堆栈限制了。麻烦版主帮忙结贴。
楼主你好,我跟你一摸一样的问题,系统是centos7,然而改了之后还是这样子,你能把你的user.conf文件贴出来吗