orangeboy 发表于 2009-12-14 14:35:52

linux下,mpi并行计算的一个问题

我用的是曙光机群,
我在做real.exe,metgrid.exe等时候,用命令mpirun -np 8 real.exe,是可行的,生成有rsl.out和rsl.error各自8个文件
而在做wrf.exe时候,只能用-np1,2~8都不行
但是如果我把区域设置一重,格点数减少,也就是把计算量较少,用-np 8是可以成功的

也就是说,当计算量小的时候,并行可以作业;当计算量大了,就不行

不知道是什么原因导致的?内存问题吗?我用ulimit -a 命令显示如下信息:

core file size          (blocks, -c) 0
data seg size         (kbytes, -d) unlimited
file size               (blocks, -f) unlimited
pending signals               (-i) 1024
max locked memory       (kbytes, -l) 32
max memory size         (kbytes, -m) unlimited
open files                      (-n) 16384
pipe size            (512 bytes, -p) 8
POSIX message queues   (bytes, -q) 819200
stack size            (kbytes, -s) 10240
cpu time               (seconds, -t) unlimited
max user processes            (-u) 40960
virtual memory          (kbytes, -v) unlimited
file locks                      (-x) unlimited

请知道的大侠帮忙一下,谢谢~~
页: [1]
查看完整版本: linux下,mpi并行计算的一个问题