集群机器搭建多节点MPI运行环境「建议收藏」

集群机器搭建多节点MPI运行环境「建议收藏」1、各个节点安装MPI:https://blog.csdn.net/liu_feng_zi_/article/details/942864382、软硬件环境:1、节点:3个节点:node1,node2,node32、系统操作系统:Centos73、多节点配置1、host配置:通过下面命令打开host文件vim/etc/hosts在每个节点的host文件内添加ip地址和主机名,例如:10.10.1.12node110.10.1.56node210.

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

1、各个节点安装MPI:

https://blog.csdn.net/liu_feng_zi_/article/details/94286438

2、软硬件环境:

1、节点:

3个节点:node1,node2,node3

2、系统

操作系统:Centos 7

3、多节点配置

1、host配置:

通过下面命令打开host文件
vim /etc/hosts

在每个节点的host文件内添加ip地址和主机名,例如:
10.10.1.12  node1
10.10.1.56  node2
10.10.1.23  node3

执行一下host文件
source /etc/hosts

配置成功后,可以使用ping来测试是否修改成功

2、配置节点间ssh免密登录

以node1和node2为例

1、ssh登录到node1,生成公钥,并发送给node2节点

cd ~/.ssh/                     
ssh-keygen -t rsa              # 直接回车
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

2、ssh登录到node2,执行相同的操作,并将产生的公钥发送给node1

cd ~/.ssh/                     
ssh-keygen -t rsa              
scp ./id_rsa.pub node1:~/.ssh/node2_id_rsa.pub#避免名字重复加上对应节点的前缀

3、在node1节点,将发送过来的公钥追加到authorized_keys

cat ~/.ssh/node2_id_rsa.pub >> ~/.ssh/authorized_keys

4、修改文件权限并将authorized_keys文件发送给node2节点

chmod 600 ~/.ssh/authorized_keys       #可能有时不修改也不影响无密登录但还是建议修改
scp ./authorized_keys node2:~/.ssh/authorized_keys

5、把”~/.ssh/”目录下的”node1_id_rsa.pub”等文件删除掉

rm ~/.ssh/node2_id_rsa.pub

6、验证ssh无密登录

集群机器搭建多节点MPI运行环境「建议收藏」

3、MPI多节点执行

mpi可以多节点执行,但是需要保证在每个节点上的相同路径下都有可执行文件,所以每次都要把可执行文件进行远程拷贝

1、新建一个执行文件host,文件内容如下,表示每个节点执行3个进程

node1:3
node2:3
node3:3

 2、执行mpi文件

mpic++  test.cpp -o mpi        #编译
scp ./mpi node2:/home/mpi      #拷贝可执行程序到node2同路径下
scp ./mpi node3:/home/mpi      #拷贝可执行程序到node3同路径下
mpirun -f host -n 9 ./mpi

4、配置NFS共享目录安装配置

服务端:node1

服务端:node2、node3

4.1 服务端配置

1、查看是否已经安装nfs

rpm -qa |grep nfs

集群机器搭建多节点MPI运行环境「建议收藏」

2、没有安装则进行安装

yum -y install nfs-utils rpcbind

3、创建共享目录,一般在根目录下进行创建

mkdir /mpi

4、配置/etc/exports

vim /etc/exports

/mpi 10.10.1.56(rw,sync,root_squash)
/mpi 10.10.1.23(rw,sync,root_squash)

5、启动服务并设置开机启动

service rpcbind start
service nfs start
chkconfig --level 2345 rpcbind on
chkconfig --level 2345 nfs on

4.2 客户端配置

1、查看是否安装nfs,没有则进行安装

2、查看服务端共享目录

showmount -e 10.10.1.12

集群机器搭建多节点MPI运行环境「建议收藏」

若出现错误,可参考 这篇文章:

https://blog.csdn.net/liu_feng_zi_/article/details/108405064

3、挂载共享目录到本地,并测试

mount -t nfs 10.10.1.12:/mpi /mpi

cd /mpi && touch test

4、设置开机自动挂载

vim /etc/fstab
10.10.1.12:/mpi /mpi nfs defaults 0 0

 

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/184663.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号