皇上,还记得我吗?我就是1999年那个Linux伊甸园啊-----24小时滚动更新开源资讯,全年无休!

ClusterShell:一个在集群节点上并行运行命令的好工具

我们过去曾写过两篇如何并行地在多个远程服务器上运行命令的文章:并行 SSH(PSSH) 和分布式 Shell(DSH)。今天,我们将讨论相同类型的主题,但它允许我们在集群节点上执行相同的操作。你可能会想,我可以编写一个小的 shell 脚本来实现这个目的,而不是安装这些第三方软件包。

当然,你是对的,如果要在十几个远程系统中运行一些命令,那么你不需要使用它。但是,你的脚本需要一些时间来完成此任务,因为它是按顺序运行的。想想你要是在一千多台服务器上运行一些命令会是什么样子?在这种情况下,你的脚本用处不大。此外,完成任务需要很长时间。所以,要克服这种问题和情况,我们需要可以在远程计算机上并行运行命令。

为此,我们需要在一个并行应用程序中使用它。我希望这个解释可以解决你对并行实用程序的疑虑。

ClusterShell

ClusterShell 是一个事件驱动的开源 Python 库,旨在在服务器场或大型 Linux 集群上并行运行本地或远程命令。(clush 即 ClusterShell)。

它将处理在 HPC 集群上遇到的常见问题,例如在节点组上操作,使用优化过的执行算法运行分布式命令,以及收集结果和合并相同的输出,或检索返回代码。

ClusterShell 可以利用已安装在系统上的现有远程 shell 设施,如 SSH。

ClusterShell 的主要目标是通过为开发人员提供轻量级、但可扩展的 Python API 来改进高性能集群的管理。它还提供了 clushclubak 和 cluset/nodeset等方便的命令行工具,可以让传统的 shell 脚本利用这个库的一些功能。

ClusterShell 是用 Python 编写的,它需要 Python(v2.6+ 或 v3.4+)才能在你的系统上运行。

如何在 Linux 上安装 ClusterShell?

ClusterShell 包在大多数发行版的官方包管理器中都可用。因此,使用发行版包管理器工具进行安装。

对于 Fedora 系统,使用 DNF 命令来安装 clustershell。

  1. $ sudo dnf install clustershell

如果系统默认是 Python 2,这会安装 Python 2 模块和工具,可以运行以下命令安装 Python 3 开发包。

  1. $ sudo dnf install python3-clustershell

在执行 clustershell 安装之前,请确保你已在系统上启用 EPEL 存储库

对于 RHEL/CentOS 系统,使用 YUM 命令 来安装 clustershell。

  1. $ sudo yum install clustershell

如果系统默认是 Python 2,这会安装 Python 2 模块和工具,可以运行以下命令安装 Python 3 开发包。

  1. $ sudo yum install python34-clustershell

对于 openSUSE Leap 系统,使用 Zypper 命令 来安装 clustershell。

  1. $ sudo zypper install clustershell

如果系统默认是 Python 2,这会安装 Python 2 模块和工具,可以运行以下命令安装 Python 3 开发包。

  1. $ sudo zypper install python3-clustershell

对于 Debian/Ubuntu 系统,使用 APT-GET 命令 或 APT 命令 来安装 clustershell。

  1. $ sudo apt install clustershell

如何在 Linux 使用 PIP 安装 ClusterShell?

可以使用 PIP 安装 ClusterShell,因为它是用 Python 编写的。

在执行 clustershell 安装之前,请确保你已在系统上启用了 Python 和 PIP

  1. $ sudo pip install ClusterShell

如何在 Linux 上使用 ClusterShell?

与其他实用程序(如 pssh 和 dsh)相比,它是直接了当的优秀工具。它有很多选项可以在远程并行执行。

在开始使用 clustershell 之前,请确保你已启用系统上的无密码登录

以下配置文件定义了系统范围的默认值。你不需要修改这里的任何东西。

  1. $ cat /etc/clustershell/clush.conf

如果你想要创建一个服务器组,那也可以。默认情况下有一些示例,请根据你的要求执行相同操作。

  1. $ cat /etc/clustershell/groups.d/local.cfg

只需按以下列格式运行 clustershell 命令即可从给定节点获取信息:

  1. $ clush -w 192.168.1.4,192.168.1.9 cat /proc/version
  2. 192.168.1.9: Linux version 4.15.0-45-generic ([email protected]) (gcc version 7.3.0 (Ubuntu 7.3.0-16ubuntu3)) #48-Ubuntu SMP Tue Jan 29 16:28:13 UTC 2019
  3. 192.168.1.4: Linux version 3.10.0-957.el7.x86_64 ([email protected]) (gcc version 4.8.5 20150623 (Red Hat 4.8.5-36) (GCC) ) #1 SMP Thu Nov 8 23:39:32 UTC 2018

选项:

  • -w: 你要运行该命令的节点。

你可以使用正则表达式而不是使用完整主机名和 IP:

  1. $ clush -w 192.168.1.[4,9] uname -r
  2. 192.168.1.9: 4.15.0-45-generic
  3. 192.168.1.4: 3.10.0-957.el7.x86_64

或者,如果服务器位于同一 IP 系列中,则可以使用以下格式:

  1. $ clush -w 192.168.1.[4-9] date
  2. 192.168.1.6: Mon Mar 4 21:08:29 IST 2019
  3. 192.168.1.7: Mon Mar 4 21:08:29 IST 2019
  4. 192.168.1.8: Mon Mar 4 21:08:29 IST 2019
  5. 192.168.1.5: Mon Mar 4 09:16:30 CST 2019
  6. 192.168.1.9: Mon Mar 4 21:08:29 IST 2019
  7. 192.168.1.4: Mon Mar 4 09:16:30 CST 2019

clustershell 允许我们以批处理模式运行命令。使用以下格式来实现此目的:

  1. $ clush -w 192.168.1.4,192.168.1.9 -b
  2. Enter 'quit' to leave this interactive mode
  3. Working with nodes: 192.168.1.[4,9]
  4. clush> hostnamectl
  5. ---------------
  6. 192.168.1.4
  7. ---------------
  8. Static hostname: CentOS7.2daygeek.com
  9. Icon name: computer-vm
  10. Chassis: vm
  11. Machine ID: 002f47b82af248f5be1d67b67e03514c
  12. Boot ID: f9b37a073c534dec8b236885e754cb56
  13. Virtualization: kvm
  14. Operating System: CentOS Linux 7 (Core)
  15. CPE OS Name: cpe:/o:centos:centos:7
  16. Kernel: Linux 3.10.0-957.el7.x86_64
  17. Architecture: x86-64
  18. ---------------
  19. 192.168.1.9
  20. ---------------
  21. Static hostname: Ubuntu18
  22. Icon name: computer-vm
  23. Chassis: vm
  24. Machine ID: 27f6c2febda84dc881f28fd145077187
  25. Boot ID: f176f2eb45524d4f906d12e2b5716649
  26. Virtualization: oracle
  27. Operating System: Ubuntu 18.04.2 LTS
  28. Kernel: Linux 4.15.0-45-generic
  29. Architecture: x86-64
  30. clush> free -m
  31. ---------------
  32. 192.168.1.4
  33. ---------------
  34. total used free shared buff/cache available
  35. Mem: 1838 641 217 19 978 969
  36. Swap: 2047 0 2047
  37. ---------------
  38. 192.168.1.9
  39. ---------------
  40. total used free shared buff/cache available
  41. Mem: 1993 352 1067 1 573 1473
  42. Swap: 1425 0 1425
  43. clush> w
  44. ---------------
  45. 192.168.1.4
  46. ---------------
  47. 09:21:14 up 3:21, 3 users, load average: 0.00, 0.01, 0.05
  48. USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
  49. daygeek :0 :0 06:02 ?xdm? 1:28 0.30s /usr/libexec/gnome-session-binary --session gnome-classic
  50. daygeek pts/0 :0 06:03 3:17m 0.06s 0.06s bash
  51. daygeek pts/1 192.168.1.6 06:03 52:26 0.10s 0.10s -bash
  52. ---------------
  53. 192.168.1.9
  54. ---------------
  55. 21:13:12 up 3:12, 1 user, load average: 0.08, 0.03, 0.00
  56. USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
  57. daygeek pts/0 192.168.1.6 20:42 29:41 0.05s 0.05s -bash
  58. clush> quit

如果要在一组节点上运行该命令,请使用以下格式:

  1. $ clush -w @dev uptime
  2. or
  3. $ clush -g dev uptime
  4. or
  5. $ clush --group=dev uptime
  6. 192.168.1.9: 21:10:10 up 3:09, 1 user, load average: 0.09, 0.03, 0.01
  7. 192.168.1.4: 09:18:12 up 3:18, 3 users, load average: 0.01, 0.02, 0.05

如果要在多个节点组上运行该命令,请使用以下格式:

  1. $ clush -w @dev,@uat uptime
  2. or
  3. $ clush -g dev,uat uptime
  4. or
  5. $ clush --group=dev,uat uptime
  6. 192.168.1.7: 07:57:19 up 59 min, 1 user, load average: 0.08, 0.03, 0.00
  7. 192.168.1.9: 20:27:20 up 1:00, 1 user, load average: 0.00, 0.00, 0.00
  8. 192.168.1.5: 08:57:21 up 59 min, 1 user, load average: 0.00, 0.01, 0.05

clustershell 允许我们将文件复制到远程计算机。将本地文件或目录复制到同一个远程节点:

  1. $ clush -w 192.168.1.[4,9] --copy /home/daygeek/passwd-up.sh

我们可以通过运行以下命令来验证它:

  1. $ clush -w 192.168.1.[4,9] ls -lh /home/daygeek/passwd-up.sh
  2. 192.168.1.4: -rwxr-xr-x. 1 daygeek daygeek 159 Mar 4 09:00 /home/daygeek/passwd-up.sh
  3. 192.168.1.9: -rwxr-xr-x 1 daygeek daygeek 159 Mar 4 20:52 /home/daygeek/passwd-up.sh

将本地文件或目录复制到不同位置的远程节点:

  1. $ clush -g uat --copy /home/daygeek/passwd-up.sh --dest /tmp

我们可以通过运行以下命令来验证它:

  1. $ clush --group=uat ls -lh /tmp/passwd-up.sh
  2. 192.168.1.7: -rwxr-xr-x. 1 daygeek daygeek 159 Mar 6 07:44 /tmp/passwd-up.sh

将文件或目录从远程节点复制到本地系统:

  1. $ clush -w 192.168.1.7 --rcopy /home/daygeek/Documents/magi.txt --dest /tmp

我们可以通过运行以下命令来验证它:

  1. $ ls -lh /tmp/magi.txt.192.168.1.7
  2. -rw-r--r-- 1 daygeek daygeek 35 Mar 6 20:24 /tmp/magi.txt.192.168.1.7

via: https://www.2daygeek.com/clustershell-clush-run-commands-on-cluster-nodes-remote-system-in-parallel-linux/

作者:Magesh Maruthamuthu 选题:lujun9972 译者:wxy 校对:wxy

本文由 LCTT 原创编译,Linux中国 荣誉推出

转自 https://linux.cn/article-11147-1.html

分享到:更多 ()