小编Sim*_*een的帖子

让 ssh 真正安静

我写了一个 nagios 脚本的一半,我对 SSH 感到烦恼。

根据手册页:

-q       Quiet mode.  Causes all warning and diagnostic messages to be
         suppressed.
Run Code Online (Sandbox Code Playgroud)

然而,如果我启用了 quiet 标志然后传递了一个无效的端口,我仍然会收到一个错误:

$ ssh user@localhost -q -p test
Bad port 'test'
Run Code Online (Sandbox Code Playgroud)

这是一个问题,因为这将使该消息成为第一行,而这正是 Nagios 抓取的内容。!= 0从 ssh 获取退出代码后,我需要输出类似“警告|SSH 错误”的内容,但我可以输出的第一行将是第 2 行。

我怎样才能让 SSH 真正安静下来?

注意:我不确定是在 serverfault、超级用户还是 stackoverflow 上发布这个问题。我选择了 serverfault,因为用户群可能对 cli SSH 和 cli 脚本解决方法最有经验。

ssh bash nagios

19
推荐指数
1
解决办法
5万
查看次数

在世界的另一端开设分公司

在这个问题上切入正题,因为我正在寻求尽可能多样化的解决方案,所以不想过多地影响任何意见。

  • 客户是一家英国公司。
  • 组织是 95% 带有 AD 的 Windows
  • 他们的 IT 政策是尽可能少地保留“本地”基础设施,因此他们有一条 1Gbps 的线路连接到容纳所有服务器基础设施的数据中心。
  • 无法证明高速链接合理的英国分支机构运行本地服务器和 Windows DFS,以便通过同步快速访问文件 - 工作正常。
  • 该公司已决定在澳大利亚悉尼开设办事处。
  • 目前,他们在这个办公室有 20 人,还有 1 个人在全国“存在”。
  • 他们在访问英国的延迟和带宽方面都存在问题。他们办公室的典型测试在天气好的时候通常不超过 4Mbps 和 320ms。
  • 高延迟阻碍了终端服务的使用。
  • 他们需要访问许多与英国员工相同的数据。

我们已经有了很多想法,但我想知道 ServerFault 的用户将如何解决这个问题。随意问的问题 :)

windows replication wide-area-network network-share infrastructure

16
推荐指数
1
解决办法
579
查看次数

如何直接通过 TCP 公开 UNIX 域套接字

我想要一个 UNIX 域套接字,例如 /var/program/program.cmd,通过 TCP 公开,比如说在端口 12345 上。我也希望它在后台全时运行。

做到这一点的最佳方法是什么?如果相关,则系统正在运行 Ubuntu 12.04.2。

同样使用建议的解决方案,它是否会在删除和重新创建域套接字后继续存在?

编辑

以下是 init 脚本形式的已接受答案的结果:https : //github.com/Wirehive/haproxy-remote

linux ubuntu tcp socket

16
推荐指数
1
解决办法
2万
查看次数

为数百个 VM Web 服务器选择 SAN 技术

问题

我们在现有平台上的性能存在问题,所以我正在转向蜂巢思维,以寻求对此的第二意见。到目前为止,性能问题与 IOPS 而不是吞吐量有关。

情景

由 16 台主机组成的刀片中心,每台主机具有 64GB 的 RAM。(它是带有 M610 的 Dell M1000e,但这可能无关紧要)500 台虚拟机、所有 Web 服务器(或相关的 Web 技术,例如 MySQL、负载平衡器等),大约 90% 是 Linux,其余为 Windows。管理程序是 VMWare vSphere。我们需要提供主机HA,所以本地存储用完了。因此,主机只需一张 SD 卡即可启动。

一点背景思考

目前,我们有多达 6 台主机(刀片中心将在一年内以目前的增长达到满负荷),并且我们正在将 iSCSI 运行到带有 MD1220 的 Dell MD3220i 以进行扩展。

我们考虑过的可能选项,以及随之而来的即时想法:

  • 将 VM 分布在 NFS 数据存储中,并运行 NFS 存储以满足最多给定数量的 VM 的性能要求。NFS 的扩展性似乎更便宜,并且比块级存储更抽象,因此我们可以根据需要移动它。
  • 添加更多 MD3220i 控制器/目标。我们担心这样做可能会对 VMWare 处理大量目标的方式产生负面影响。
  • 将所有磁盘从 Nearline SAS 交换到 SSD。这应该完全解决 IOPS 问题,但有明显的副作用,即削减我们的存储容量。而且它仍然非常昂贵。
  • vSphere 5 有一个存储设备。我们还没有研究这么多,但它一定很好用吗?

问题

你会在所有这些之下运行什么样的存储?它不需要扩展到另一个刀片中心,它只需要为所有这些 VM 提供相对良好的性能。

我不是在寻找“购买 SAN x 因为它是最好的”的答案。我正在寻找关于各种 SAN 技术(iSCSI、FC、FCoE、InfiniBand、NFS 等)、不同类型的存储(SATA、SAS、SSD)以及处理 100 多个 VM …

virtualization storage storage-area-network nfs vmware-vsphere

15
推荐指数
3
解决办法
1359
查看次数

Puppet 或 Chef 是否适合在多租户环境中管理非常基本的服务器配置?

这与多租户环境有关,例如小型托管公司。

Puppet(或类似)是否适合处理基本但关键的质量变化?例如:

  • 更新 DNS 解析器 (resolv.conf)
  • 设置 SSH 密钥
  • 更新 NTP 配置
  • 配置 snmpd
  • 部署监控脚本,例如 SNMP Perl 扩展或 Nagios 脚本

我担心的是安全性和侵入性:

  1. 我不希望任何服务器能够看到它不应该看到的任何配置
  2. 我担心 Puppet master 可能容易受到受感染服务器的攻击
  3. 我不希望 Puppet 进行任何它不应该进行的更改,或者恢复在服务器上所做的任何手动更改。

我应该说明一下,我从未在生产中使用过 Puppet,只是在测试实验室中快速玩过,所以我可能会以错误的方式思考这个问题!

puppet

9
推荐指数
2
解决办法
1415
查看次数

选择公交供应商

我的组织处于这样一个位置,我们为我们的主要数据中心提供商的单宿主 IP 传输支付了相当高的费用。我们现在处于准备开始考虑与公交提供商建立直接关系的位置。

这个问题在这里关于这个问题去触摸略有下降,但它不是很全面。例如,公认的答案指出 Cogent 和 Hurricane Electric 被认为是廉价供应商,而 Level(3)、AT&T、Telia 被认为更好。它没有做的是准确解释为什么一个提供商可能比另一个更好。

我非常熟悉 BGP、多宿主以及对等互连和传输的概念,但是我不了解为什么其中一些提供商会比其他提供商更好。

需要明确的是,我不是要求提供者的建议,也不是为此提及的任何名称。我非常乐意去做我自己的“购物”研究。我只是有一个问题,我需要将苹果与苹果进行比较,我不知道要寻找什么!

如果它有所作为,我们的组织就在英国。

networking bgp peering

8
推荐指数
1
解决办法
471
查看次数

在 VLAN 用完时构建网络

这是一个完全假设的问题,我现在不在这种情况下。

如果您运行多租户网络并且拥有超过 4096 个客户,您的 VLAN 拓扑和路由会发生什么变化?

您是否必须在最高级别开始将您的网络“分区”到新的路由器/交换机树中,然后重新开始使用 VLAN 编号?

routing switch architecture vlan multi-tenancy

7
推荐指数
2
解决办法
1941
查看次数

远程检查只读文件系统

我需要定期远程检查 Linux 文件系统是否安装在许多服务器上只读。在这种情况下,我可以使用的唯一工具是常用的 CLI 脚本语言(BASH/Perl/Python)、SSH 和 SNMP。

到目前为止,我的想法是:

  • 共享 SSH 密钥并远程执行挂载命令,grep/awk-ing 用于给定挂载点上的 RO 标志。
  • 通过 SNMP 检查,虽然我不确定此信息是否可用或是否容易。
  • 尝试跨文件 SCP 或远程触摸文件。

SNMP 方法是我能想到的最好/最干净的方法,但是我不知道如何执行此操作,因为 CLI SNMP 似乎是一场噩梦,特别是如果我需要通过决策过程来查找基于给定的挂载点。

理想情况下,我想仅使用 BASH(包括 sed/awk/grep 等)和 SNMP 来解决这个问题,但需要一些关于从哪里开始的指导!已经在所有相关服务器上为 v2 安装和配置了 snmpd。

此脚本的最终用途将作为 Nagios 命令。

非常感谢您的帮助!

注意 我们已经有 cacti/nagios 设置监控 100 台服务器,我在最初发布时忘记提及这一点!

linux bash nagios snmp

5
推荐指数
1
解决办法
5307
查看次数

不同 Linux 发行版的速度 - 为什么会有差异?

我有一个多线程软件,它在最新的 ubuntu 服务器、redhat Enterprise 和 CentOS 下以不同的速度运行——它们都安装在完全相同的服务器上以进行比较。

Ubuntu 服务器最慢,其次是 CentOS,然后是 Redhat Enterprise。差异为10-20%。

centOS 和 redhat 之间的区别可以通过更新的 gcc 版本来解释,但至少在最后两个操作系统中使用了相同版本的 gcc。

我在 ubuntu 运行中看到的是,尽管该程序使用了 13 个内核,但“top”报告的 CPU 总数约为 1220%,而在 redhat(和 centOS)上为 1300%

有人有解释吗?我更喜欢使用 Ubuntu(它是免费的),但我无法承受减速。我尝试了其他多线程基准测试,这似乎也表明 ubuntu 有点慢——在同一个下载的可执行文件上,而不是在本地编译。

ubuntu performance redhat centos

5
推荐指数
1
解决办法
750
查看次数

运行 Veeam 备份时来自 VMWare 的 CBT Soap 故障

我们经常在备份作业中看到这样的错误:

10/05/2013 12:21:18 :: Cannot use CBT: Soap fault. Error caused by file /vmfs/volumes/781f6afc-ea228458/VDED-CIT-010(Exchange EX01)/VDED-CIT-010(Exchange EX01).vmdkDetail: '', endpoint: ''
Run Code Online (Sandbox Code Playgroud)

在备份的 235 个虚拟机中运行了 11 个的上一个作业中将此作为警告。

作为一个完整的例子,这里是一个 VM 的统计输出:

09/05/2013 22:02:14 :: Queued for processing at 09/05/2013 22:02:14
12/05/2013 02:30:00 :: Required backup infrastructure resources have been assigned
12/05/2013 02:30:02 :: VM processing started at 12/05/2013 02:30:02
12/05/2013 02:30:02 :: VM size: 20.0 GB (3.9 GB used)
12/05/2013 02:30:02 :: Using source proxy 10.24.0.11 [nbd]
12/05/2013 02:30:36 :: Creating VM snapshot
12/05/2013 …
Run Code Online (Sandbox Code Playgroud)

backup vmware-esxi vmware-vsphere veeam

5
推荐指数
1
解决办法
2万
查看次数