小编Sim*_*een的帖子

让 ssh 真正安静

我写了一个 nagios 脚本的一半，我对 SSH 感到烦恼。

根据手册页：

-q       Quiet mode.  Causes all warning and diagnostic messages to be
         suppressed.

Run Code Online (Sandbox Code Playgroud)

然而，如果我启用了 quiet 标志然后传递了一个无效的端口，我仍然会收到一个错误：

$ ssh user@localhost -q -p test
Bad port 'test'

Run Code Online (Sandbox Code Playgroud)

这是一个问题，因为这将使该消息成为第一行，而这正是 Nagios 抓取的内容。!= 0从 ssh 获取退出代码后，我需要输出类似“警告|SSH 错误”的内容，但我可以输出的第一行将是第 2 行。

我怎样才能让 SSH 真正安静下来？

注意：我不确定是在 serverfault、超级用户还是 stackoverflow 上发布这个问题。我选择了 serverfault，因为用户群可能对 cli SSH 和 cli 脚本解决方法最有经验。

ssh bash nagios

Sim*_*een

lucky-day

19
推荐指数

1
解决办法

5万
查看次数

在世界的另一端开设分公司

在这个问题上切入正题，因为我正在寻求尽可能多样化的解决方案，所以不想过多地影响任何意见。

客户是一家英国公司。
组织是 95% 带有 AD 的 Windows
他们的 IT 政策是尽可能少地保留“本地”基础设施，因此他们有一条 1Gbps 的线路连接到容纳所有服务器基础设施的数据中心。
无法证明高速链接合理的英国分支机构运行本地服务器和 Windows DFS，以便通过同步快速访问文件 - 工作正常。
该公司已决定在澳大利亚悉尼开设办事处。
目前，他们在这个办公室有 20 人，还有 1 个人在全国“存在”。
他们在访问英国的延迟和带宽方面都存在问题。他们办公室的典型测试在天气好的时候通常不超过 4Mbps 和 320ms。
高延迟阻碍了终端服务的使用。
他们需要访问许多与英国员工相同的数据。

我们已经有了很多想法，但我想知道 ServerFault 的用户将如何解决这个问题。随意问的问题：）

windows replication wide-area-network network-share infrastructure

Sim*_*een

lucky-day

16
推荐指数

1
解决办法

579
查看次数

如何直接通过 TCP 公开 UNIX 域套接字

我想要一个 UNIX 域套接字，例如 /var/program/program.cmd，通过 TCP 公开，比如说在端口 12345 上。我也希望它在后台全时运行。

做到这一点的最佳方法是什么？如果相关，则系统正在运行 Ubuntu 12.04.2。

同样使用建议的解决方案，它是否会在删除和重新创建域套接字后继续存在？

编辑

以下是 init 脚本形式的已接受答案的结果：https : //github.com/Wirehive/haproxy-remote

linux ubuntu tcp socket

Sim*_*een

2013 06-24

16
推荐指数

1
解决办法

2万
查看次数

为数百个 VM Web 服务器选择 SAN 技术

问题

我们在现有平台上的性能存在问题，所以我正在转向蜂巢思维，以寻求对此的第二意见。到目前为止，性能问题与 IOPS 而不是吞吐量有关。

情景

由 16 台主机组成的刀片中心，每台主机具有 64GB 的 RAM。（它是带有 M610 的 Dell M1000e，但这可能无关紧要）500 台虚拟机、所有 Web 服务器（或相关的 Web 技术，例如 MySQL、负载平衡器等），大约 90% 是 Linux，其余为 Windows。管理程序是 VMWare vSphere。我们需要提供主机HA，所以本地存储用完了。因此，主机只需一张 SD 卡即可启动。

一点背景思考

目前，我们有多达 6 台主机（刀片中心将在一年内以目前的增长达到满负荷），并且我们正在将 iSCSI 运行到带有 MD1220 的 Dell MD3220i 以进行扩展。

我们考虑过的可能选项，以及随之而来的即时想法：

将 VM 分布在 NFS 数据存储中，并运行 NFS 存储以满足最多给定数量的 VM 的性能要求。NFS 的扩展性似乎更便宜，并且比块级存储更抽象，因此我们可以根据需要移动它。
添加更多 MD3220i 控制器/目标。我们担心这样做可能会对 VMWare 处理大量目标的方式产生负面影响。
将所有磁盘从 Nearline SAS 交换到 SSD。这应该完全解决 IOPS 问题，但有明显的副作用，即削减我们的存储容量。而且它仍然非常昂贵。
vSphere 5 有一个存储设备。我们还没有研究这么多，但它一定很好用吗？

问题

你会在所有这些之下运行什么样的存储？它不需要扩展到另一个刀片中心，它只需要为所有这些 VM 提供相对良好的性能。

我不是在寻找“购买 SAN x 因为它是最好的”的答案。我正在寻找关于各种 SAN 技术（iSCSI、FC、FCoE、InfiniBand、NFS 等）、不同类型的存储（SATA、SAS、SSD）以及处理 100 多个 VM …

virtualization storage storage-area-network nfs vmware-vsphere

Sim*_*een

2012 03-06

15
推荐指数

3
解决办法

1359
查看次数

Puppet 或 Chef 是否适合在多租户环境中管理非常基本的服务器配置？

这与多租户环境有关，例如小型托管公司。

Puppet（或类似）是否适合处理基本但关键的质量变化？例如：

更新 DNS 解析器 (resolv.conf)
设置 SSH 密钥
更新 NTP 配置
配置 snmpd
部署监控脚本，例如 SNMP Perl 扩展或 Nagios 脚本

我担心的是安全性和侵入性：

我不希望任何服务器能够看到它不应该看到的任何配置
我担心 Puppet master 可能容易受到受感染服务器的攻击
我不希望 Puppet 进行任何它不应该进行的更改，或者恢复在服务器上所做的任何手动更改。

我应该说明一下，我从未在生产中使用过 Puppet，只是在测试实验室中快速玩过，所以我可能会以错误的方式思考这个问题！

puppet

Sim*_*een

lucky-day

9
推荐指数

2
解决办法

1415
查看次数

选择公交供应商

我的组织处于这样一个位置，我们为我们的主要数据中心提供商的单宿主 IP 传输支付了相当高的费用。我们现在处于准备开始考虑与公交提供商建立直接关系的位置。

这个问题在这里关于这个问题去触摸略有下降，但它不是很全面。例如，公认的答案指出 Cogent 和 Hurricane Electric 被认为是廉价供应商，而 Level(3)、AT&T、Telia 被认为更好。它没有做的是准确解释为什么一个提供商可能比另一个更好。

我非常熟悉 BGP、多宿主以及对等互连和传输的概念，但是我不了解为什么其中一些提供商会比其他提供商更好。

需要明确的是，我不是要求提供者的建议，也不是为此提及的任何名称。我非常乐意去做我自己的“购物”研究。我只是有一个问题，我需要将苹果与苹果进行比较，我不知道要寻找什么！

如果它有所作为，我们的组织就在英国。

networking bgp peering

Sim*_*een

2017 04-13

8
推荐指数

1
解决办法

471
查看次数

在 VLAN 用完时构建网络

这是一个完全假设的问题，我现在不在这种情况下。

如果您运行多租户网络并且拥有超过 4096 个客户，您的 VLAN 拓扑和路由会发生什么变化？

您是否必须在最高级别开始将您的网络“分区”到新的路由器/交换机树中，然后重新开始使用 VLAN 编号？

routing switch architecture vlan multi-tenancy

Sim*_*een

lucky-day

7
推荐指数

2
解决办法

1941
查看次数

远程检查只读文件系统

我需要定期远程检查 Linux 文件系统是否安装在许多服务器上只读。在这种情况下，我可以使用的唯一工具是常用的 CLI 脚本语言（BASH/Perl/Python）、SSH 和 SNMP。

到目前为止，我的想法是：

共享 SSH 密钥并远程执行挂载命令，grep/awk-ing 用于给定挂载点上的 RO 标志。
通过 SNMP 检查，虽然我不确定此信息是否可用或是否容易。
尝试跨文件 SCP 或远程触摸文件。

SNMP 方法是我能想到的最好/最干净的方法，但是我不知道如何执行此操作，因为 CLI SNMP 似乎是一场噩梦，特别是如果我需要通过决策过程来查找基于给定的挂载点。

理想情况下，我想仅使用 BASH（包括 sed/awk/grep 等）和 SNMP 来解决这个问题，但需要一些关于从哪里开始的指导！已经在所有相关服务器上为 v2 安装和配置了 snmpd。

此脚本的最终用途将作为 Nagios 命令。

非常感谢您的帮助！

注意我们已经有 cacti/nagios 设置监控 100 台服务器，我在最初发布时忘记提及这一点！

linux bash nagios snmp

Sim*_*een

2012 01-07

5
推荐指数

1
解决办法

5307
查看次数

不同 Linux 发行版的速度 - 为什么会有差异？

我有一个多线程软件，它在最新的 ubuntu 服务器、redhat Enterprise 和 CentOS 下以不同的速度运行——它们都安装在完全相同的服务器上以进行比较。

Ubuntu 服务器最慢，其次是 CentOS，然后是 Redhat Enterprise。差异为10-20%。

centOS 和 redhat 之间的区别可以通过更新的 gcc 版本来解释，但至少在最后两个操作系统中使用了相同版本的 gcc。

我在 ubuntu 运行中看到的是，尽管该程序使用了 13 个内核，但“top”报告的 CPU 总数约为 1220%，而在 redhat（和 centOS）上为 1300%

有人有解释吗？我更喜欢使用 Ubuntu（它是免费的），但我无法承受减速。我尝试了其他多线程基准测试，这似乎也表明 ubuntu 有点慢——在同一个下载的可执行文件上，而不是在本地编译。

ubuntu performance redhat centos

eya*_*yal

2012 03-12

5
推荐指数

1
解决办法

750
查看次数

运行 Veeam 备份时来自 VMWare 的 CBT Soap 故障

我们经常在备份作业中看到这样的错误：

10/05/2013 12:21:18 :: Cannot use CBT: Soap fault. Error caused by file /vmfs/volumes/781f6afc-ea228458/VDED-CIT-010(Exchange EX01)/VDED-CIT-010(Exchange EX01).vmdkDetail: '', endpoint: ''

Run Code Online (Sandbox Code Playgroud)

在备份的 235 个虚拟机中运行了 11 个的上一个作业中将此作为警告。

作为一个完整的例子，这里是一个 VM 的统计输出：

09/05/2013 22:02:14 :: Queued for processing at 09/05/2013 22:02:14
12/05/2013 02:30:00 :: Required backup infrastructure resources have been assigned
12/05/2013 02:30:02 :: VM processing started at 12/05/2013 02:30:02
12/05/2013 02:30:02 :: VM size: 20.0 GB (3.9 GB used)
12/05/2013 02:30:02 :: Using source proxy 10.24.0.11 [nbd]
12/05/2013 02:30:36 :: Creating VM snapshot
12/05/2013 …

Run Code Online (Sandbox Code Playgroud)

backup vmware-esxi vmware-vsphere veeam

Sim*_*een

lucky-day

5
推荐指数

1
解决办法

2万
查看次数